왜 머신러닝이 AI의 두뇌에 해당하는 핵심요소일까요? 머신러닝이라는 용어 자체를 살펴보면, 우선 ‘머신 (machine)’ 은 컴퓨터를 의미합니다. ‘러닝 (learning)’ 은 ‘학습’ 으로 해석할 수 있지만 그 의미를 해석하기가 쉽지 않습니다. 사실 여기서 ‘학습’ 이라는 말은 ‘통계적 학습
(Statistical Learning)’ 또는 ‘귀납적 학습
(Inductive Learning)’ 의 줄임말로 이해해야 합니다. 통계적 학습이란 데이터 속에 존재하는 패턴을 통해 새로운 지식을 학습하는 것을 의미합니다.
예를 들어, 삼각형의 세 내각의 합은 몇 도인지 새롭게 배우려 한다고 합시다. 우선 첫번째 학습 방식은 우리가 중학교에서 배운대로 기초적인 기하학 원리를 이용한 증명이 있습니다 (증명방식은 하단 이미지 참조). 이 증명 과정을 통해 데이터에 의존하지 않고 순수하게 논리에만 의존해 삼각형의 세 내각의 합은 180도라는 것을 학습할 수 있고, 동시에 모든 삼각형에 적용 가능한 법칙이라는 것도 알 수 있습니다. 이와 같이 논리에 의존한 학습방식을 연역적 학습 (Deductive Learning) 이라고 합니다.

두번째 방식은 많은 삼각형들의 세 내각을 실제로 측정하여 결과를 확인해 보는 방법입니다. 이론상 무한대로 존재하는 삼각형 중 약 100개 삼각형을 무작위로 추출해 내각을 재어 보면 내각의 합은 모두 180도일 것입니다. 무한대의 모수 중 100개의 표본만을 검증하였으므로 표본의 비율이 너무 작아 표본에 포함되지 않은 나머지 삼각형에 같은 법칙이 적용될 것이라고 확신하기는 어렵습니다. 이제 표본의 수를 100만개로 늘려서 내각을 측정하면 100만개 모두 180도의 결과를 보일 것이고, 100개의 표본보다는 발견의 신뢰도가 크게 높아질 것이고 모든 삼각형의 내각의 합이 180도라는 발견을 사실로서 학습하게 됩니다. 이처럼 모수로부터 추출한 표본들 사이에 존재하는 패턴으로 전체 모수에도 적용 가능한 법칙을 학습하는 것을 귀납적 학습
(Inductive Learning) 이라고 합니다. 표본을 추출하고, 표본 내 패턴을 수학적으로 찾아내고, 표본 내 법칙의 일반화 정도를 측정하는 것이 바로 통계학이므로 통계적 학습
(Statistical Learning) 이라고도 합니다.

머신러닝은 머신, 즉, 컴퓨터가 수행하는 통계적 학습으로서 한 문장으로 정리하면 컴퓨터가 표본 데이터 속에 존재하는 전체 모수로 일반화 가능한 패턴을 찾아 스스로 학습하는 과정입니다. 사람은 연역적 학습과 귀납적 학습을 통해 새로운 것을 학습합니다. 컴퓨터는 귀납적 학습을 통해서만 새로운 것을 학습합니다. 단, 컴퓨터는 인간에 비해 귀납적 학습 능력이 압도적으로 뛰어나기 때문에 일부 영역에 대해서는 인간보다 뛰어난 학습능력과 지능을 보이기도 합니다 (예 : 알파고). 삼각형 표본 100만개의 내각을 측정하는 일은 인간에게는 몇 달은 족히 걸릴 엄청나게 힘든 일이지만 컴퓨터에게는 1시간도 안 걸릴 일입니다. 왜 그럴까요? 귀납적 학습 혹은 통계적 학습의 본질은 수학과 통계학이고 이는 결국 연산이기 때문입니다. 당연한 이야기지만 컴퓨터는 대용량의 데이터에 대한 반복 연산에 있어 인간보다 훨씬 뛰어납니다. 애초에 Computer 란 Compute (연산하다, 계산하다) + er 로서 연산기라는 뜻입니다.
수학과 통계학에 기반한 통계적 학습의 역사는 컴퓨터의 역사보다 몇 백년은 더 오래 되었습니다. 통계적 학습을 수행하고 연구하던 이들이 컴퓨터가 등장한 이후 그 연산능력의 가능성을 인지하고 컴퓨터가 통계적 학습을 수행한다면 인간 지능을 능가하거나 그에 버금가는 인공지능을 만들 수 있을 것이라 생각했고, 이들에 의해 1950년대에 만들어진 용어가 바로 Machine + (Statistical) Learning, 즉 머신러닝입니다.
또한, 데이터로부터 패턴을 도출해 이를 모델화하는 통계적 학습의 방법론을 컴퓨터가 수행할 수 있는 방법론, 즉, 알고리즘으로 변환한 것을 머신러닝 알고리즘이라고 합니다. 어떤 문제이든 그 성격에 따라 선택할 수 있는 방법론의 종류가 다양하듯이 머신러닝 알고리즘 역시 그 종류가 다양합니다. 그리고 그 중 하나가 인간의 신경망을 모사한 인공 신경망 (Artificial Neural Network)입니다. 인공 신경망은 복수의 계층 혹은 레이어로 구성되는데 이 레이어의 수가 많고 레이어를 구성하는 노드들이 복잡한 구성을 이루고 있는 다중 인공 신경망을 지칭해 레이어의 수가 많아 인풋에서 아웃풋까지 이르는 경로가 길고 깊다는 의미로 딥 러닝
(Deep Learning) 이라고 합니다.
