개요
2016년 5월, 지금으로부터 3년 전에 이세돌 9단과 알파고의 바둑 대결이 있었습니다. 대국은 알파고의 승리로 끝났고, 이후 인공지능 분야에 많은 관심이 쏠리게 되었습니다. 이후 인간의 영역에 대한 인공지능의 도전이라고 할 정도로 이미지 분석, 챗봇, 번역, 자연어 처리 등에서 국내외에서 폭발적인 관심과 가시적인 성과가 있었습니다. 특히 주목받는 딥러닝 기술로 많은 분야에서 인공지능의 성능이 개선되었습니다. 다음은 '딥러닝'의 관심도 증가를 확인할 수 있는 키워드의 구글 트렌드 결과입니다.
이 글에서는 애매모호한 인공지능, 머신러닝, 딥러닝 등의 단어를 확실하게 정의하고, 설명할 것입니다.
1. 인공 지능이란?
인공 지능(Artificial Intelligence)은 "The science of training machines to perform human tasks"로 정의된다.
직역하면, 기계를 훈련시켜 사람의 업무를 수행하도록 하는 과학이다.
인공지능의 개념은 1950년대에 기계가 어떻게 하면 스스로 문제를 해결할 수 있을까라는 주제로 시작되었다. 인간의 두뇌는 매 순간 우리 주변의 모든 요소들을 계산하고, 분석하고, 처리해서 명령을 내린다. 인공지능도 같은 행동을 할 수 있게 하는 것이 목표이다. 이런 일반적인, 인간과 같이 지능, 사고력 등을 지닌 채 인간처럼 행동하는 인공지능을 일반 AI(General AI), 이미지 처리나 음성 인식 등 특정 작업을 인간 혹은 그 이상의 정확도로 해낼 수 있는 인공지능을 좁은 AI(Narrow AI)라고 말합니다.
위 그래프는 이미지 인식 작업의 오차율을 설명하고 있습니다. 이미지 인식이라는 특정 분야이긴 하지만 딥러닝 기술을 활용한 사람보다 높은 수준의 정확도를 보이는 프로그램이 있습니다. 뿐만 아니라 인공지능 기술은 최근 주목받고 있는 다른 주제인 빅데이터 활용과 분석에도 많이 사용됩니다.
인공지능은 포괄적으로 기계가 사람의 업무를 수행할 수 있도록 훈련받은 기계를 의미합니다.
2. 머신러닝이란?
인공지능이 사람의 업무를 수행하는 기계 자체를 말한다면 머신러닝은 인공지능을 구현하고, 인공지능에 접근하는 구체적인 방법과 알고리즘을 의미합니다. 널리 알려진 머신러닝의 정의로는 Tom Mitchell의
"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E"
" 만약 컴퓨터 프로그램이 특정한 태스크 T를 수행할 때 성능 P 만큼 개선되는 경험 E를 보이면 그 컴퓨터 프로그램은 태스크와 성능 P에 대해 경험 E를 학습했다고 할 수 있다."
라는 정의가 있습니다. 예를 들어 컴퓨터에게 스팸 메일을 거르는 업무를 학습시키기 위해서 T, P, E는 각각
T: 스팸 메일을 분류하는 업무 자체
P: 정확하계 스팸 메일을 구분할 확률(정확도)
E: 스팸 메일 데이터셋
입니다. 머신러닝은 데이터셋이 스팸/일반 또는 필기체 데이터와 같이 분류되어 있는가(정답이 정해져 있는가)로 크게 지도 학습과 비지도 학습으로 나뉘게 됩니다. 또한 최근 들어 주목을 받게 된 보상을 최대화하도록 에이전트를 학습시키는 강화 학습까지 총 3 분야로 분류합니다.
2.1 지도 학습(Supervised Learning)
지도학습은 학습 중에 피드백을 바로바로 받을 수 있고, 정답이 주어진 자료를 바탕으로 다른 자료를 예측하는 문제에 사용됩니다.
지도 학습은 다시 크게 분류와 회귀 문제로 분류됩니다.
2.1.1 분류 분석(Classification)
분류 분석의 예시는 대표적으로
-
스팸 메일 차단기(스팸/정상 분류)
-
암 예측 시스템(양성/악성 분류)
-
손글씨 예측(어떤 글자인지 분류)
과 같이 분류하는 문제들이 있습니다. 잘 학습된 분류 분석 인공지능은 높은 정확성으로 데이터를 분류하는 인공지능입니다.
2.1.2 회귀 분석(Regression Analysis)
회귀분석의 예시는 대표적으로
-
위치, 면적 등의 정보로 집의 가격 예측하기
-
특정 주식의 주가 예측하기
-
기후 분석 및 예측하기
등이 있습니다. 회귀분석의 정의는
하나의 종속변수와 하나 이상의 독립변수 사이의 관계를 분석해 모형을 구한뒤 적합도를 측정해 내는 분석입니다.
위치, 면적 등의 정보로 집의 가격 예측하는 예시에서 각 단어는 다음을 나타냅니다.
- 종속변수: 위치, 면적, 층, 인근 범죄율, 인근 시설(공원, 병원 등)과 같이 목적변수에 영향을 주는 요소
- 목적 변수: 종속 변수를 통해 관계식을 구해서 예측하고 싶은 값, 집값
- 적합도: 예측값과 훈련 데이터셋 간이 정규성과 등분 산성 가정을 만족하는지에 대한 검토 과정
위 분석모델에서 X의 값이 2인 새로운 데이터가 들어오면 y의 값을 5로 예측할 것입니다.
2.2 비지도 학습(Unsepervised Learning)
비지도 학습은 데이터에서 인간이 발견하지 못한 특징을 찾는 것이 가장 큰 목표입니다. 데이터 마이닝이라는 단어로도 불립니다. 비지도 학습의 데이터에는 지도 학습과 다르게 목푯값이 정해져 있지 않습니다.
2.2.1 군집화(Cluster Analysis)
군집화 분석은 데이터에서 중심점을 찾거나 여러 군집으로 나누어서 패턴을 찾는 과정입니다.
군집화의 대표적인 예시는 구글 뉴스가 있습니다. 구글 뉴스에서는 다음과 같이 뉴스 기사들을 주제에 따라 자동으로 분류해서 묶어서 하나의 coverage로 보여줍니다.
2.3 강화 학습(Reinforcement Learning)
강화 학습은 에이전트(학습 대상)에게 특정 행동을 했을 때 보상을 주면서 에이전트가 최대한의 보상을 받도록 학습하는 과정을 의미합니다.
강화 학습은 반복적으로 에이전트(학습 대상)가 특정 환경을 탐색하면서 현재 상태를 인식하고 학습된 정책에 따라 특정 행동을 하고, 행동의 결과에 따라 양수 또는 음수의 보상을 받으면서 진행됩니다. 반복마다 정책은 보상을 최대화하는 방법으로 변형됩니다. 강화 학습의 학습과정은 인간, 특히 어린아이의 학습과정과 유사하게 진행된다고 개인적으로 생각합니다.
강화 학습의 대표적인 예시로는 알파고 제로가 있습니다.
이세돌 9단을 상대로 승리를 쟁취했던 알파고 리는 딥러닝을 통해 인간들의 대국 정보를 학습하고 그것을 바탕으로 바둑을 배운 반면, 알파고 제로는 인간의 기보 없이 강화 학습을 통해 스스로 학습을 해서 3일 만에 알파고 리를 100:0으로 압도하고, 40일 만에 알파고 마스터를 상대로 승리를 거머쥐게 되었습니다.
또한 다른 보드게임에 적용할 수 있도록 알포고 제로를 범용적으로 제작한 알파 제로의 경우 4시간 만에 쇼기(일본식 장기) 최고 인공지능 엘모를 꺾었고, 체스 또한 4시간 만에 가장 강했던 체스 인공지능 스톡 피시를 제압하면서 정복하였습니다.
3. 딥러닝(Deep Learning)
3.1 인공신경망(Artificial Neural Network)
인공신경망은 인간의 뇌가 패턴을 인식하는 방법을 묘사한 알고리즘입니다. 인공신경망을 이용하면 각종 분류와 군집화를 할 수 있습니다. 인공 신경망은 여러 계층과 각 계층을 이루는 노드들로 이루어져 있습니다.
인공 신경망이 학습을 하는 과정을 간략히 설명하자면, 한 노드의 값이 다음 노드로 전달될 때 어떠한 가중치가 곱해지는데, 출력층의 값과 실제 값과의 차이를 통해 간선의 가중치를 적절하게 조절하면서 예측 값과 실제 값 간의 잔차를 최소화하면서 학습을 합니다. 이를 역전파 훈련이라고 합니다.
3.2 딥러닝(Deep Learning)
인공신경망에서는 은닉층의 개수가 1개뿐이지만, 딥러닝에서는 은닉층의 개수를 2개 이상으로 늘려서 정확도를 상승시킬 수 있습니다. 사실 딥러닝의 개념은 2011년에 생겼지만, 최근 2~3년간 주목받기 시작한 이유는 알파고의 등장과 딥러닝의 발전 가능성 덕분입니다.
기존 머신러닝 알고리즘들은 데이터가 무지막지하게 많다고 해서 항상 성능이 개선되는 것은 아니였습니다. 어떤 지점을 지나면 정확도 상승폭이 눈에 띄게 감소하였죠. 하지만 딥러닝은 특히 수천 페타, 엑사 바이트의 빅데이터에서 기존 머신러닝에 비해 뛰어난 성능을 보일 것으로 예상됩니다.
위로 스크롤해서 이미지 인식률 차트를 살펴보면 22층, 152층과 같이 써져 있는 항목들이 있습니다. 22층은 22개의 은닉 계층을 활용했다는 의미이고, ResNet은 무려 152층의 은닉 계층을 가진 딥러닝을 활용했다는 뜻입니다. 딥러닝은 인공지능의 현재 주소와 미래 주소로 평가되고 있습니다.
3.3 딥러닝의 한계
딥러닝을 이용하여 인간과 흡사하게 시험지의 에세이를 평가하는 딥러닝 인공지능을 만들었다고 가정합시다. 인공지능은 사람이 평가했을 때와 매우 흡사한 점수를 줄 수는 있지만 이이 제기가 있거나, 평가의 기준을 물었을 때 답변을 할 수는 없을 것입니다. 즉 판단의 기준은 여러 계층의 가중치의 정보이기 때문에 인간이 이해하고 납득할만한 판단 기준을 제시하기 어려울 것입니다. 이 때문에 딥러닝의 활용범위는 일부 제한되고 있습니다.
결론
인공지능은 앞으로의 활용 가능성과 발전 가능성이 무궁무진한 분야입니다. 2030년까지 미국에서만 수백만 개의 인공지능 관련 직업이 생겨날 것으로 예측되고 있습니다. 또한 인공지능은 기존 사업에서 효율성 혁신을 불어 일으킬 것입니다. 앞으로 인공지능의 개념과 활용능력을 사업에서 필수적인 요소가 될 것이고 인공지능을 활용하지 못한 기업들은 4차 산업혁명에서 도태될 것입니다. 따라서 적어도 인공지능이 무엇이고, 어떤 분야에서 활용할 수 있을지는 기본적인 상식이 될 것입니다.
'Machine Learning Algorithm' 카테고리의 다른 글
[ML] Tensorflow 2.0을 이용한 Breast Cancer Wisconsin(유방암) 데이터 분류분석(Hparams를 이용한 하이퍼파라미터 튜닝) (0) | 2020.01.09 |
---|---|
[ML] Tensorflow 2.0을 이용한 iris dataset 분류분석 (0) | 2019.12.31 |