# 인공지능 기초 개념

 

안녕하세요 코드사기꾼입니다.
오늘은 지도/비지도 학습 그리고 강화학습의 특징 및 차이점에 대해서 설명해 드리도록 하겠습니다.

자 그럼 아래 그림에서 사각형이 아닌것을 고르는 문제를 한번 생각해 보겠습니다.
1) 주황색 원 2) 남색 정사각형 3) 회색 마름모 4) 하늘색 평행사변형

 

 

첩자가 한명 있다.

 

무엇을 고르셨나요? 정답은 바로 1번 주황색원입니다. 이 문제를 풀기 전에 사각형의 종류에 대하여 공부하셨다면 바로 풀 수 있으셨을 겁니다.

 

 


 

 

1. Supervised Learning(지도학습)

 

- 정사각형은 사각형이다.
- 마름모는 사각형이다.
- 평행사변형은 사각형이다.
- 원은 원이다.

이와 같이 도형의 이름을 X라고 하고 종류를 Y라고하였을 때, 'X는 Y다' 라는것을 미리 학습 하게 되면 '다음 중 특정 Y가 아닌것은?' 이라는 질문에는 쉽게 답할 수 있습니다.
우리는 여기서 Y를 X의 Label(라벨) 이라고 하는데요, 이렇게 라벨에 대한 정답표가 있는 채로 학습하는 것을 우리는 Supervised Learning(지도 학습)이라고 합니다.

 

 


 

 

2. Unsupervised Learning(비지도학습)

 

이 문제에서는 사실 답이 자명하게 1번이었지만 사전 지식이 아닌 특징을 기반으로 분류해서 문제를 해결하는 방법도 있습니다.

- 2,3,4번은 4개의 선으로 이루어져 있지만, 1번은 1개의 곡선으로 이루어져 있다.
- 2,3,4번은 4개의 꼭지점이 존재하지만, 1번은 없다.

위와 같이 라벨을 전혀 모른채로 도형의 특성만으로 다른하나를 골라낼 수 있습니다. 이런 방식으로 학습하는 방식을 우리는 Unsupervised Learning(비지도 학습)이라고 합니다.

 

 


 

 

3. Reinforcement Learning(강화학습)

 

하지만 위의 해결방법들과 같이 어떠한 정보로써 접근하는 것이아닌 문제를 여러번 해결하여 가장높은 보상을 받는 쪽으로 정답을 유추하는 방법도 존재합니다.

- 1번을 선택하였는데 2점이 올랐고
- 2번을 선택하였는데 1점이 감소하였다.
- 3번을 선택하였는데 1점이 감소하였다.
- 4번을 선택하였는데 1점이 감소하였다.

이런 경우라면 같은문제 출현시에 1번을 답으로 고를 것입니다. 즉 문제의 현재 상태를 보고 보상을 최대한 많이 받는 쪽으로 행동을 취하게 학습시키는 방법을 Reinforcement Learning(강화학습) 이라고 합니다.

 

 

'Dev > Artificial Intelligence' 카테고리의 다른 글

[인공지능 개념] Tensor란 무엇인가?  (1) 2019.04.08

+ Recent posts