머신러닝AI2022. 1. 9. 17:03

지능 문제의 대표적인 격인 예측 이야기를 해보자.

이 문제의 본질은 이렇다.

 

A. 무언가 정답을 내는 함수가 있다. 예를들면 자연이나, 주식시장의 실제 내일 가격치다. 여하튼 그 시점이 되거나 상황이 되면 진실의 값이 나온다. 통계에서는 이를 '모분포'라고 말한다. 우리가 알고 싶은 진리이며, 실제 세상이다.

 

B. 과거에 그 정답이라고 믿어지는 기록, 즉 과거의 데이터가 존재한다. 옛날에 이런 상황이었을때는 답이 이랬어 하는 기록이다. 미래의 값은 발생해야 알 수 있지만 과거에 적어놓은 값은 존재할 수 있다.

 

C. 예측의 본질은 어떤 장치를 만들어서 지금 예측해야할 조건 값들이 나온 경우에, 과거에 그러한 조건에서 어떤 정답이 나왔었는지 가장 가까운 것을 찾아 답을 내는 일이다.

 

이 A,B,C는 x라는 조건 혹은 입력값 이 있을때 y라는 예측 값을 구하는 문제에서 f(x) = y 라는 함수를 찾는 문제로 설명할 수 있다. 수학에서는 지극히 전통적이고 일반적인 설명 중의 하나이다.

 

A. F(x)라는 정해진 함수가 존재한다. 이것이 정답을 내는 함수이며 우리가 알아내야할 모분포이며 정답의 패턴이며 구하고자 하는 자연 혹은 주식시장의 값을 내는 패턴이다.

 

B. x' -> y' 라는 과거의 데이터가 존재한다. 물론 유한한 수 만큼만 존재한다.

 

C. 이제 x''라는 값이 나오면 F(x'')가 무엇이 될지 이 B의 데이터가 예상해주는 F(x)의 유사함수인 f(x)를 찾아서 그 값을 구하는 문제이다.

 

언급했듯이 이 틀은 아주 오래전에 모두 잘 정의되어 있고, 대부분의 예측의 문제는 이 틀을 유지한다. 그리고 통계학에서는 영민하게도 우리가 관측한 값의 오차까지 고려한다. B에서 기록할때 혹은 관측할때 오류가 발생하기 때문이다. 답을 거꾸로 적기도 하고 측정을 잘못 하기도 한다. 여하튼 이런 구조를 통해 인간의 지능 말고도, 온 우주의 외계인의 지능 모두를 근사해낼 수 있다. 물론 여기에 여러가지 다른 기술이 필요할 수도 있다. 지능이란 예측 말고도 무언가 다양한 추상화 과정을 담고 있긴 하다.

 

그러면 이 문제의 틀에서 인간의 지능이란 어떤 것일까?

 

무언가 관찰/학습하여 모분포를 예측하여 결론을 내리기는 하는데, 통계학에서 이야기하는 것 외에 무언가를 미리 가지고 있다.

 

통상의 문제에 통계적인/머신러닝 방법으로 예측기를 만들기 위해서는 엄청난 데이터가 필요하다. 왜냐하면 자연에서 인간이 예측해야하는 F(x)라는 녀석이 상당히 복잡하기 때문인 것도 있다. 오히려 어떤 상황을 관찰해야하는지도 정하기 어렵다. 그리고 이 F(x)라는 것은 시대에 따라 달라지거나 타이밍에 따라 달라질 수도 있고, 어떨때는 심지어 무작위(random)로 보일 때도 있다.

 

그런데 인간은 최소한의 관찰결과만을 가지고 어느 정도 효과적인 f(x)를 만들어내는 것처럼 보인다. 어찌보면 전이학습이라고 일컬어지는 것일 수 있겠다. 그것을 무엇이라 불러야 될지 모르지만, 예를들면 우리가 글자를 구별해 낼때 인간은 그 글자의 일부가 가려져도 예측해내거나 여러가지 추론을 통해서 알아내기도 한다. 그 문제와 당면한 다른 지식들도 사용한다. 그리고 이 모든 과정이 조화를 이루는 경우가 많다. 즉 통계에서 표현하는 하나의 예측기라기 보다는 무언가 근원적인 예측기가 존재하고 이 예측기가 다른 예측기를 보좌하고 그것들이 합산된 예측기가 작동하는 형태이다.

 

따라서 어찌보면 예측기의 효과적인 학습 방법에 대한 연구보다는(신경망의 효율적 학습방법은 아직도 수많은 논문의 해결 대상이다) 이러한 기저에 있는 예측기와 이것들이 어떻게 자유자재로 합치는 지에 대한 연구가 오히려 인간의 예측을 모방하는 전단계가 될 수 있다. 그러면 과연 무엇을 유전자에 각인시켜 학습시켜서 태어나는 것인가?

 

 자연이라는 수학기계 속에서 발생하는, 진화과정에서 오래 분명하게 된 것들을 학습하고 있을 것이다. 중력이나 포물선 운동, edge에 대한 처리나 여러가지가 아닐까? 그리고 개체관의 관계에서 얻어진 여러가지 게임이론이 아닐까?

 

 따라서 인간의 지능 문제를 풀기 위해서는 이러한 진화론적 시뮬레이션이 필수라고 생각한다. 그것은 자연을 닮아야 한다. 왜냐하면 우리네가 필요한 대부분의 예측도, 그것이 카오스/복잡계가 낳는 임의적인 것처럼 보인다고 해도, 일정 수준의 자연법칙하에 진화에 바탕하기 때문이다. 무엇이든 인간의 지능을 추구한다고 하면, 이러한 기저의 예측기들이 무엇인지 어떻게 조화되는지, 자연을 닮은 시뮬레이터 속에서 우리가 가진 오감들을 반영하고 그에 기반하여 실험하거나, 그와 수학적인 등가의 무엇을 추구해야 하지 않는가

 

반응형
Posted by 작동미학