아래는 매트로 신문에서 발췌한 기사중 일부입니다. (http://www.metroseoul.co.kr/news/articleView.html?idxno=195403)
해외기사 : http://www.digitalstrategyconsulting.com/intelligence/2012/06/google_brain_simulator_uses_16.php
구글, 인간 뇌 본뜬 인공 신경망 개발 |
구글의 비밀 연구소 '구글 X'가 사람의 뇌를 흉내 낸 인공 신경망에 대한 연구를....
.... 몇 년 전부터 1만 6000개의 컴퓨터로 연결된 인공 신경망을 개발해왔다.
... 이 인공 신경망은 사람의 도움 없이 유튜브에서 찾은 1000만 개의 이미지 가운데 고양이를 식별해내는 작업을 성공적으로 수행...
... 1만 6000 개의 컴퓨터 프로세스를 이용해 이 인공 신경망을 개발...
... 인공 신경망이 자가 학습을 통해 어떤 것이 고양이의 이미지인지 스스로 식별...
... "연구 과정에서 이 이미지가 고양이라고 절대 알려주지 않았다"며 "인공 신경망이 고양이라는 것에 대한 개념을 근본적으로 생각해냈다"고 설명....
일단 결론만 말하자면, 눈에 띌만한 결과를 얻었고, 사용한 다층 신경망도 재미있고 훌륭한 아이디어임에는 틀림없다. 하지만, 기사만 보자면 조금 과장된 것은 아닌가 한다. 분명히 맞는 말이기는 한데... 의심을 가지고 본다면, 아래의 기사와 같이...
The Google team was lead by Stanford University computer scientist Andrew Y. Ng and the Google fellow Jeff Dean. Dr Dean explained the system; “We never told it during the training, 'This is a cat,' it basically invented the concept of a cat. We probably have other ones that are side views of cats.”
Dr Ng added: “The idea is that instead of having teams of researchers trying to find out how to find edges, you instead throw a ton of data at the algorithm and you let the data speak and have the software automatically learn from the data”.
학습과정에서는 절대로 고양이다라고 알려주지 않았다... 분명히 맞는 말이기는 한데.. 트레이닝으로 사용한 이미지들은 분명 고양이들로 가득차 있고, 영상에서 고양이라고 봐질만한 특징(feature)을 가질수 있을것 같다라는 느낌에서 보면.. 명시적으로 "고양이라고 알려주지 않았다"라는 말에 숨어있는 말이 뭔지를 보면..
"말은 해주지 않았지만, 훈련에 쓰인 데이터들은 대부분 고양이이며, 고양이의 특징이 충분히 나올수 있도록 variance가 적은 이미지들만 사용했고, 그 훈련 이미지로부터 우리는 고양이라고 하는 영상들로부터 특징(feature)를 얻을 수 있을거라 기대한다." 라는 말과 같지 않나 한다... 그리고, 고양이의 concept이라고 표현한 부분도 사실, 조금 과장된것이 아닌가... 뭐, 분명 틀린말은 아닌데.. 그 concept이라는 표현도 그 범위를 규정하기 나름이라...개념이라는 것이 '여러 관념속에서 공통된 요소를 추상하여 종합한 하나의 관념'이라는 네이버 사전의 말처럼 분명 이미지들 속의 공통된 특징을 개발한 인공 신경망이 찾은 하나의 대표될 수 있는 특징 이미지를 추상화된 개념이라고 볼 수 있다. 다만,.. 그 개념의 범위를 영상의 픽셀 레벨에서 비유(?), 픽셀 레벨로 제한(?)한 것이지, 우리가 통상적으로 받아들이는 어떤 객체에 대한 개념은 이처럼 단순하지는 않지 않은가...
그러고 보면, 요즘 인공 신경망 분야에서는 개념에 대한 이야기를 참 많이 거론하는 것같다. 뭔가 신경망을 Hierarchical하고 deep structure로 만들면 raw data간의 어떤 공통된 특징들이 상위 레이어로 propagation될 수록 추상화, 개념화되어 출력된다는 것들이 Andrew Ng. 처럼 deep learning으로 밝혀(?), 개발되어(!!) 지면서 많은 관심을 받게 된것같다.
신경망에 관심이 있는 사람이라면 적어도 한번은 들여다 봤음직한 주제가 아니었던가...
결론적으로, 구글이 1만 6천개의 프로세서를 사용해서 만들어 낸것이 실질적으로 뇌를 본 뜬거라고 이해될만한 근거가 있는지는 좀 의문이다. 사람이 개념을 표상할때, 저렇게 공통된 특징이라는 것으로 개념을 만들어서 객체를 이해하는지... 난 사실 모르겠다.. 개념이라는 것은 인간의 능동적 인지, 사고와 관련된 것이라고 보는데... 시각정보만으로 개념을 표상하는 것은 어쩌면 과잉일반화의 오류가 아닌가.. 고양이 모습이 실제로 고양이 인것인양 받아들여질 수 있는 제목이 아닌가... 그렇다고, 뭐 이건 틀렸다라고 말하기도 어렵고... 100개중에 1개의 가능성을 보인것으로 100이 가능하다라고 하는 일반화 오류.. 뭐... 그런...
부정적으로 보는것이 아니고, 그냥 기사의 과대 포장에 대해 비꼬는 것일 뿐이다. 연구적인 가치는 말할 필요도 없이 아주 훌륭하다고 생각한다.