SF / 과학 포럼
SF 작품의 가능성은 어떻게 펼쳐질 수 있을까요? 그리고 어떤 상상의 이야기가 가능할까요?
SF에 대한 가벼운 흥미거리에서부터 새로운 창작을 위한 아이디어에 이르기까지...
여기는 과학 소식이나 정보를 소개하고, SF 속의 아이디어나 이론에 대한 의견을 나누며, 상상의 꿈을 키워나가는 곳입니다.
( 이 게시판은 최근에 의견이나 덧글이 추가된 순서대로 정렬됩니다. )
출처(영문):
http://www.independent.co.uk/life-style/gadgets-and-tech/computer-becomes-first-to-pass-turing-test-in-artificial-intelligence-milestone-but-academics-warn-of-dangerous-future-9508370.html
사상 최초로 프로그램이 튜링 테스트를 통과했다.
해당 프로그램은 자신이 우크라이나 오데사에 살고 있는 13세살짜리 소년이라고 주장한다( -_-)
컴퓨터 과학자 앨런 튜링은 인간 감독관들이 프로그램과 5분간 대화를 나누었을 때
그 중 30% 이상이 해당 프로그램을 자신들과 같은 인간으로 취급한다면
해당 프로그램은 튜링 테스트를 통과한 것으로 간주할 수 있다고 말한 바 있다.
유진 구츠만이라는 이름을 가진 이 프로그램은 러시아 프로그래머 팀이 개발하였으며
영국 왕립학술원에서 진행된 튜링 테스트를 통과하였다.
해당 프로그램과 대화를 나눈 인간 감독관들 중 33%가 해당 프로그램을 인간이라고 간주하였다.
과거에도 튜링 테스트를 통과하였다는 프로그램들이 있긴 했으나
대화 주제와 질문 내용이 사전에 정해져 있었다는 점에서 인정되지 않았다.
(참고로 프로그램한테 '튜링 테스트를 통과한 것에 대해 어떻게 생각하지?'라고 물은 결과,
'별로 어렵진 않던데요'라는 프로그램의 대답을 얻을 수 있었다)
해당 프로그램을 제작한 사람들 중 하나인 블라디미르 베셀로프는 다음과 같이 말했다.
"나이를 어리게 설정한 덕분에 잘 모르는 내용이 나와도 그럭저럭 넘어갈 수 있었죠.
진짜같은 인격을 가진 캐릭터를 만드는데 많은 시간을 들였어요"
Coventry 대학교의 초빙교수인 케빈 워윅은 이에 대해 우려스럽다는 의견을 내놓았다.
"인공지능 분야에서 튜링 테스트는 가장 상징적이면서도 논쟁의 소지가 있는 주제입니다.
만일 프로그램이 대다수의 인간을 설득하여 자신이 인간이라고 믿게끔 할 수 있다면,
심지어 거기에 더하여 자신을 친구나 지인이라고 여기게끔 인간을 설득할 수 있다면,
이는 사이버 범죄를 악화시킬 가능성이 있습니다.
튜링 테스트는 이러한 위험을 방지하는데 매우 중요한 도구입니다.
실시간 온라인 대화를 통한 사기에 대해 연구가 필요한 시점입니다."
참고로 이 튜링 테스트는 앨런 튜링 사망 60주년이 되는 6월 7일 토요일에 실시되었다.
인간인지 테스트를 통과한 인공지능과 테스트를 통과하지 못하는 인간...
인간이 인간임을 증명해야 하는 미래가 올까요..?
뭔가 아이러니 하네요.
SNS에도 막상 대화해 보니 별 것 아니더라는 이야기가 계속 나오고 있는데, 튜링 테스트 자체가 블라인드 테스트입니다. 따라서 상대가 아이(AI)(...)란 걸 알고 시도하는 건 별 의미가 없죠.
저 테스트가 어떤 방식으로 이뤄졌는 지는 알 수 없지만 팀이나 기사가 구라를 푼 게 아니라면, 인간 중 33%는 채팅 상대가 오뎃사에 사는 유진이라는 13세 소년이고 인공지능이어서가 아니라 나이가 어려서 단편적으로만 대답한다고 인식했다는 의미이며 30% 이상의 인간이 속으면(...) 테스트를 통과한 것으로 간주한다니 설레발이라고 보기는 어렵지 않나 싶습니다.
그렇게 볼 수도 있겠네요. 전 튜링 테스트에 대한 이론적 기반만 알지 실제 테스트를 본 적은 없어서 잘 모르겠지만 CN님 말씀이 설득력있게 들립니다.
그나저나 만약 저게 말씀대로 부하를 줄이기 위한 라이트 버전이라면 저들도 5년 전의 놋북을 쓰지는 않았을 텐데 고작(...) 자연어를 처리하는데 도대체 어느 정도의 하드웨어 요구사항이 필요하다는 건지...
혹 단어를 입력할 경우 반응을 일일이 나열한 다음 적당한 걸 고르는 방식이라면 하드웨어 부하가 엄청날 가능성이 상당히 높다고 생각해볼 수 있는데, 그렇다면 그건 유진이 지능적으로 반응해서 테스트를 통과했다기 보다 구시대적인(...) 알고리즘을 하드웨어빨로 밀어붙인 것이고 그렇다면 말씀대로 정말 기사가 설레발이 되는 것이겠군요.
http://news.naver.com/main/read.nhn?sid2=230&oid=001&sid1=105&aid=0006949768&mid=shm&mode=LS2D&nh=20140609092516
국내 언론에선 튜링 테스트가 진정한 의미에서의 생각하는 능력을 구분하는 테스트로 나오고 있습니다(...)
시험은 시험관이 진짜 인간과 인공지능(이하 유진), 두 존재와 동시에 채팅을 하는 식으로 진행 된 모양입니다. 즉 시험관이 뭔가 이야기를 하면 인간과 유진이 반응을 하고, 그러면 시험관은 둘 중 어느 쪽이 유진인지를 맞히는 방식으로요.
필자는 자기가 열 번의 진행 중 그나마 맞힌 게 네 번인데 그 조차 세 번은 찍었다고 하는군요. 그러면서 놀라움을 금치 못하고 있습니다.
링크의 유진은 CN님 말씀데로 열화버전이거나, kudos님 말씀처럼 개발 중이었던 2001년 버전이 맞았던 모양입니다. 어쨌든 덧글의 CN님 평이나 SNS에 떠도는 유진에 대한 평을 볼 때 저 정도 수준으로는 인간과 직접 대결(?)하는 방식의 테스트에서 이길 가망이 거의 없으니까요.
그리고 역설적으로 상기 방식의 시험 자체가, 인간이라고 튜링테스트를 항상 통과할 거라는 보장이 없다는 점을 증명하고 있군요 :)
본문과는 큰 상관이 없는 이야기지만, 많은 매체에서-심지어 언론조차- 튜링테스트를 마치 인공지능의 궁극지향점, 혹은 기준처럼 말하고 있습니다. 기본적으로는 작가(그리고 기자)들의 무지가 가장 큰 탓이겠습니다만 그 이면에는 인공지능이나 튜링테스트가 어떤 의미를 갖는지에 대한 약간의 고민조차 없다는 현실이 존재하죠. 튜링테스트는 인공지능학에서 수 많은 시금석 중 하나일 뿐 엄청난 파괴력을 갖거나하는 건 아닙니다. (본문의 인공지능처럼)단순히 손을 좀 보는(?) 것만으로도 튜링테스트를 통과할 수 있는 인공지능이 있는 반면, 아무리 노력을 기울여도 그걸 통과할 수 없는 정상지능의 인간도 있다는 걸 염두에 둬야 하죠.