"알트먼 CEO 해임과 관계없어" 주장도  

(사진=셔터스톡)
(사진=셔터스톡)

샘 알트먼 CEO의 해임에 큰 영향을 준 것으로 알려진 인공일반지능(AGI)의 돌파구, 즉 오픈AI의 Q스타(Q*)에 대한 추측이 쏟아지고 있다. 기존 연구의 연장선상이라는 말부터 그런 내용은 오픈AI 이사회에 전달되지도 않았다는 폭로까지 의견이 분분하다.

테크크런치와 포브스, 벤처비트 등은 27일(현지시간) 오픈AI의 연구 Q스타에 대한 분석을 일제히 내놓았다. 이는 디 인포메이션과 로이터가 지난 22일 보도한 내용을 근거로 한 것이다.

당시 밝혀진 내용은 오픈AI가 일리아 수츠케버 수석 과학자의 '테스트-시간 계산(test-time computation)'이라는 기계 학습  연구를 바탕으로 초등학교 수준의 수학 문제를 인간처럼 추론해 풀어내는 데 성공했다는 것이다. 여기에 프로젝트의 이름이 Q스타라는 것까지 알려졌다.

우선 과학자와 전문가들은 Q스타라는 이름이 기존 Q-러닝이라는 연구에서 비롯된 것이라는 데 대부분 동의했다. 

인공지능(AI) 및 머신러닝(ML)의 세계적 권위자로 알려진 랜스 엘리엇 박사는 "AI 분야에서 가장 유명한 대문자 Q는 의심할 여지 없이 Q-러닝이라고 알려진 것"이라고 말했다.

이는 '강화 학습' 방법에 관한 것으로, AI 모델이 시행착오를 바탕으로 스스로 규칙을 만들어 내려고 시도하는 방식이다. 이에 따라 사람이 가이드라인을 세세하게 주지 않아도, 모델이 자체 규칙을 만들어 문제 해결 능력을 갖춘다는 장점이 있다. 실제로 구글 딥마인드는 2014년 인간 수준으로 아타리 2600 게임을 플레이할 수 있는 AI 알고리즘을 구축하기 위해 Q-러닝을 적용한 바 있다.

엘리엇 박사는 Q 뒤에 붙는 스타(*)는 AI에서 많이 사용하는 'A*'에서 따온 것으로 보인다고 전했다. A스타는 모델의 작동 방식에 포함된 단계별 절차나 기술 등을 망라하고 있다는 표시다. 즉 Q스타는 Q-러닝 기술이 기존 방법을 뛰어넘는 획기적인, 또는 최고의 능력을 포함하게 됐다는 표시로 볼 수 있다고 설명했다.

또 이 과정에 '테스트-시간 계산'을 적용, Q-러닝을 혁신적으로 끌어올려 알고리즘의 문제 해결 능력을 높인 것으로 보는 것이 합리적이라는 결론이다.

네이선 램버트 앨런 AI 연구소 과학자는 "오픈AI는 올해 초 프로세스 보상 모델이라는 기술을 사용해 언어 모델의 수학적 추론을 개선하는 작업을 공유하기도 했다"라며 이제까지 알려진 사실을 뒷받침했다.

실제 오픈AI는 지난 5월 공식 블로그를 통해 '프로세스 감독을 통한 수학적 추론 개선'이라는 연구 내용을 발표했다. 이는 Q-러닝을 통해 수학 문제 해결에 진전을 보였다는, Q스타의 전 단계에 해당하는 내용이다.  

오픈AI가 5월 공개한 '프로세스 감독을 통한 수학적 추론 개선' (사진=오픈AI)
오픈AI가 5월 공개한 '프로세스 감독을 통한 수학적 추론 개선' (사진=오픈AI)

특히 릭 레이머라는 전문가는 이 연구 중 '생각의 체인(CoT)'을 따르는 모델에 보상을 제공하는 정렬 기술을 사용하면 모델 성능을 크게 향상할 수 있다고 주장했다. "이를 통해 모델이 인간의 사고와는 다른 방식을 따라 잘못된 결론에 도달할 가능성이 줄어들 것"이라며 "대부분의 AI 연구자들은 이런 방식이 효율적이라는 데 동의할 것"이라고 덧붙였다.

반면 마크 리들 조지아공대 컴퓨터과학 교수는 비판적인 의견을 남겼다. 그는 “오픈AI의 연구 내용은 기껏해야 기존 아이디어를 확장하는 방법 정도에 불과하다"라며 "이후 6개월 동안 다른 많은 조직에서도 이를 연구해 왔는데, 유독 오픈AI만이 엄청난 아이디어로 발전시켰을 가능성은 거의 없다"라고 단정했다.

얀 르쿤 메타 수석 AI 과학자 등도 Q스타가 기존 연구를 크게 뛰어넘었을 것이라는 데에는 회의적인 반응을 보였다.

이런 논의 자체가 황당하다는 반응도 나왔다.

짐 팬 엔비디아 수석 AI 과학자는 "Q스타라는 이름만 있지, 논문도 없고 통계도 없고 제품도 없다. AI 업계에 10년 이상 있었지만, 이렇게 많은 사람들이 환상을 품는 알고리즘은 본 적이 없다”라며 이를 "판타지”라고 표현했다.  

한편 더 버지는 정통한 소식통을 인용, 오픈AI 이사회는 큐스타 개발 사실이 담긴 편지를 직원들에게 받은 일이 없으며 이 때문에 알트먼이 해임된 것은 아니라고 밝혔다.

이에 대해 테크크런치는 "Q스타가 어떤 결과를 내놓든 간에 간단한 수학 방정식을 해결하는 것은 당장 인류에게 파멸을 초래하지는 않을 것"이라고 평했다.

임대준 기자 ydj@aitimes.com

키워드 관련기사
  • 오픈AI, AGI 개발 돌파구 찾았다...인간처럼 추론하는 LLM '큐스타' 개발 중
  • 구글, '초인공지능' 구분 기준 공개..."챗GPT는 레벨 1"
  • 오픈AI, 'AGI' 개발 첫 인정..."MS의 자금 지원 필요"