'달리'로 생성한 그림
'달리'로 생성한 그림

'GPT-4'의 게으름(laziness) 문제가 다시 불거졌다. 즉, 챗GPT가 제대로 작동하지 않는다는 말로, 이에 따라 '클로드 3로 갈아탔다는 사용자들도 등장했다.

비즈니스 인사이더는 28일(현지시간) 챗GPT 유료 사용자들이 최근 게으름 문제로 불평하고 있으며, 오픈AI의 늦장 대응으로 인해 앤트로픽의 클로드 3로 옮기고 있다고 보도했다.

이에 따르면 GPT-4의 게으름 문제는 이미 지난해 여름부터 등장했다. 이는 챗봇이 응답을 거부하는 등 정상적으로 작동하지 않는 것을 말한다.

당시에는 모델 하나를 여러개 소형모델로 분할하는 과정, 즉 '전문가 모델(MoE)' 방식의 적용으로 성능이 일시적으로 떨어진 것으로 여겨졌다. 그러나 주기적으로 문제가 거듭되자, 오픈AI는 지난해 11월 이 문제를 해결하기 위해 GPT-4 터보를 출시했다.

올해 초에도 비슷한 문제가 반복됐고, 결국 샘 알트먼 CEO도 X(트위터)를 통해 이를 인정하고 수정했다고 밝혔다.

GPT-4 게으름 문제를 해결했다는 알트먼 CEO의 트윗 (사진=X, Sam Altman)
GPT-4 게으름 문제를 해결했다는 알트먼 CEO의 트윗 (사진=X, Sam Altman)

하지만 이 문제는 최근 다시 불거졌다. 

일부 사용자는 오픈AI의 개발자 포럼과 SNS 등을 통해 모델이 이전보다 성능이 훨씬 떨어지는 것 같다고 불만을 토로했다. 또 코드 생성의 경우 잘려 나간 일부만 출력한다는 지적도 나왔다. 이 때문에 챗GPT를 더 사용하기 어렵게 됐다는 하소연도 등장했다.

예전에는 사용자들이 이를 기다리는 수밖에 없었지만, 이제는 대안이 등장했다는 것이 차이다. 즉 앤트로픽의 최신 모델 '클로드 3'가 GPT-4를 능가하는 성능을 갖춘 것으로 알려졌기 때문이다.

실제로 벤치마크 결과는 물론, 인간 선호도로 평가하는 챗봇 아레나 리더보드에서도 클로드 3는 챗GPT를 누르고 1위를 차지했다.

엔젤 투자자인 앨리 밀러는 "GPT-4가 몇달 전보다 더 나빠진 것 같다"라며 "내가 아는 대부분 사람은 클로드 3를 사용하고 있다"라고 밝혔다.

또 이던 몰릭 와튼대학교 교수는 "JRR 톨킨의 소설 '반지의 제왕'에 나오는 엘비시 언어를 해석해 달라고 요청했더니, 클로드 3는 번역을 하고 GPT-4는 웹을 검색하더라"라고 밝혔다.

오픈AI가 이 문제에 제대로 대처할 수 있을지도 의문이라는 말까지 나왔다. 밀러는 "오픈AI가 다음 모델에 초점을 맞추고 있어, 이 문제에 리소스를 집중할 것 같지 않다"라고 지적했다.

실제로 최근 보도에 따르면 오픈AI는 올여름쯤 GPT-5를 출시할 예정이다.

이 문제에 대해 오픈AI는 논평을 거부했다.

임대준 기자 ydj@aitimes.com

키워드 관련기사
  • 'GPT-4' 3개월 전보다 성능 저하된 것 맞다
  • 'GPT-4가 멍청해졌다'...전문가ㆍ사용자 일부 주장
  • 오픈AI, 올해 중반 'GPT-5' 출시 유력..."일부 기업에 데모 전달"