(사진=오픈AI)
(사진=오픈AI)

오픈AI가 인공지능(AI) 음성 비서를 구축하기 위한 '음성 엔진(voice engine)'이라는 상표를 출원했다. 올해 중순 등장할 'GPT-5'에 앞서 애플의 '시리'나 아마존의 '알렉사'와 같은 음성 비서를 내놓을 것으로 보인다.

비즈니스 인사이더는 23일(현지시간) 오픈AI가 지난 19일 미국 특허청(USPTO)에 상표 출원을 제출했다고 보도했다. 서류에는 "보이스 엔진 상표 등록은 다운로드 가능한 컴퓨터 프로그램, 다운로드 가능한 컴퓨터 소프트웨어 개발 도구, 음성 및 음성 인식, 음성 명령 처리, 텍스트와 음성 간의 변환을 위한 다운로드 가능한 컴퓨터 소프트웨어의 범주를 포괄하기 위한 것"이라고 명기돼 있다.

이번 상표 출원은 샘 알트먼 오픈AI CEO가 컴퓨터 과학자 렉스 프리드먼과의 팟캐스트 인터뷰에서 "GPT-5에 앞서 공개할 중요한 것이 있다"라고 밝힌 다음 날 이뤄졌다.

알트먼 CEO는 방송에서 "우리는 올해 놀라운 새 모델을 출시할 것이다. 무엇이라고 부를지는 모르겠다. 앞으로 몇달 안에 다양한 제품을 출시할 것이다. 아주 멋질 것"이라고 말했다.

이어 "GPT-5의 성능이 기대에 미칠 수도, 능가할 수도 있다"라며 "하지만 우리는 먼저 다른 중요한 사항을 공개해야 한다"라고 말했다.

즉, GPT-5 출시에 앞서 새 모델을 출시할 것이며, 특허 출원으로 미뤄 음성 비서 형태가 될 가능성이 높다는 분석이다. 또 음성 비서 이외에도 다른 모들, 예를 들어 자기 오픈AI가 내놓은 적 없는 음악 생성 AI나 기타 모델도 출시할 가능성이 엿보인다.

오픈AI는 이미 음성을 텍스트로 바꾸는 TTS API를 갖추고 있으며, '위스퍼'라는 오픈 소스 음성 인식 모델도 출시했다. 하지만 이번에 USPTO에 제출한 보이스 엔지니어 상표 출원에는 10개 분야의 소프트웨어가 포함돼 있다.

▲디지털 음성 비서 구축 ▲음성 및 음성 인식, 음성 명령 처리, 텍스트-음성 변환 ▲음성 명령 처리 및 텍스트-음성 변환 ▲자동 음성 인식 및 생성 ▲자연어 프롬프트, 텍스트, 음성, 시각적 프롬프트, 이미지 및 비디오를 기반으로 음성 및 오디오 출력 생성 ▲사용자 프롬프트에 대한 응답으로 오디오 및 음성 생성 ▲머신러닝 기반 자연어 및 음성처리 ▲다국어 음성 인식, 번역, 전사 ▲자동 텍스트-음성 및 텍스트-오디오 변환을 위해 AI 사용 ▲음성 서비스 전달 개발 ▲API ▲SDK 등이다.

이를 기반으로 유추하면 사용자 음성이나 텍스트, 이미지, 비디오 등을 알아듣고 이를 음성이나 소리로 답하는 음성 비서가 나올 것으로 보인다. 외국어 번역도 포함돼 있다.

보이스 엔진 상표권 신청 서류 (사진=USPTO)
보이스 엔진 상표권 신청 서류 (사진=USPTO)

물론 상표 등록이 성공할지는 미지수다. 보이스 엔진이라는 상표는 지난 1989년 어플라이드 보이스 테크놀로지라는 회사도 신청했으나, 등록이 받아들여지지 않았다.

이에 앞서 지난달 USPTO는 오픈AI가 신청한 'GPT' 상표 신청도 거부했다. GPT가 '사전 훈련된 생성 트랜스포머(Generative Pre-trained Transformer)'의 약자로, 단순히 제품의 특성을 설명하는 용어인 데다 널리 사용되는 약어에 불과하다는 이유다.

하지만 'GPT-4는' 상표 등록을 허락했으며, 'GPT-5' 'GPT-6' 'GPT-7' '소라' 'GPT 스토어' 등은 심사가 진행 중이다.

박찬 기자 cpark@aitimes.com

키워드 관련기사
  • 몇달 뒤 등장할 'GPT-5', 과연 어떤 모습일까
  • "챗GPT를 또 다른 구글 검색 엔진처럼 만드는 것에는 흥미 없다"
  • 오픈AI, 올해 중반 'GPT-5' 출시 유력..."일부 기업에 데모 전달"