"책임 있는 AI 구축에 집중"

황민영 셀렉트스타 부대표 (사진=셀렉트스타) 
황민영 셀렉트스타 부대표 (사진=셀렉트스타) 

“20년 전 인터넷 회사라는 용어가 사라졌듯, AI 회사라는 개념도 순식간에 없어질 겁니다. 의미 있는 것은 어떤 버티컬에서 어떤 가치를 만들어 내느냐이며, 결국 가장 중요한 것은 데이터입니다.”

인공지능(AI) 데이터 전문 셀렉트스타(대표 김세엽)의 공동 창업자인 황민영 부대표는 이달 초 열린 오픈AI의 개발자 컨퍼런스 '데브데이'를 화두에 올렸다. 

해외에서는 이 행사를 '스타트업 멸망의 날'이라고 부를 정도다. GPT 기술을 기반으로 서비스를 펼치던 전문 스타트업의 영역을 이제는 오픈AI가 직접 수행하게 됐다. 여기에 아이디어만 있으면 비개발자도 챗봇을 구축하고 마켓에 올릴 수 있게 만드는 등 기술을 보편화시켰기 때문이다.

황민영 부대표는 “셀렉트스타는 AI 데이터 전문이기 때문에 고객사 중 AI 스타트업이 많다"라며 "사실 지난해말 '챗GPT' 출시 이후부터 일부 AI 스타트업은 매우 힘들어하고 있다"라고 말했다. "채무 불이행도 벌써 나오기 시작했으며, 더 이상 AI 못하겠다 미안하다는 말들도 많이 듣고 있다”라고 전했다.

그는 인터뷰 중 단 몇분 만에 오픈AI의 새 도구 'GPT'를 활용, IT 전문기사를 작성하는 챗봇을 제작해 냈다. 즉석에서 제작한 챗봇은 시키는 대로 기사를 작성해 주고, 인터넷에서 관련 정보를 찾아 반영해 주며 관련 이미지까지 만들어 줬다. 이 외에도 다양한 분야의 '버티컬 챗봇'을 만들어 봤다고도 밝혔다. 

IT 전문기자 챗봇을 제작하고 시연하는 황민영 셀렉트스타 부대표 (사진=셀렉트스타)  
IT 전문기자 챗봇을 제작하고 시연하는 황민영 셀렉트스타 부대표 (사진=셀렉트스타)  

그래서 내린 결론은 검색 증강 생성(RAG)이나 미세조정, 프롬프트 엔지니어링 등 현재 국내 AI 스타트업의 중심을 이루는 '미들 레이어' 기술만 집중하는 것으로는 더 이상 어렵겠다는 것이었다고 말했다.

"오픈AI 발표를 듣는 순간에는 기존 GPT에 프롬프팅이나 미세조정을 거쳐 '○○에 특화된 챗봇'을 만드는 스타트업들은 많이 사라지겠구나 하는 생각이 들었다"라며 "하지만 조금 더 생각해 보니 애플 앱스토어가 처음 등장했을 때처럼 기회가 될 수도 있다는 생각이 들었다"라고 전했다. 당시 국내 메신저 업계에서는 '버디버디'나 '네이트온'과 같은 강자들이 버티고 있었지만, 마켓 플레이스를 통한 무한 경쟁 끝에 결국 카카오톡이 시장을 장악했다.

"기존 스타트업들이 모두 망한다기보다, 새 마켓 플랫폼의 등장으로 카톡처럼 사용자 핵심 니즈를 잘 파악하고 좋은 비즈니스 모델을 갖추면 엄청난 성장을 이룰 수도 있을 것으로 본다"라는 말이다.

그리고 결국에는 AI라는 기술 자체보다 정곡을 찌르는 서비스를 가능케 하는 핵심 요소, 즉 데이터가 더 중요해질 것이라고 강조했다.

심지어 데이터가 AI의 전부라고 단언했다. “요즘에는 AI 애플리케이션을 만들거나 기존 AI 솔루션을 활용하는 것이 점점 쉬워지고 있다. 하지만 자체 AI를 개발하든 기존 솔루션을 활용하든, 핵심은 항상 데이터”라고 설명했다.

셀렉트스타는 AI 학습데이터를 구축, 제공할 뿐만 아니라 데이터셋 큐레이션, 구축, 분석, 기획 관리 등 데이터 관련 퀄리티와 커버리지, 밸런싱 등 '데이터에 대한 모든 것'을 제공하고 있다. 고객사는 230개 이상, 그동안 작업한 데이터가 1억7000만개를 넘겼다.

또 신경 정보 처리 시스템(NeurlPS)이나 글로벌 자연어처리 학회(EMNLP), 컴퓨터 비전 및 패턴인식(CVPR) 등 세계 최고 수준의 학회에 데이터셋을 등재, 국내 대표 데이터 업체로 셀렉트스타를 떠올리는 것이 자연스럽다고 소개했다.

전 세계 AI 규제 프레임과 빅테크 AI 규정을 참고해 황민영 부대표가 작성한 '책임 있는 AI를 위한 8개명' (사진=셀렉트스타)  
전 세계 AI 규제 프레임과 빅테크 AI 규정을 참고해 황민영 부대표가 작성한 '책임 있는 AI를 위한 8개명' (사진=셀렉트스타)  

현재 셀렉트스타가 집중하는 분야는 '책임있는 AI(responsible AI)'다. 이 때문에 지난해부터 글로벌한 AI 규제 이슈에 대해 집중해 왔다.

특히 최근 들어 EU가 AI 법 초안을 올해 안으로 통과하려고 애쓰고 있으며, 미국에서는 바이든 행정부가 최초의 AI 행정명령을 발표하는 등 AI 규제는 가장 뜨거운 문제로 떠올랐다. 그리고 글로벌 비즈니스에 나서려면 이 문제에 대비해야 하는 것은 필수다.  

황민영 부대표는 "앞으로 글로벌 대기업이 AI를 도입할 때 가장 중요하게 생각할 점은 '무엇이 돈이 되냐'는 점만큼 '무엇이 문제가 되냐'라는 점일 것"이라고 지적했다.

"일부에서는 AI로 가치를 만들어 내는 '밸류 크레이션'보다 AI 때문에 문제가 생기지 않게 하는 '밸류 제네레이션'을 더 중요하게 생각한다"라며 "심지어 가트너와 같은 글로벌 분석회사에서는 AI 계약서 작성 시에는 책임 있는 AI 관련 조항을 반드시 포함하라고 강조한다"라고 밝혔다. 

즉 책임 있는 AI 또는 AI 윤리를 신경 쓰지 않으면 정부 규제로 비즈니스 자체가 어려워질 것이라는 말이다. 실제로 일부 대기업에서는 이 문제로 벌써 컨설팅을 의뢰한 바 있다고도 밝혔다. 

이런 이유로 셀렉트스타는 신뢰성 데이터셋 구축에 나섰으며, AI 신뢰성 검증 체계를 마련하는 다양한 사업과 대외 활동에 참가 중이다.

대표적인 사례가 한국어 대표 벤치마크 데이터셋 '클루'(KLUE)와 '코쿼드'(KorQuAD 2.0)' 구축에 참여한 것이다. 데이터 기업 중에는 유일하다. 

또 한국지능정보사회진흥원(NIA)의 '초거대 언어모델 신뢰성 벤치마크 데이터' 사업의 주관 기관에 선정됐다. 이는 대형언어모델(LLM) 학습과 평가에 필요한 데이터셋을 만드는 것으로, 네이버와 SK텔레콤, KT, LG AI 연구원 등 국내 대형언어모델(LLM) 대기업들이 이를 활용하고 피드백을 전달하는 정부 사업이다.

황민영 셀렉트스타 부대표 (사진=셀렉트스타)  
황민영 셀렉트스타 부대표 (사진=셀렉트스타)  

데이터 분야는 국내 기업이라도 국제적인 경쟁력을 갖출 수 있는 미지의 분야라고도 강조했다.

"AI 기술의 변별력이 없어지며 데이터가 결국 모델의 성능과 서비스의 성패를 좌우하게 될 것은 자명한 사실"이라며 "특히 데이터 영역은 아무리 오픈 AI라고 해도 크롤러 기술로 어떻게 해결할 수 있는 부분이 아니기 때문에, 여기에 집중하는 것은 글로벌한 경쟁력을 확보한다는 차원에서도 의미 있다"라고 말했다.

데이터에 대한 일관된 강조로 황 부대표는 인터뷰를 마무리했다.

"올해 AI 업계는 기술과 비즈니스 모두에서 '미쳤다'라는 말이 나올 정도로 빠르게 변해 왔다"라며 "그럴수록 데이터 중심, 즉 '데이터 센트릭 AI(Data-Centric AI)'의 중요성을 체감해 왔다"라고 말했다.

"셀렉트스타는 지난 5년 동안 이 부분을 가장 잘해온 기업 중 하나"라며 "데이터를 통해 AI 성능과 안정성을 책임져 주고 이를 바탕으로 기업이 진정한 가치를 만들어 낼 수 있도록 최선을 다하겠다"라고 전했다.

이주영 기자 juyoung09@aitimes.com

키워드 관련기사
  • 국내도 '미국식 AI 규제안' 채택...다음달 자율규제 가이드라인 마련
  • '한국형 LLM 순위' 만들기에 네이버·통신 3사 등 AI 대기업 동참
  • 셀렉트스타, ‘AI 서밋 서울 2023’ 참가…생성 AI 시대 전략 발표