AI시대 경쟁력 강화, 협업이 필수…오픈AIㆍMS 대표적 협업 성공사례
기술력 축적ㆍAI인재 확보도 중요…업스테이지도 빅테크와 협업 추진
“AI 시대의 핵심은 누구와 빨리 협업해서 퍼스트 무버가 되느냐가 관건입니다.”
박찬준 업스테이지 테크니컬 리더는 최근 본지와의 인터뷰에서 “인공지능(AI) 시대 핵심 중 하나가 협업이다. 누가 먼저 손을 잡고 달려나가느냐가 시장에서 성패를 가를 것”이라며 이같이 말했다.
박 리더는 자타공인 AI 데이터 분야에서는 압도적인 리더십을 보유한 인물이다. 박 리더는 데이터 센트릭 AI 분야 최고 권위 학회에서 7건의 논문이 채택되는 성과를 이끈 장본인이자 세계 최대 머신러닝 플랫폼 허깅페이스의 오픈 LLM 리더보드 평가에서 오픈AI의 GPT3.5을 제치고 1위를 차지하는데 핵심 역할을 한 인물이다.
박 리더는 생성 AI 시대에서 경쟁력을 강화하기 위해서는 협업과 데이터의 중요성을 강조했다.
그는 “협업을 하기 위해서는 데이터, 인프라, 모델링, 플랫폼 4박자가 중요하다”며 “대표적인 성공 사례가 오픈AI와 마이크로소프트로 오픈AI가 모델링 역량을 갖고 MS가 인프라와 플랫폼을 제공했다”고 설명했다. 이어 “한국에서는 SKT와 스캐터랩, 삼성전자와 네이버의 협업이 대표적”이라고 덧붙였다.
업스테이지도 글로벌 빅테크와 협업을 논의 중이다. 업스테이지가 개발한 생성 AI 모델이 오픈AI의 챗GPT를 넘어 세계 최고 LLM 타이틀을 거머쥐자 국내 기업뿐만 아니라 글로벌 빅테크로부터 러브콜을 받고 있기 시작했기 때문이다.
한국 스타트업인 업스테이지가 오픈AI, 구글, 메타 등 빅테크가 주도하는 생성 AI 시장에서 아마존, 엔비디아 등을 제치고 AI 시장에서 두각을 나타낼 수 있던 경쟁력의 원천은 △축척한 기술력 노하우와 △AI 인력이다.
박 리더는 “데이터를 어떻게 학습시킬지에 대한 노하우가 성능 향상의 핵심이었다”며 “데이터 센트릭(데이터 중심 AI) 접근법에 초점을 맞춰 최적의 데이터를 발굴하고 저희만의 프롬프트 텟플릿을 만들고 모델적으로는 파라미터를 튜닝하기 위해 정말 많은 실험 과정을 거쳤다”고 설명했다.
특히 산업계를 중심으로 데이터 센트릭으로 AI 개발의 중심이 이동하면서 데이터의 중요성은 더욱 높아지고 있다. 수천억이 넘는 매개변수로 구성된 초거대 LLM보다 경량화된 모델 사이즈로 운용 비용을 크게 절감할 수 있어 B2B 시장에서 주목받고 있기 때문이다.
전체 직원 중 70%가 개발자로 구성된 업스테이지는 데이터 센트릭 AI 분야 최고 권위 워크숍에서 국내 기업 최다 7편의 논문을 발표한 박 리더를 필두로 AI 올림픽으로 불리는 캐글 경진대회에서 금메달을 획득한 전문가 등 글로벌 전문 인력이 포진했다. 업스테이지는 최근 모델링팀과어플리케이션팀으로 구성된 LLM(거대언어모델) 전담팀을 신설하는 등 AI 패권 경쟁에서 경쟁력을 확보하기 위해 집중하고 있다.
몸풀기를 마치고 본격 시장 선점에 나선 업스테이지는 생성 AI 시대 한계로 꼽힌 △최신성 부족 △할루시네이션(환각) △보안 문제 해소에 주목하고 프라이빗 AI 시장 개척에 승부수를 던졌다. 프라이빗 AI는 기업의 핵심 데이터 유출을 막고 환각 현상을 방지하는데 특화된 솔루션으로 AI 솔루션을 내재화하고자 하는 기업들로부터 각광받고 있다.
특히 130만 이용자가 사용하는 업스테지의 AI 서비스 애스크업 운영으로 축적된 프롬프트 엔지니어링 및 파인튜닝 노하우와 기존에 집중했던 초개인화 검색 및 추천 기술은 챗GPT가 촉발한 AI 시장에서 선제적으로 대응할 수 있는 원동력이 됐다.
할루시네이션의 경우 AI 플랫폼 허깅페이스가 운영하는 오픈 LLM 리더보드에 라마-2보다 높은 점수를 받는 등 업스테이지가 강점이 있는 분야다. 박 리더는 “할루시네이션을 완화하는 방법 중 대표적인 게 검색 기술을 이용하는 것이다. 특정 분야에 한정된 답변을 내보낼 수 있기 때문”이라며 “기존에 검색에 주력했던 노하우가 프라이빗 AI 서비스에 녹아들면서 빠르게 문제를 해결하는데 앞장설 수 있었다”고 설명했다.
빅테크가 독점하는 생성 AI 시장에서 네이버의 하이퍼클로바X가 24일 출시를 앞둔 가운데 박 리더는 “한국이 절대 뒤처지지 않았다”고 단언했다. 단, 한국이 생성 AI 시장을 주도하기 위해서는 정부의 투자와 지원이 뒷받침돼야 한다고 했다.
박 리더는 “생성 AI 시장에서 결국 데이터가 핵심이고 자산인 만큼 양질의 데이터를 얼마나 확보해서 자산화하고 있느냐가 장기적인 경쟁력 될 것”이라면서 “국내 AI 대기업과 스타트업들은 주면 이미 뛸 준비를 마쳤다. 정부에서 더 많은 데이터를 오픈하고 활성화하는 등 경기장을 지어주는 게 중요하다”고 했다.