김용범 네이버 서치US 치프 사이언티스트는 “정보의 신뢰성, 네이버 서비스와의 연결성, 효과적인 정보 제공을 위한 멀티모달 세 가지를 중점으로 프로젝트를 진행 중”이라고 밝혔다.
최신성과 정보간 교차‧반복 검증, 사용자 피드백을 통해 정확성과 신뢰성을 확보한다. 쇼핑, 페이, 지도 등 네이버 서비스와 연결해 사용자가 원하는 정보를 알맞게...
특히 이번 MWC23에서 SKT는 오래된 정보를 기억해 대화에 활용하는 '장기기억' 기술과 텍스트 뿐만 아니라 사진과 음성 등 복합적인 정보를 이해할 수 있는 '멀티모달(Multi-modal)' 기술이 장착된 에이닷 서비스를 시연한다.
또 △코난테크놀로지 △몰로코(MOLOCO) △베스핀글로벌(BESPIN GLOBAL) △스윗(Swit) △팬텀 AI(Phantom AI) 등 AI 혁신을 함께 추진하는...
또한 이달 중 오래된 정보를 기억해 대화에 활용하는 ‘장기기억’ 기술과 텍스트 뿐만 아니라 사진과 음성 등 복합적인 정보를 이해할 수 있는 ‘멀티모달(Multi-modal)’ 기술을 장착해 서비스 고도화에 나설 예정이라고 밝혔다.
한편, 유엔젤의 AI 통화 연동 솔루션은 이동통신망을 이용해 이용자와 AI 간의 일대일 혹은 일대다 통화가 가능한 서비스를...
LG는 사람의 시각 인지 능력에 가까이 다가서는 제로샷 이미지 캡셔닝이 이미지를 텍스트로 표현하고 텍스트를 이미지로 시각화할 수 있는 초거대 멀티모달 AI인 ‘엑사원(EXAONE)’의 기술 개발 생태계에 크게 기여할 것으로 기대하고 있다.
LG AI연구원은 공동연구센터를 설립해 초거대 멀티모달 AI인 엑사원을 연구 중인 서울대학교 AI대학원, 이미지 캡셔닝 AI의...
기존 초거대 AI가 주로 언어에 초점을 맞춘 모델이라면 멀티모달 AI는 텍스트 이외에 음성, 이미지, 제스처, 생체 신호 등 여러 방식의 데이터를 인간처럼 종합 추론하고 의사소통까지 할 수 있는 AI 기술이다.
SKT는 연초부터 AI 기술 주도권을 놓지 않겠다는 의지를 담아 이 같은 행보에 나섰다고 한다.
SKT는 국내 최초로 초거대 언어 모델인 GPT-3의 한국어...
LG전자 인공지능연구소는 이를 위해 음성·이미지·영상·감성·생체 인식 기반의 공간상황 및 사용자 상태 인지, 맥락대화 및 감성대화를 통한 논리 추론, 음성·영상 및 다양한 센서를 이용하는 ‘멀티모달 인터페이스’ 등과 같은 AI 원천기술 고도화에 집중한다.
인공지능연구소는 고도화된 AI 기술을 활용해 가전, 전장, IT 등 주력사업을 진화시키는 역할을...
‘엑사원 아틀리에’는 텍스트와 이미지간 양방향 생성이 가능한 엑사원만의 멀티모달 특성을 살려, 사람과 AI가 협업해 세상에 없던 창조적 디자인을 생성하는 플랫폼이다. LG AI연구원은 세계 3대 디자인스쿨 파슨스, 글로벌 크리에이티브 플랫폼 기업인 셔터스톡과 생성 AI 기술을 공동 연구하고 있으며 향후 협업 대상과 영역을 확대할 계획이다.
이날 LG...
LG는 지난해 12월 초거대 멀티모달 AI ‘EXAONE’(엑사원)을 전격 공개했다.
초거대 AI는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있는 AI를 말한다.
엑사원은 국내 최대인 약 3000억 개의 파라미터(학습 데이터 저장소)를 보유하고 있다. 언어뿐 아니라 이미지와 영상에 이르기까지 인간의...
영상‧이미지‧텍스트 등 다양한 유형의 데이터 관계를 찾으며 맥락을 이해하는 멀티모달 모델이 이 기술의 핵심이다. AI가 다양한 데이터를 학습한 후 특정 맥락과 질문을 일치시키는 것과 사용자의 시각에 맞는 단계별 답변을 제공해야 한다는 점이 주요 평가 요소였다.
인공지능 기술기업 업스테이지는 ‘AI 올림픽’ 캐글 대회에 두 팀이 참여해 각각 19위...
LG는 지난해 12월 초거대 멀티모달 AI ‘EXAONE’(엑사원)을 전격 공개했다. 초거대 AI는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있는 AI를 말한다. 특정 용도에 국한되지 않고 다양한 분야에서 활용할 수 있다.
LG는 글로벌 초거대 AI 생태계도 구축한다. LG는 지난 2월 LG AI연구원을...
LG는 지난해 12월 초거대 멀티모달 AI ‘EXAONE(엑사원)’을 전격 공개했다.
‘초거대 AI’는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있는 AI를 말하며, 특정 용도에 국한되지 않고 다양한 분야에서 활용할 수 있다.
LG가 공개한 ‘엑사원’은 국내 최대인 약 3000억 개의 파라미터...
‘틸다’는 LG의 초거대 멀티모달 AI ‘EXAONE(엑사원)’의 두뇌를 탑재하고 있어 스스로 학습해 사고하고 판단하며 언어의 맥락까지 이해해 기존에 없는 새로운 이미지를 창작하는 능력을 갖췄다. 실제로 뉴욕 패션 위크에서 선보인 컬렉션을 구성하는 200여 개의 의상은 ‘틸다’가 ‘금성에 핀 꽃’이라는 주제로 창작한 3000장이 넘는 이미지와 패턴을 기반으로...
LG AI연구원은 이번 논문을 토대로 개발한 세계 최초의 언어와 시각 정보 간 양방향 소통이 가능한 초거대 멀티모달 AI 엑사원의 핵심 기술을 소개할 예정이다.
엑사원에 사진을 보여주면 사진 속 모습대로 ‘한 소년이 푸르른 공원에서 녹색 플라스틱 원반을 던지고 있다’는 문장이 자동 완성되고 ‘흐르는 강물과 일몰 풍경’이라는 텍스트를 보여주면...
네이버가 이미지 검색 스마트렌즈에 복합 정보로 검색이 가능한 '멀티모달 AI'를 도입한다.
네이버는 이미지 검색 서비스인 스마트렌즈에 멀티모달 AI 모델을 적용했다고 28일 밝혔다. 멀티모달 AI의 스마트렌즈 적용을 시작으로 AI 검색 브랜드 ‘에어서치’에 확대 적용, 고도화해 검색 품질을 높힌다는 계획이다.
앞서 네이버는 지난달 멀티모달 AI ‘옴니서치’...
‘이미지 한 장만으로 3차원 구조 그려내는 신기술’ 등 8개 공동 연구25일 ‘SNU-LG AI 리서치 센터’ 현판식…이경무ㆍ배경훈 공동 센터장
LG AI연구원은 25일 서울대 AI대학원과 공동으로 설립한 ‘SNU-LG AI 리서치센터’(이하 리서치센터)의 현판식을 열고 초거대 멀티모달 AI 공동 연구에 속도를 낸다고 밝혔다.
서울대학교 관악캠퍼스에 위치한...
지난해 카카오 AI 자회사 카카오브레인은 글과 이미지를 한 번에 이해하는 AI 모델 ‘이미지 텍스트 멀티모달’을 올해 상반기 중으로 공개할 예정이라고 했다.
이를 도입하면 AI 모델을 적용할 경우 이미지를 글로 표현하거나, 글에 맞는 이미지를 검색·제작하는 등 검색 방식이 변화할 수 있다. 김일두 카카오브레인 대표는 “카카오톡 내에서 이미지를...
고도화된 ‘챗봇 모델’과 LG화학ㆍ엘스비어와 연구하고 있는 분야인 ‘심층 문서 이해’(DDU) 기술도 시연했다.
DDU는 언어와 시각을 모두 다룰 수 있는 멀티모달 AI를 기반으로 논문, 특허 등 전문 문헌의 텍스트뿐 아니라 수식, 표, 그림 등 시각적인 요소까지 분석해 신약과 신소재 등의 데이터를 획기적으로 빠르고 정확하게 분석하고 축적하는 기술이다.
‘틸다’는 입력된 언어의 맥락까지 이해해 기존에 없는 이미지를 창작할 수 있는 멀티모달(Multi-Modality) AI이기 때문에 예술 작품이나 디자인 이미지들을 학습해 유사한 화풍 또는 브랜드 디자인 콘텐츠를 만드는 기존 AI들과 기술적으로도 차이가 있다.
‘틸다’가 이처럼 스스로 창작을 할 수 있는 것은 바로 세계 최대 수준인 말뭉치 6000억 개 이상, 텍스트와...
멀티모달 AI 모델과 데이터셋을 한 번에 공개하는 것이 목표다.
멀티모달은 글(텍스트)과 이미지, 음성을 동시에 이해할 수 있는 AI 모델이다. 이를 활용하면 AI가 이미지를 글로 표현하거나, 글에 맞는 이미지를 검색·제작할 수 있다. 김일두 카카오브레인 대표는 “언어와 이미지를 섞거나 이미지를 생성하는 멀티모달을 (카카오브레인이) 선도적으로 하고 있다”...
내년 초 카카오브레인은 멀티모달 AI 모델과 데이터셋을 한 번에 공개할 방침이다.
멀티모달 AI를 활용한 서비스도 예고했다. 김 대표는 “멀티모달 AI는 단편적으로 다음 등 검색엔진에서 이미지 검색 섹터를 많이 바꿀 것”이라며 “카카오톡 내에서 이미지를 검색하거나 카카오가 제공하는 다양한 커머스 검색 서비스에 이 기술을 먼저 적용할 수 있을 것으로...