이번 협약은 세 기업이 손을 잡고 AI를 토대로 대규모 멀티 모달(Multi-Modal) 유전체 코호트를 연구해 새로운 바이오마커를 발굴하고, 진단 방법을 개발하고자 마련했다. 멀티 모달은 시청각을 비롯한 다양한 방식으로 유전체와 이미지 처리 정보 등을 주고받는 것을 말한다. 이들은 앞으로 AI 기술을 활용해 질병을 예측하고, 신약 후보 물질을 찾는 등 글로벌 제약사를...
7월에 공개한 멀티모달 AI 엑사원 2.0은 전문가와 기업체를 위한 AI를 지향하고 있다.
SK텔레콤은 ‘감성대화’에 집중한다. 현재 자체 LLM ‘에이닷’을 개발해 대중을 대상으로 한 챗봇을 운영하고 있다. 국내 AI 스타트업 스캐터랩에 150억 원의 지분투자를 하고, 공동으로 ‘감성대화형’ AI 에이전트를 개발 중이다. 엔씨소프트는 게임 등 콘텐츠 개발에...
가능한 '멀티모달' 기능을 포함했다”라고 전했다.
이어 정 연구원은 “'Project CONNECT X'는 기업 생산성 향상을 위한 AI 플랫폼으로 디자인, 코딩, 자료 탐색, 문서 작성, 스케쥴 조율 등의 작업 수행 기능을 보유. 분산된 업무 환경을 통합한 생산성 제고를 서비스의 주 목적으로 한다”면서 “'CLOVA Studio'는 고객사 전용 LLM을 만들어주는 AI 모델 생성툴로...
메타는 성명에서 “음성과 텍스트를 번역하기 위한 멀티모달(Multimodal)형 AI 모델”이라고 소개했다. 이어 “우리가 사는 세상은 그 어느 때보다 서로 연결돼 있고, 사람들은 더 많은 외국어 콘텐츠에 접근할 수 있다”며 “어떤 언어로든 정보를 전달하고 이해하는 능력은 점차 중요해지고 있다”고 설명했다.
심리스M4T가 제공하는 기능은 △100개 언어에 대한...
올해 게재된 논문의 주제는 △사용자 정의 호출어 인식 기술 △새로운 멀티모달 감정인식 기술 △웹브라우저에서 구동 가능한 고속/경량의 호출어 인식 모델 제안 등이다. 해당 기술은 사람과 AI 사이에서 자연스러운 상호작용을 이뤄내기 위한 기반 기술이라는 특징을 지녔다.
김희만 엔씨소프트 스피치 AI 랩 실장은 “세계적인 권위를 갖는 AI 학회에 4년...
LG AI연구원은 목적에 따라 엑사원 2.0을 활용한 전문가용 대화형 AI 플랫폼 유니버스(Universe), 신소재나 신약 개발을 위한 전문 플랫폼디스커버리(Discovery), 이미지, 멀티모달 AI 플랫폼 아틀리에(Atelier) 등 3가지 서비스를 선보였다.
챗GPT와 가장 큰 차이점은 챗GPT가 오픈소스로 공개돼 누구나 사용이 가능하다면 엑사원 2.0은 B2B(기업 간 거래)에 초점을...
지난 해에는 텍스트와 이미지 등 복합 정보를 동시에 학습해 사용자가 원하는 결과를 빠르고 효과적으로 찾아주는 ‘멀티모달 AI’를 탑재, 이미지 촬영 후 텍스트를 추가 입력해 더욱 구체화된 정보를 제공하는 검색 서비스로 고도화하고 있다. 특히, 패션이나 잡화 등 색상, 디자인, 소재 등 사용자 기호에 따라 디테일한 검색이 필요한 쇼핑 영역에서 국내 사용자...
인간의 창의적 발상까지 돕는 멀티모달 AI종합적 사고를 바탕으로 인사이트 제시사실 바탕으로 신뢰할 수 있는 근거 도출
"들판에 앉아있는 토끼 이미지를 만들어줘. 토끼 사진으로 아이들이 좋아할 만한 창작 동화를 만들어줘."
인공지능(AI)은 이런 문구들이 입력되자 10초 안에 푸른 들판에 앉아있는 평화로운 토끼 사진을 만들어냈다. 또...
LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달(Multimodal) AI '엑사원(EXAONE) 2.0'을 공개했다.
LG AI연구원은 2021년 12월 첫선을 보인 '엑사원'의 진화한 모습을 소개했다. LG AI연구원은 LG 계열사와 국내외 파트너사들이 엑사원으로 보다 빠르고 편리하게 각 분야에 특화된 전문가 AI를...
이관형 에이아이트릭스 연구원은 “이번 연구를 통해 AI 또한 실제 의료진과 유사한 방식으로 생체신호, X-Ray 이미지, 임상 노트 데이터 등을 종합적으로 활용해 환자 상태 예측의 정확성을 높인다는 점을 확인할 수 있었다. 특히 3가지 이상의 EHR 멀티모달 딥 퓨전은 최초의 케이스다”라고 말했다.
한편, MLHC는 의료 빅데이터를 활용한...
이를 위해 지난달 카카오브레인이 수행하고 있는 글로벌 선행연구 및 초거대 AI 모델 구축사업은 김일두 대표가 기존과 같이 이끌어나가는 동시에 멀티모달 언어모델 영역에서 적정 기술을 활용한 버티컬 서비스 발굴 및 기존 AI 모델 파인튜닝 사업을 추가하며 성공적인 사업 모델 구축 경험이 있는 김병학 신임 대표이사를 선임했다.
카카오의 이번...
LG AI연구원이 2021년 말 공개한 초거대 AI '엑사원'은 현재 6000억 개 이상의 말뭉치, 언어와 이미지가 결합된 고해상도 이미지 3억5000만 장을 학습했다. 최근에는 '엑사원 멀티모달'을 활용해 사진ㆍ영상을 10초 이내에 텍스트로 설명하는 기술을 소개해 이목을 끌기도 했다.
바이오 분야에서는 혁신 신약 개발을 위해 5년간 1조5000억 원 이상 투자를...
멀티모달, 경량화, 윤리 등 초거대 AI 관련 다양한 분야에서 영향력 있는 연구 발표“서울대, KAIST, 뉴욕대 등 연구기관과 협력 강화해 초거대 AI 리더십 확보해나갈 것”
네이버클라우드가 올해 상반기에 글로벌 AI 학회들에서 61개의 논문이 채택되는 성과를 거뒀다고 13일 밝혔다. 한 해 동안 100건의 논문을 발표한 지난해 기록만큼이나 빠른...
카카오브레인은 각자대표 체제 아래 두 분야의 시너지를 만들어내 멀티모달 생성AI 전문 글로벌 회사로의 위치를 공고히 할 계획이다. 라지스케일 파운데이션 모델 구축과 적정 기술 구현 버티컬 서비스 시장 개척 등 두 영역을 강화해 나갈 예정이다.
김병학 각자 대표는 “카카오브레인에 버티컬 서비스 역량을 더해 전에 없던 새로운 모델을 만들고자 한다“라며...
SKT는 개인화에 최적화된 AI 에이전트 에이닷 서비스 운용 노하우와 멀티모달 기술, 장기기억 기술 등 풍부한 AI역량을 보유하고 있고, 스캐터랩은 사람 간의 관계, 시공간 맥락 추론 등이 담긴 감성대화 기술력을 가지고 있다.
SKT는 스캐터랩이 보유한 ‘자연스러운 대화’, ‘감정을 부르는 대화’, ‘인간다운 대화’ 등의 대화 법칙이 적용된...
신한은행은 AI 음성뱅킹에 음성·터치·키패드 등 여러 가지 대화 양식을 활용할 수 있는 ‘멀티 모달 인터페이스(Multi-Modal Interface)’를 구현하고 고객 편의성을 더 높였다.
신한은행은 AI 음성뱅킹 서비스를 지속 발전시켜 대화형 AI 서비스로 구현할 계획이다. 이를 통해 언제 어디서든 고객 필요에 맞게 모든 금융업무를 처리할 수 있는 ‘인비저블 뱅크...
이어 최성환 리서치알음 연구원은 “오픈AI가 조만간 GPT-4.0을 공개할 것"이라며 "GPT-4.0은 자연어부터 음성, 이미지, 영상 등 다양한 형태의 콘텐츠를 망라하는 '멀티모달(Multimodal)' 형태가 될 것”이라면서 “GPT-4.0을 공개하면 상상으로만 존재했던 나만의 제품을 손쉽게 만들 수 있을 것”이라고 설명했다.
아울러 최 연구원은 “AI로 설계한...
앞으로 KT는 지니버스에 공간과 대화, 목소리, 모션, 이미지 기능을 복합적으로 제공하는 멀티모달 기반의 '생성AI 플랫폼' 기술을 개발해 적용할 계획이다. 이용자와 자유롭게 대화하고 문의를 응대하는 AI NPC(Non Player Character)를 비롯해 AI 모션댄스, AI 아바타 메시지, AI 사운드·BGM 등의 콘텐츠를 만나볼 수 있다.
김이한 KT 융합기술원장은 “KT 지니버스가 직접...
이 전시장은 에이닷(A.), 사피온 등 AI를 비롯해 UAM, 인포테인먼트 로봇 등을 직접 체험하고 즐기기 위해 모인 수천 여명의 방문객들로 활기를 띠었다.
특히 이번 MWC23에서 오래된 정보를 기억해 대화에 활용하는 '장기기억' 기술과 텍스트 뿐만 아니라 사진과 음성 등 복합적인 정보를 이해할 수 있는 '멀티모달(Multi-modal)' 기술이 처음으로 에이닷을 통해...
이미지 리트리벌 기술을 적용하기 위해서는 한국어를 기반으로 10억 장의 ’이미지와 한글 텍스트 쌍’ 학습 데이터를 구축해 초거대 멀티모달 AI를 학습시켰다. 이는 최대 규모의 데이터 구축이자 한국적인 특성이 구체적으로 반영되었다는 측면에서 의미가 크다고 SKT는 설명했다.
에이닷은 이용자가 질문하면 제시된 텍스트를 텍스트 인코더를 통해 인식하고...