AI는 에이전트는 멀티모달(multi-modal) 정보를 이해할 수 있어 동영상과 오디오, 텍스트 정보를 함께 처리하고 다양한 입력값을 서로 연결할 수 있다. 카카오헬스케어의 경우 의료진이 수기로 기록한 데이터를 정제하는 데 생성형 AI를 활용했다.
황희 카카오헬스케어 대표는 “구글 클라우드의 가장 큰장점은 고객이 효과적인 모델을 자유롭게...
텍스트를 비롯해 음성, 이미지, 코딩 등 다양한 방식으로 명령을 받는 멀티모달리티(Multimodality) 성능이 특징이다. 클로이 로봇에 생성형 AI가 탑재되는 것은 이번이 처음이다.
LG전자는 연내 구글의 생성형 AI를 탑재한 ‘LG 클로이 가이드봇(GuideBot)’을 출시하는 한편, 기존 출시된 안내 로봇에도 무선 SW 업데이트를 통해 생성형 AI 기능을 확대 적용할...
SSG닷컴은 국내 이커머스 업계 최초로 자체 개발한 멀티모달 AI 모델을 자사의 딥러닝 기반 이미지 상품 검색 서비스인 쓱렌즈에 적용했다고 26일 밝혔다.
쓱렌즈는 SSG닷컴이 2018년부터 운영 중인 이미지 검색 서비스다. 상품 상세 페이지에서 렌즈 버튼을 누르면 현재 보고 있는 상품과 비슷한 상품을 추천해주고, 검색창 우측 렌즈 아이콘을 클릭해 스마트폰으로...
오픈AI를 비롯한 빅테크가 텍스트·음성·이미지·영상 정보를 모두 처리할 수 있는 멀티모달 AI 모델을 선보이는 상황에서 코GPT 2.0으로 경쟁력을 확보하기 어렵다는 판단도 깔린 것으로 분석된다. 카카오는 자사 모델뿐만 아니라 오픈AI 등 외부 모델도 혼합해서 활용하고 있다.
AI 업계 관계자는 “챗GPT-4 옴니가 나온 이후로 업계에서는 모델을 만드는 게 의미가...
2020년 설립된 AI 싱크탱크 LG AI연구원은 설립 이듬해인 2021년 국내에서 유일하게 이중언어가 가능하고, 언어와 이미지 양방향 생성이 가능한 멀티모달 AI 모델 엑사원을 개발했다. 또 계열사 및 글로벌 파트너사들이 각 산업 영역에서 활용할 수 있는 전문가 AI를 만들어가고 있다.
트웰브랩스는 영상데이터를 기반으로 멀티모달 기술을 활용해 영상을 이해하는 대형 AI 모델을 자체 개발했다. 해당 AI 모델은 영상을 분석해 △서술형으로 요약하고 △하이라이트 영상을 생성하거나 △사용자 질문에 대답 △사용자의 검색 조건에 맞는 영상을 빠르게 찾을 수 있다.
트웰브랩스는 영상 속 정보들을 사람처럼 이해할 수 있는 독보적인 영상...
연구 과제는 온디바이스 AI, 멀티모달(Multi-Modal) AI 등을 위한 세부 기술 확보로 구성된다.
삼성전자는 빠르게 변화하는 AI 분야에서 서울대와의 산학협력을 통해 AI 핵심 기술을 확보하고 제품 기술 경쟁력을 강화할 수 있을 것으로 기대한다.
또한, 과제에 참여하는 석·박사급 연구원을 대상으로 우수 인재 양성 및 확보를 위한 채용 연계 활동도 병행할...
네이버는 지난해 11월 AI 검색 서비스 큐(Cue:)를 선보인 데 이어 올해 하반기에는 텍스트뿐만 아니라 이미지, 영상, 음성 등 다양한 데이터를 학습한 멀티모달 큐 모바일 버전을 출시할 계획이다. 네이버는 큐를 쇼핑, 페이, 플레이스 등 다양한 네이버 서비스 생태계와의 연계해 사용자의 검색 목표에 쉽게 도달할도록 도울 계획이다.
네이버 관계자는 “검색에 생성...
발표 주제는 '멀티모달 딥러닝 AI 플랫폼을 통한 비침습적 대장암 검출(Non-invasive colorectal cancer detection using multimodal deep learning ensemble classifier)'이었고, GC지놈은 액체생검 유전자 분석 데이터를 기반으로 대장암(colorectal cancer, CRC)과 진행샘종(advanced adenoma, AA)을 검출하는 멀티모달 딥러닝 AI 분석모델을 소개했다.
GC지놈은 이번 연구를 통해...
이어지는 2부 행사에서는 밋업 시리즈 1: 생성형 AI 개발 썰 풉니다라는 타이틀로 IT 유튜버 조코딩이 사회를 맡아 진행하였으며 출연자로는 빅밸류 구름 대표, 셀렉트스타 김세엽 대표, 슈퍼브에이아이 이현동 부대표, 스모어톡 황현지 대표가 패널로 참여하여 초거대·생성형AI 시대에 필요한 데이터의 특징과 분야별 전문화된 특화 데이터셋과 멀티모달 AI 데이터 등...
GPT-4o는 멀티모달 AI 모델로, 텍스트로 대화하는 기존 모델과 달리 이용자와 실시간 음성 대화가 가능하다. 오픈AI는 지난 13일 GPT-4o를 공개하며 “몇 주 이내에 출시할 계획”이라고 밝혔는데, MS가 재빠르게 클라우드 서비스에 GPT-4o를 들고나온 것이다.
특히 경쟁사인 구글이 14일 자사 AI 모델 ‘제미나이’ 최신 버전을 검색 등 자사 서비스에 전면...
구글도 14일 자사 생성형 AI의 최신 버전인 ‘제미나이 1.5 프로’를 공개하면서 이보다 더 가벼우면서도 멀티모달 추론과 긴 텍스트 작성이 가능한 ‘제미나이 1.5 플래시’도 선보였다.
지난주 오픈AI가 발표한 최신 모델 ‘GPT-4o’와 구글의 ‘제미나이 1.5프로’ 등 각사를 대표하는 생성형 AI는 모두 매개변수가 1조 개 이상으로 알려졌다.
하지만...
단순한 키워드 검색을 넘어 관심있는 음식 레시피나 영화, 음악, 책, 호텔 등에 대해 AI가 정리한 내용들을 맞춤형으로 편집하며 브레인스토밍을 하는 일도 가능해졌다.
구글 제미나이는 동영상, 이미지, 오디오 등을 인식하는 ‘멀티모달’ 능력을 키운 점도 주목받았다. 스마트폰 카메라로 고장 난 턴테이블을 보여주며 수리 방법을 물어보자 수리 방법과 제품...
구글 생성형 AI 모델 ‘제미나이’의 업데이트와 AI를 활용한 검색 기능 확대, 차세대 AI 반도체, 동영상과 이미지 등 조합에 대응하는 멀티모달 ‘AI 에이전트’ 등 작년부터 이어진 AI 혁신이 한층 더 진전됐다는 평가다.
피차이 CEO는 이날 “구글은 지난 10년은 물론이고, 최근 2년, 지난해에도 계속해서 AI를 발전시켜왔고 향후에도 그러할 것”이라며 AI 기술의...
추후 업데이트를 통해 시각, 음성과 같은 멀티모달 인터페이스도 제공할 예정이다.
오픈AI는 13일(현지시간) 온라인 스트리밍으로 진행된 스프링 업데이트 행사에서 GPT-4의 업데이트 버전 GPT-4o를 선보였다. o는 ‘모든’을 의미하는 옴니(omni)에서 따왔다.
GPT-4o는 기존 모델 대비 처리 속도는 2배 높고, 운용 비용은 절반 수준이다. GPT-4o의 음성 반응 속도는...
NXN Labs 이재원 대표는 “NXN Labs는 상업적 이미지 생성 AI 업계의 next Adobe를 꿈꾸며, 누구나 손쉽게 이미지, 비디오를 자유롭게 생성할 수 있는 멀티 모달 AI 기술 스타트업으로 성장하겠다”며 “특히, 이러한 기술의 가치에 공감하는 네이버 D2SF로부터 투자를 유치하고, 나아가 우수한 기술 스타트업들과 함께 할 수 있어 기대가 크다”고 말했다.
특히 AI 기술이 적용된 제품 사례를 통해 데이터를 분석하는 AI와 새로운 콘텐츠를 만드는 생성형 AI 등 최신 기술 트랜드의 변화를 체감하고 고객 가치를 위한 LG전자의 AI 비전 실현 방안을 공유한다.
구체적으로 영상 지능과 음성‧언어 지능, 센서‧멀티 모달 지능 등을 제품에 탑재해 제품이 고객과 교감하고 실제 삶에 도움을 주는 사례를 학습한다. 이를...
멀티 LLM부터 멀티모달, 오케스트레이션, 검색증강생성(RAG; Retrieval Augmented Generation) 등까지 아우르는 일종의 ‘기업용 AI 개발·운용 패키지’다. SKT는 멀티LLM을 쉽고 효율적으로 사용할 수 있는 인텔리전스 플랫폼을 현재A.(에이닷) 등의 서비스 등에 적용 중이며, 적용 사례를 지속 확대할 예정이다.
LG AI연구원은 지난해 7월 마곡LG사이언스파크에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달 AI '엑사원(EXAONE) 2.0'을 공개했다. 2021년 첫선을 보인 '엑사원'의 진화 버전이다. LG AI연구원은 LG 계열사와 국내외 파트너사들이 엑사원으로 보다 빠르고 편리하게 각 분야에 특화된 전문가 AI를 사용할 수 있도록 연구개발을 이어왔다.
엑사원 2.0은 한국어와...
롯데멤버스가 자사 디지털마케팅플랫폼인 ‘딥애드(DeepAD)’에 구글의 생성형 AI인 ‘제미나이(Gemini)’를 첫 적용했다.
23일 롯데멤버스에 따르면 딥애드는 4300만 엘포인트 회원 데이터 기반의 퍼포먼스 광고 서비스다. 국내 유통사 채널 및 엘포인트 이용자 정보를 결합, 국내 유일 온·오프라인 통합 데이터를 보유하고 있는 점이 특징이다.
딥애드에 구글...