'텍스트 변환 어시스트' 기능을 사용하면 녹음한 음성을 '텍스트로 변환'할 수 있고 이후 '번역과 요약'까지 지원해 준다.
단순한 통화 녹음은 물론이고, 회의나 수업 내용 등을 녹음하면 음성을 A, B, C 등 화자까지 분리해 텍스트로 각각 분류해 주고 이후 번역과 요약까지 지원하는 놀라운 생산성을 제공한다.
어떻게 하면 AI를 선한 목적으로 잘 포용할 수 있을지도 고민이 필요할 것”이라고 덧붙였다.
그는 이날 공개한 카카오의 멀티모달 대규모 언어모델(MLLM) ‘허니비’에 대해 “이미지와 텍스트가 결합하면서 가령 ‘사진 왼쪽 세 번째 사람이 누군가요?’라고 물으면 답변할 수 있게 됐다”며 “조만간 허니비를 쓸 수 있을 것”이라고 강조했다.
MLLM은 이미지와 명령어(프롬프트)를 입력하면, 텍스트로 답변하는 모델로 텍스트로만 입⋅출력하는 대규모 언어모델(Large Language Model)에서 확장된 형태라고 할 수 있다.
이미지와 텍스트를 모두 입력할 수 있기에 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있는 능력을 가지게 됐다. 가령...
법원은 원고가 AI 툴에 다양한 프롬프트(AI 모델에서 출력 생성을 위해 입력하는 텍스트)를 입력하고 매개변수를 설정하는 등 ‘어느 정도의 지적 투자(a Certain Degree of Intellectual Investment)’가 이루어진 점을 인정하고, AI 생성 이미지가 인간의 독창적인 지적 투자를 반영하였으므로, 저작권법에 의해 보호받는 저작물로 보아야 한다고 판시하였다.
한편...
다른 누리꾼도 “궁금해서 해봤는데 군대 키워드를 안 넣으면 저런 그림이 나오지 않는다”라고 덧붙였다.
한편, 생성 AI 시장이 주목을 받으며 미드저니, 스포키, 파이어플라이 등 텍스트를 입력하면 이미지를 생성해주는 AI가 주목받고 있는 가운데 원하는 결과물을 얻기 위해 적절한 키워드를 입력하는 능력이 중요해지고 있다.
또 CNN과 폭스와는 기사 등 텍스트뿐 아니라 이미지 및 비디오에 대해서도 협상을 진행하고 있다.
제시카 시블리 타임 최고경영자(CEO)는 블룸버그에 “오픈AI와 논의 중”이라며 “콘텐츠의 공정한 가치를 반영하는 합의에 도달할 수 있을 것으로 낙관한다”고 밝혔다.
반면 저작권료 지불 없이 콘텐츠를 사용해 소송전에 휘말리기도 했다. NYT는 지난달 27일...
‘오브제북’은 밀리의 서재에서 제작한 오리지널 콘텐츠로 텍스트, 이미지, 사운드 세 가지 요소로 구성한 영상형 독서 콘텐츠다. 이용자들은 오브제북을 통해 원작 도서의 분위기를 반영한 다양한 일러스트 이미지를 볼 수 있고, 텍스트 자막이 보여 도서 내용을 쉽게 이해할 수 있다.
이번 지니TV의 오브제북은 밀리의 서재가 KT의 미디어 그룹사로 편입된 이후...
더불어 본문 텍스트 일부를 표로 생성해주는 등의 문서 작성이 가능하며, 해당 문서를 첨부해 메일 발송까지 한 번에 가능하다.
특히 실시간 한국어 자막의 경우, 94%가 넘는 높은 인식 정확도로 더욱 명확한 커뮤니케이션을 가능하게 한다.
또 삼성SDS는 국내 1위 구매공급망관리(SRM) 솔루션 기업 엠로와 공동 개발한 AI 기반의 구매공급망관리 솔루션...
최 회장은 시각 및 청각 장애인 대상으로 텍스트 읽어주고 소리를 텍스트로 만들어주는 코너에 관심을 보였으며, 2층에 별도로 마련한 스마트홈 부스에선 AI 활용한 스마트홈 구현 등에 질문을 쏟아냈다.
특히 이번 CES에서 이목을 끈 삼성전자의 투명 마이크로 발광다이오드(LED) 코너에서는 담당 임원에게 "반대편에서도 보이나", "집 유리창으로도...
최 회장은 시각 및 청각 장애인 대상으로 텍스트 읽어주고 소리를 텍스트로 만들어주는 코너에 관심을 보였으며, 2층에 별도로 마련한 스마트홈 부스에선 AI 활용한 스마트홈 구현 등에 질문을 쏟아냈다. 이 곳에서 삼성전자가 스마트폰을 활용해 로봇청소기 작동을 시연했으나 움직이지 않자 최 회장이 웃으면서 "자고 있네"라며 어색한 분위기를...
생성형 AI는 텍스트, 오디오, 이미지 등 기존 콘텐츠를 활용해 유사 콘텐츠를 새롭게 만들어 내는 AI 기술이다.
롯데쇼핑은 작년 9월 고객들에게 차별화된 쇼핑 경험을 제공하기 위해 ‘업스테이지’와 생성형 AI 상호업무협약(MOU)을 체결하고 신규 서비스 및 유통 특화 생성형 AI를 개발 중이다. 롯데쇼핑 관계자는 “세분화된 고객의 관심사와 취향을 만족시키기 위해...
텍스트 뿐만 아니라, 이미지, 비디오 등 복잡한 데이터를 다루는 AI가 제기능을 하기 위해서는 방대한 데이터를 더 빠르게 처리할 수 있는 메모리가 필수적이다.
SK는 세계 최초로 HBM을 개발했을 뿐 아니라, 최근 HBM3를 세계 최초로 개발 및 양산에 성공하며 글로벌 넘버원 AI 메모리 반도체 공급사로서의 경쟁력을 갖췄다.
세번째 구역은 '로봇팔'에...
이러한 화질 개선은 텍스트를 읽을 때 눈의 피로를 덜어주고 멀미 가능성을 줄이며 디바이스 제조업체가 새로운 기능을 구현할 수 있게 한다.
증강현실(AR), 가상현실(VR), 혼합현실(MR) 등 다양한 초실감형 기술ㆍ서비스를 포괄하는 확장현실(XR) 시장은 지난해 애플이 MR 헤드셋 ‘비전 프로’를 판매하겠다고 발표하면서 활기를 띠었다. 애플은 내달 공식 출시를...
이번에 출시한 ‘NDPT’ 서비스는 국내 최대의 뉴스 데이터를 텍스트, 이미지, 영상 등 다양한 형태로 보유하고 있다. 여기에 163만 건(하루 평균 200여개)의 정부부처 보도자료까지 확보하고 있어 다양하고 신뢰성 있는 데이터 학습으로 최적의 품질과 데이터 유용성을 보장한다.
뉴스는 정치, 경제, 사회, 문화 등 다양한 주제의 정보를 다루며 지속적으로...
불법 금융광고 내 이미지 형태로 표현된 불법 내용, 전화번호 등을 광학문자인식(OCR) 기술을 이용해 텍스트로 변환시켜 불법성 판단 범위를 보다 확대한다.
2020년 1월 이후 온라인 불법금융광고 게시물 심사 결과(6만5000건)를 AI 자연언어처리 모델(BERT)에 학습시켜 불법 광고를 탐지하도록 불법 광고 판별 기능을 제고할 계획이다.
또한, 금감원과 방심위 간 시스템...
멀티 컨트롤은 하나의 마우스와 키보드로 삼성전자 모니터와 갤럭시 북, 태블릿 또는 휴대폰을 컨트롤하거나 이미지·텍스트를 쉽게 이동할 수 있는 기능이다. 삼성 기기 간 연결성을 강화해 사용 편의성과 작업 효율성을 높일 수 있다.
두 제품에는 매터(Matter)와 HCA 표준을 지원하는 '스마트싱스 허브'가 내장돼 별도의 허브 없이도 다양한...
홍보 영상에서 브랜드 로고와 컬러를 활용한 텍스트 애니메이션과 ‘Korea's No. 1 Construction Equipment Brand’ 문구를 통해 디벨론이 국가대표 건설기계 브랜드임을 강조했다. 홍보 영상은 7일까지 일주일간 송출된다.
이는 HD현대가 이달 론칭 1주년을 맞은 디벨론을 앞세워 올해부터 본격적인 북미 건설장비 시장을 공략하겠다는 의지를 강조한 것으로...
모니터링은 RPA와 OCR을 결합해 머신러닝(M/L) 등의 AI 기술을 통해 온라인몰에 게재된 상품 정보 이미지 등 비정형 데이터를 분석해 텍스트로 추출한다. 이를 PRIS에 업로드된 정답지와 일치 여부를 판단하는 과정을 거친다. 분석 결과는 PRIS에서 실시간으로 확인할 수 있다.
이번에 도입한 시스템을 통해 상품 정보 오기로 인한 리스크를 원천 차단할 수 있을 것으로...
이메일과 문서의 텍스트 초안을 작성할 수 있고, 최신 이미지 생성 AI인 ‘달리 3(DALL-E 3)’를 통해 이미지도 생성할 수 있다. 음성 입력 옵션도 있다.
무엇보다 오픈AI의 최신 대규모언어모델(LLM)인 GPT-4를 기반으로 하며 GPT-4를 무료로 이용할 수 있는 점이 눈에 띈다. GPT-4를 오픈AI의 챗GPT에서 사용하는 경우 비용을 지불해야 한다. MS는 2022년 11월 대화형...
최대 1080p 60fps, 비트레이트 8Mbps 등 고화질 해상도나 주문형비디오(VOD) 다시 보기, 텍스트 투 스피치(TTS) 보이스 후원 등의 기능이 우선 제공된다. 스트리머가 팬들과 편리하게 소통할 수 있도록 ‘치지직 스튜디오’도 지원한다. 이를 통해 스트리머는 구독자 관련 데이터, 상세 후원 내역, 콘텐츠 분석 자료 등 채널 관리를 위한 정보를 확인할 수 있다.
치지직의...