네이버 음성인식의 진화… 여러명이 동시에 말해도 거뜬

입력 2019-04-05 17:46
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)
▲김성훈 네이버 클로바 리더가 클로바 AI에 대해 설명하고 있다. (조성준 기자 tiatio@)

네이버가 음성인식을 활용한 다양한 기술 발전에 나선다. 앞으로는 음성을 통해 식당 예약과 주문이 가능해질 전망이다.

네이버는 서울 그랜드 인터컨티넨털 호텔에서 개최한 ‘네이버 AI 콜로키움 2019’에서 음성인식을 활용한 ‘듀엣’ 서비스를 개발하고 있다고 5일 밝혔다.

이날 김성훈 네이버 클로바 리더는 ‘클로바 AI 함께해요’를 주제로 음성합성, 입술읽기, 동작인식 등 새로운 음성인식 기술을 선보였다.

우선 음성 합성을 통해 새로운 기계음을 만들 수 있다. 현재 기계음은 딱딱한 톤이 대부분이지만 여러 요소 변화를 통해 사투리 등 일상어에 친숙한 음성으로 변화시킬 수 있다. 톤을 바꾸면서 지루하지 않고 다양하게 변화시키는 것이 가능하다는 뜻이다.

또 주변이 시끄러운 환경에서도 음성인식이 가능해진다. 여러명이 동시에 말을 해도 카메라는 말하는 사람의 입술모양을 분석해 정확한 텍스트 도출이 가능하다. 카메라는 입술을 정확하게 인식해 전달하고자 하는 문장을 읽어낼 수 있다. 얼굴이나 입술뿐만 아니라 전체 동작을 스캐닝 해 춤 점수 자동 계산 등 새로운 기술도 선보였다.

네이버는 이 같은 기술을 합쳐 ‘듀엣’ 서비스를 개발하고 있다. 이날 행사장에서는 ‘듀엣’을 활용해 식당을 예약하고 음식을 주문하는 시연을 펼쳤다. 다만 듀엣은 현재 컨셉형 모델로 앞으로 기술 개발에 방향에 따라 변경될 가능성도 있다.

김성훈 리더는 “음성을 듣는 것과 보는 것이 중요해지면서 음성인식은 이제 일상이 됐다”라며 “앞으로 음성을 활용한 다양한 기술개발을 통해 여러 가지를 할 수 있도록 할 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 더 우울해진 한국인…10명 중 7명 "정신건강에 문제" [데이터클립]
  • ‘최애의 아이 2기’ 출격…전작의 ‘비밀’ 풀릴까 [해시태그]
  • '바이든 리스크' 비트코인, 5만5000달러로 급락…4개월 만에 최저치 내려앉나 [Bit코인]
  • 현아·용준형 진짜 결혼한다…결혼식 날짜는 10월 11일
  • '우승 확률 60%' KIA, 후반기 시작부터 LG·SSG와 혈투 예고 [주간 KBO 전망대]
  • 맥북 던진 세종대왕?…‘AI 헛소리’ 잡는 이통3사
  • [기회의 땅 아! 프리카] 불꽃튀는 선점 전쟁…G2 이어 글로벌사우스도 참전
  • 국산 신약 37개…‘블록버스터’ 달성은 언제쯤? [목마른 K블록버스터]
  • 오늘의 상승종목

  • 07.08 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 79,881,000
    • -1.96%
    • 이더리움
    • 4,256,000
    • -0.16%
    • 비트코인 캐시
    • 469,300
    • +3.26%
    • 리플
    • 609
    • -0.16%
    • 솔라나
    • 196,800
    • +1.13%
    • 에이다
    • 522
    • +3.16%
    • 이오스
    • 726
    • +1.68%
    • 트론
    • 178
    • -1.11%
    • 스텔라루멘
    • 121
    • -1.63%
    • 비트코인에스브이
    • 51,100
    • +0.69%
    • 체인링크
    • 18,250
    • +1.33%
    • 샌드박스
    • 412
    • -0.48%
* 24시간 변동률 기준