앤트로픽, 이르면 이달 중 '음성 모드' 기능 출시…에어리·멜로우·버터리 등 3가지 음성 도입
(지디넷코리아=장유미 기자)'오픈AI 대항마'로 꼽히는 앤트로픽이 자사 인공지능(AI) 챗봇인 '클로드'를 활용한 새로운 음성 비서 제품을 출시한다. 생성형 AI를 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 된 가운데 앤트로픽이 존재감을 키울 수 있을 지 주목된다.
16일 블룸버그통신에 따르면 앤트로픽은 '음성 모드'라고 불리는 새로운 기능을 이르면 이달 중 출시할 것으로 알려졌다. 음성 지원 기능의 도입으로 텍스트 입력 방식보다 훨씬 자연스럽게 AI와 소통할 수 있을 것으로 보인다.
초기에는 제한적인 서비스만 선보일 예정으로, '에어리'와 '멜로우', 영국식 억양의 '버터리' 등 세 가지 음성을 도입할 것으로 전해졌다.
앞서 앤트로픽은 '클로드'에 음성 기능을 추가하기 위해 음성 AI 스타트업 일레븐랩스, 아마존과 협력 중이란 소식이 전해진 바 있다. 앤트로픽 경영진도 음성 옵션을 개발 중이라고 밝힌 바 있지만, 구체적인 출시 일정과 세부 사항은 알려지지 않았다.
(사진=앤트로픽)
앤트로픽의 '음성 모드' 출시 소식은 앱 연구원 M1아스트라(M1Astra)가 앤트로픽의 코드에서 발견해 블룸버그통신에 공유하며 드러났다. 앤트로픽은 이번 일에 대해 공식 입장을 밝히지 않았다.
업계에선 앤트로픽의 이 같은 행보가 경쟁사인 오픈AI와의 격차를 줄이기 위한 움직임으로 해석했다. 앤트로픽이 최근 '클로드 리서치'란 기능을 추가한 것도 지난 2월 발표된 오픈AI '딥 리서치'를 견제하기 위한 것으로 보는 시각이 많다. 이 외에 구글 '제미나이', 미스트랄 '르샤' 역시 웹 검색 기능을 제공하고 있다.
여기에 앤트로픽은 클로드 이용자가 업무를 간소화할 수 있도록 지메일(Gmail), 구글 캘린더, 구글 문서도구에서 검색할 수 있는 기능도 조만간 추가할 예정으로, 기능 강화를 통해 시장 주도권을 잡겠다는 방침이다.
업계 관계자는 "앤트로픽의 음성 기능 도입은 경쟁사들에 비해 다소 늦은 편"이라며 "오픈AI, 구글, xAI 등은 이미 음성 기능을 공개했고 메타도 음성 모드를 강화한 '라마4'를 준비 중"이라고 말했다.
다리오 아모데이 앤트로픽 CEO (사진=유튜브 노지스 뱅크 인베스트먼트 공식 유튜브 캡처)
일각에선 앤트로픽이 경쟁사에 비해 다소 늦게 음성 기능을 도입한 만큼 경쟁사들보다 존재감을 더 드러낼 수 있을지 의문을 드러내기도 했다. 현재 AI 음성 비서 시장은 세계 최대 전자상거래 업체 아마존의 '알렉사 플러스'와 삼성전자 '빅스비', 구글 '제미나이 라이브', 애플 '시리' 등과 함께 오픈AI가 경쟁을 벌이고 있다. 특히 지난해 오픈AI의 GPT-4o 등장 후 AI 음성 비서 시장은 빠르게 기술 고도화가 진행되고 있다.
업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "GPT-4o 이후에는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다.
아마존 '알렉사+' (사진=아마존 뉴스룸)
이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다.
업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다.
블룸버그통신은 "음성 비서는 사람들이 챗봇과 상호작용하는 방식을 바꾸고 사용자의 생산성을 높일 수 있다는 기대와 함께 오픈AI, 구글과 같은 AI 개발 업체의 핵심 기능으로 부상했다"며 "하지만 AI 음성 제품의 등장으로 다른 사람의 말투를 흉내 내는 것에 대한 우려도 커지고 있다"고 지적했다.
장유미 기자(sweet@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.