6.6조 ElevenLabs, ‘AI 음성’은 2년 뒤면 어떻게?

2025-12-11 by amade

최근 6.6조 가치를 인정받은 AI 음성 선두주자 ElevenLabs. 그런데 CEO가 ‘AI 음성 모델은 2년 안에 보편화될 것’이라는 깜짝 발언을 했어요. 이미 게임과 서비스에 널리 쓰이는데 왜 이런 전망을 했을까요? ElevenLabs가 왜 음성을 넘어 대화형 AI로 향하는지, 그들의 다음 전략을 함께 파헤쳐 봐요.

A visionary CEO on stage, presenting to a large audience about future technology, clean infographic style, warm lighting, futuristic setting, no text

Table of Contents

6.6조 가치 ElevenLabs, ‘AI 음성’을 넘어 어디로 갈까요?

폴란드 엔지니어 두 명이 영화 더빙의 불편함에서 시작했던 ElevenLabs는 어느새 6.6조 원 가치의 기업으로 성장했어요. 불과 9개월 만에 기업 가치가 두 배나 뛴 건데요. Sequoia와 ICONIQ이 주도한 1억 달러 규모의 텐더 오퍼까지 성공하며, OpenAI와 어깨를 나란히 하는 AI 음성 분야의 강자로 자리매김했죠. 포트나이트 캐릭터부터 고객 서비스 봇까지, ElevenLabs의 기술은 이미 우리 생활 곳곳에 스며들고 있어요.

AI 음성 모델, 왜 2년 안에 ‘평범’해진다고 할까요?

ElevenLabs의 CEO, Mati Staniszewski는 모두가 예상치 못한 발언을 했어요. ‘음성 모델이 2년 안에 보편화될 것’이라는 이야기였죠. 음성 기술 개발의 선두에 선 회사의 CEO가 이런 말을 한다는 건, 앞으로 AI 음성 시장이 얼마나 빠르게 변화하고 경쟁이 치열해질지를 암시하는 것 같아요. 기술이 발전하고 대중화되면서, 단순히 음성을 생성하는 것만으로는 더 이상 독점적인 가치를 가지기 어려워질 거라는 뜻이겠죠.

Multiple futuristic devices (smart speakers, phones, robots) emitting sound waves, illustrating widespread AI voice technology, modern layout, high contrast, colored background, no text

ElevenLabs의 새로운 도전: ‘대화형 AI 에이전트’란 뭘까요?

Staniszewski CEO가 제시한 ElevenLabs의 다음 전략은 바로 ‘대화형 AI 에이전트 플랫폼’ 구축이에요. 단순히 AI 음성 모델을 만드는 것을 넘어, 사람처럼 자연스럽게 대화하고 상호작용하는 AI 에이전트를 만들겠다는 거죠. 이는 사용자가 AI와 훨씬 더 심도 있고 복잡한 방식으로 소통할 수 있도록 하는 걸 목표로 해요. 예를 들어, 고객 서비스 봇이 단순한 답변을 넘어 실제 상담원처럼 복잡한 문제 해결을 돕거나, 가상 친구처럼 감성적인 대화까지 가능하게 되는 거죠.

A person interacting naturally with an advanced conversational AI agent, friendly interface, lifestyle photography, natural setting, no text

딥페이크 논란, ElevenLabs는 어떻게 대응할까요?

AI 음성 기술이 발전하면서 딥페이크 같은 악용 우려도 커지고 있어요. ElevenLabs는 이런 문제에 적극적으로 대응하고 있더라고요. 워터마킹 기술을 도입해서 AI로 생성된 음성임을 식별할 수 있게 하고, AI 탐지 기술과 기기 인증을 통해 오용을 방지하려는 노력을 하고 있다고 해요. 기술의 긍정적인 활용을 위해 윤리적인 부분까지 고려하는 모습이 인상 깊었어요.

음성 넘어 ‘오디오 생성’까지, ElevenLabs의 큰 그림은?

ElevenLabs는 음성 모델을 넘어 음악 생성 분야로도 진출하고 있어요. 또한, 오디오와 비디오 모델을 융합하기 위한 파트너십도 추진하고 있더라고요. 이는 단순히 듣는 것을 넘어 보고 느끼는 모든 콘텐츠 영역에서 AI가 핵심적인 역할을 할 수 있도록 확장하겠다는 큰 그림을 보여주는 거죠. 마치 영화 더빙에서 시작했던 그들의 비전이 이제는 오디오 생성이라는 더 넓은 영역으로 뻗어나가는 것 같아요.

Dynamic visual representation of music notes blending with film reels and video elements, artistic rendering, textured background, no text

우리 미래 콘텐츠, AI가 더 많이 만들게 될까요?

Staniszewski CEO는 곧 사람의 손으로 만든 콘텐츠보다 AI가 생성한 콘텐츠가 더 많아질 것이라고 예측했어요. 이미 유튜브나 소셜 미디어에서 AI가 만든 이미지는 물론, AI 음성으로 제작된 오디오 콘텐츠도 심심찮게 찾아볼 수 있잖아요. 이런 예측이 현실이 된다면, 콘텐츠 제작 방식과 소비 문화에도 엄청난 변화가 오겠죠. AI가 우리의 일상에 얼마나 깊숙이 들어올지 기대되면서도 한편으로는 놀라워요.

Abstract representation of AI creating various forms of digital content (text, images, audio), modern and clean design, gradient background, no text

ElevenLabs의 과감한 행보는 AI 기술의 빠른 진화를 보여줘요. 단순한 AI 음성을 넘어, 대화형 AI와 오디오 생성까지. 앞으로 AI가 만들어낼 콘텐츠 세상은 우리가 상상하는 것 이상일 거예요. ElevenLabs의 변화에 여러분은 어떻게 생각하세요? 더 똑똑해질 AI 시대, 함께 준비해가요!

출처: https://techcrunch.com/podcast/elevenlabs-just-hit-a-6-6b-valuation-its-ceo-says-the-real-money-isnt-in-voice-anymore/

같이 보면 좋은 글

#ElevenLabs #AI음성 #음성모델 #대화형AI #오디오생성 #AI기술 #미래콘텐츠 #딥페이크방지 #인공지능 #테크트렌드

Leave a Comment Cancel reply

error: Content is protected !!