文本生成语音平台ElevenLabs,获1.3亿元A轮融资

专注AIGC领域的专业社区,关注OpenAI、百度文心一言等大语言模型(LLM)的发展和应用落地,关注LLM的基准评测和市场研究,欢迎关注!

6月21日,文本生成语音平台ElevenLabs在官网宣布,获得1900万美元(约1.3亿元)A轮融资,本次由 Nat Friedman、Daniel Gross 和Andreessen Horowitz领投, Instagram、Oculus VR等10多位著名企业的联合创始人跟投。

ElevenLabs主要提供文本生成8种语言的语音、语音克隆、语音合成、语音识别分类,基本上与Meta在前几天发布Voicebox(点击查看)的功能几乎一样。但Meta仅公布了论文并没有发布任何代码和产品,而ElevenLabs早就开始商业化落地。

值得一提的是,ElevenLabs提供了免费体验服务,用户无需注册在线就能使用文本直接生成语音,并且下载也无需花费任何费用(地址:https://beta.elevenlabs.io/)。「AIGC开放社区」体验了一下,发现了一个非常有趣的事。

ElevenLabs不支持中文语音,但是能识别中文。当把一段中文版《八百标兵奔北坡》绕口令生成语音时,神奇的一幕发生了,老外读出来的语音居然和综艺节目上的一样喜剧效果拉满,并且几乎接近真人发声。

ElevenLabs产品介绍

资料显示,ElevenLabs创立于2022年4月,总部位于美国纽约,仅有10多名员工,曾在2023年1月获得200万美元种子轮融资。
ElevenLabs于今年1月正式推出了测试产品,目前注册用户超过100万受到了全球多家知名企业的青睐,例如,世界上最大的有声读物出版商之一的Storytel;
全球内容创作者平台TheSoul Publishing;知名游戏开发商Paradox Interactive等。这些客户通过ElevenLabs平台制作有声读物、电影配音、游戏NPC的声音等。
ElevenLabs团队
产品方面,ElevenLabs基于目前强大的生成式语音模型,提供文本生成语音、语音合成、语音克隆和语音识别分类功能。
文本生成语音:用户通过文本可直接生成英语、德语、波兰语、西班牙语、意大利语、法语、葡萄牙语和印地语8种语音,同时支持跨文本语音生成。例如,上传了一段英语文本,可直接生成意大利语音。
语音克隆:用户提供一段自己或他人的语音片段,将其上传到ElevenLabs平台。然后点击文本生成语音,可以选择最新上传的语音克隆声音。
为了减少ElevenLabs平台生成一些非法语音,例如,模仿他人亲戚用于电信诈骗,ElevenLabs推出了语音识别分类功能,用户只需要上传语音便能快速识别出是真人发音或AI自动生成的,这对于提升ElevenLabs的安全性非常重要。
ElevenLabs首席执行官兼联合创始人Mati Staniszewski表示,在过去5个月的时间,我们的产品被全球超过100万人使用,这充分说明人们对生成式AI的喜爱。我们会持续优化、迭代功能,为用户提供安全、稳定的AI服务。

本文素材来源ElevenLabs官网,如有侵权请联系删除

END

本文来自AIGC开放社区