IT采购网9月26日消息,Spotify和OpenAI近日宣布合作推出一项令人振奋的新功能,名为“语音翻译(VoiceTranslation)”。这一功能旨在改变播客行业格局,通过人工智能技术实现声音克隆和多语言翻译,使全球观众能够更轻松地理解和欣赏不同语言的播客内容。
据悉,这项功能的开发得益于Spotify强大的自动语音识别(ASR)系统Whisper,该系统能够将音频内容转换为文本,为后续翻译工作提供基础。而语音复制模型则是关键的组成部分之一,它能够匹配播客主播的声音风格,确保翻译后的内容仍然保留原始主播的语音特点。
在初期测试中,一些知名的播客主持人,如戴克斯・夏普德、莫妮卡・帕德曼、莱克斯・弗里德曼、比尔・西蒙斯和史蒂文・巴特利特,积极参与并贡献了他们的声音。然而,目前该功能仅提供西班牙语翻译版本,未来几天和几周内将推出更多剧集,并扩展到法语和德语等更多语言,以满足全球用户的需求。
这一技术的引入被认为是播客领域的一次创新,有望打破语言壁垒,促进不同文化之间的交流与分享。Spotify和OpenAI的合作将继续探索更多可能性,为用户带来更多多样化的音频体验,为全球播客内容的传播带来新的机会。