IT采购网5月11日消息,谷歌在2023年I/O开发者大会上宣布正在开发一项名为UniversalTranslator的实验技术,旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这项技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,视频中的人物说话会根据目标语言的发音同步改变口型。
据IT采购网了解,UniversalTranslator首先会检测单词并进行翻译,然后会检查说话者的语气和强调内容,结合这两个方面生成目标语言的语音。最后,它会根据AI生成的语音的发音同步视频中说话者的口型。这一技术可以为跨语言交流提供更多便利,同时在教育、娱乐等领域也有广阔的应用前景。
然而,由于该技术可能被滥用来制造虚假视频,谷歌表示将限制对UniversalTranslator的访问。因此,只有谷歌授权合作伙伴才能将其用于建设性项目,而普通用户无法使用。这一限制措施有助于防止该技术被恶意使用,保障信息安全。不过,仍然需要进一步完善技术和法律法规,确保人工智能技术的合理应用和发展。