Meta 周二推出了一种新的“一体化”人工智能翻译模型,该模型被视为“寻求创建通用翻译器”的重要一步。
该模型被称为 SeamlessM4T,能够处理近 100 种语言的多种翻译,包括文本到语音、语音到文本、语音到语音和文本到文本。与使用多个模型的其他语言翻译器不同,SeamlessM4T 是一个单一系统,Meta 称其“减少了错误和延迟”,并提高了“翻译过程的效率和质量”。
SeamlessM4T 建立在 Meta 之前的人工智能工作的基础上。2022 年 7 月,天辰收益该公司启动了“No Language Left Behind”项目,该项目使用人工智能对 200 种语言进行文本到文本的翻译,重点是改进稀有或不太常用语言的翻译。
该公司还发布了可让您与具有个性的人工智能机器人聊天的模型,以及有关如何使用人工智能来组织您的 Facebook 和 Instagram提要的更多信息。
与许多大型科技公司一样,Meta 今年更加注重开发和推出人工智能驱动的工具和服务。微软在二月份发布了新的人工智能 Bing 搜索,该搜索使用与 OpenAI 的 ChatGPT 相同的技术。亚马逊最近表示将使用生成式人工智能来分析和总结客户评论,而谷歌正在测试“重新构想在线搜索”的搜索生成体验。
人工智能即将颠覆几乎所有行业,并已渗透到从健身到招聘的各个领域。在翻译方面,人工智能还被用于谷歌翻译应用程序等工具中,天辰收益以帮助为结果添加上下文。生成式人工智能的迅速崛起也引发了人们对该技术风险及其对社会潜在影响的担忧。
与 Meta 之前的许多人工智能模型一样,SeamlessM4T 是根据研究许可证发布的,允许研究人员和开发人员在该技术的基础上进行构建。Meta 还在名为 SeamlessAlign 的数据集中发布了该项目的元数据。Meta 表示,它是最大的开源多模式数据集,包含 270,000 小时的挖掘语音和文本对齐数据,其人工智能是在这些数据集上进行训练的。
有关 SeamlessM4T 的更多技术信息,请查看 Meta在其 AI 博客上的帖子或该公司的研究Github页面。