苹果、谷歌和 Meta 正在努力完善一款科幻小工具:通用翻译器

几十年来,《星际迷航》等电视剧和《银河系漫游指南》等小说都展示了虚构的通用翻译器,能够将任何语言无缝地转换为英语,反之亦然。

如今,这些曾经只存在于科幻小说中的装置正逐渐接近现实。

在上个月 iPhone 发布会上,苹果一段视频记录了许多旅行者梦寐以求的场景。视频中,一位讲英语的游客在西班牙语国家买花。花店老板用西班牙语和游客说话,但游客听到的却是清晰连贯的英语。

“今天所有红色康乃馨五折优惠”,游客从耳机里听到了英文,几乎与店员的讲话同时进行。

该视频是苹果最新 AirPods Pro 3 的营销材料,但该功能是来自科技公司的众多同类功能之一,其中包括谷歌母公司 Alphabet 和 Meta(该公司旗下拥有Facebook 和Instagram)。OpenAI 于 2022 年底推出 ChatGPT,这推动了技术进步,开启了生成式人工智能的新纪元。近三年后,这些技术进步也催生其实时语言翻译效用。

对于苹果来说,实时翻译是该公司发布 AirPods Pro 3 的一个关键卖点。这款售价 249 美元的新款耳机上市,借助实时翻译功能,用户可以立即听到法语、德语、葡萄牙语和西班牙语被翻译成英文。实时翻译功能也将作为 AirPods 4 和 AirPods Pro 2 的更新版本发布。

当两个人戴着 AirPods 通话时,对话可以在每个用户的耳机内,同时进行双向翻译。在苹果的视频演示中,看起来就像两个人用不同的语言交谈。

分析师们兴奋地认为,这项功能可能标志着苹果人工智能战略向前迈进了一步。这项翻译功能需要搭配一部足够新的 iPhone,才能运行苹果的人工智能软件套件 Apple Intelligence。

DA Davidson 分析师吉尔·卢里亚 (Gil Luria)表示:“如果我们真的可以使用 AirPods 进行实时翻译,那么这个功能实际上会促使人们升级。”

随着人工智能能够像人类说话一样快速地翻译语言,翻译正在成为科技行业的一个主要战场。

但苹果并不是唯一一家。

拥挤的市场

过去一年,谷歌和 Meta 也发布了具有实时翻译功能的硬件产品。

谷歌 Pixel 10 手机拥有一项功能,可以在通话过程中将说话者说的话翻译成对方的语言。这项名为“语音翻译”的功能旨在保留说话者的语调。“语音翻译”通过软件更新在用户手机上推出。

在谷歌 8 月份的现场演示中,语音翻译功能成功将喜剧演员吉米·法伦的一句话翻译成西班牙语,而且听起来确实像这位喜剧演员说的。苹果的这项功能并没有试图模仿用户的声音。

与此同时,Meta 在 5 月份宣布,其雷朋 Meta 眼镜将能够使用该设备的扬声器翻译一个人用另一种语言说的话,并且对话的另一方将能够在用户手机上看到转录的翻译回复。

Meta 公司近月举行的产品主题演讲,预计将发布其下一代智能眼镜,该眼镜将在其中一个镜片中配备一个小型显示屏。目前尚不清楚 Meta 是否会发布更多翻译功能。

OpenAI 在 6 月份展示了 ChatGPT 的智能语音助手模式,其内置流畅翻译功能是众多功能之一。ChatGPT 与 Apple 的 Siri 集成,但不提供语音模式。OpenAI 计划在未来几年与 Apple 前设计大师 Jony Ive 合作推出新的硬件产品。

实时翻译的兴起也可能重塑整个行业。微软研究院 8 月份发布的一项研究发现,翻译人员是受人工智能威胁最大的职业,98% 的翻译工作与人工智能的工作内容重叠。

专用翻译器

在过去的几年中,许多专门设计的翻译设备进入了市场,利用全球高速蜂窝服务并改进在线翻译服务,生产出价格为几百美元内置翻译功能的冰球式设备或耳机。

“我喜欢苹果的做法,因为它确实表明了这个问题有多么紧迫,”日本 Pocketalk 公司美国总经理乔·米勒 (Joe Miller) 表示。Pocketalk 制造了一款售价 249 美元的翻译设备,可以在两个使用不同语言交谈的人之间,将他们的对话翻译成音频和文本。

据 Canalys 称,苹果仅在第一季度就出货了约 1800 万套无线耳机,因此该公司进入该市场,将使更广泛的客户群体,接触到翻译技术近年来取得的进步。

尽管苹果已进入该市场,但专用设备制造商表示,他们对准确性和语言知识的关注,将提供比新手机免费提供的翻译更好的翻译。

“我们确实聘请了语言学家,”波兰 Vasco Electronics 公司美国和加拿大区负责人亚历山大·阿尔斯基(Aleksander Alski)说道。该公司于今年 1 月发布了一款名为 E1 的翻译耳机,并计划推出一款能够模仿用户语音的型号,类似谷歌的功能。“我们将人工智能与人工输入相结合,正因如此,我们能够确保所有语言的翻译准确率都大幅提升。”

此外,还有主场优势。Vasco Electronics 最大的市场是欧洲,而苹果在其网站上表示,苹果的实时翻译功能不适用于欧盟用户。

一些科技公司推出的产品缺乏通用性,目前仅支持少数几种语言。苹果的语音助手功能目前仅支持 5 种语言,而 Pocketalk 则支持 95 种语言。

Pocketalk 的 Miller 认为,这项技术的潜力远不止于游客在法国点一杯葡萄酒。他表示,这项技术在学校和医院等工作场所的应用最为强大,因为这些场所需要的隐私和安全功能,远超苹果和谷歌所能提供的。

“这跟奢侈旅游和出行无关,”米勒说,“这关乎语言和摩擦的交汇,需要进行讨论。”

本文来自微信公众号“Edu指南”。

© 版权声明
THE END
喜欢就支持一下吧
点赞457 分享