专注试管助孕服务,20年我们始终如一
包成功零风险,8000多个家庭共同选择
精选国内顶尖生殖中心,成功率有保障
13971193333
阅读:7 发布时间:2023-08-23 10:21:51
(图片来源@视觉中国)钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能(AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。
同时,Meta还公布了新的开源翻译数据集 SeamlessAlign,将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐,教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。
Meta表示,SeamlessM4T将与SeamlessAlign一同开源SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”据悉,作为最早投资AI的大型科技企业之一,Meta于2013年成立了 AI 基础研究实验室,聘请了AI领域的顶级学者,有大量社交与元宇宙算法,推出Pytorch框架、Zion等软硬件产品。
不过,虽然Meta在AI领域也取得了一些进展,但它落后于OpenAI、微软、谷歌等公司随着ChatGPT风靡全球,Meta AI团队正在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。
另外在今年7月,Meta还发布开源对话大模型Llama 2,引发广泛讨论和关注此次公布的SeamlessM4T,建立在Meta AI翻译模型的技术能力基础上,并重新设计Fairseq序列建模工具包,以创建更轻量级的模型和处理更多信息。
Meta表示,SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译对于安全性和脱敏性,
Meta表示,在开发SeamlessM4T时,团队构建了一个可以识别敏感词系统,目标是能够过滤了训练数据中不平衡的数据信息,从而检测和输出正确的翻译内容而且,Meta研究人员还尝试清理误译一些脏话的数据集,以便更准确地检测何时使用。
Meta研究科学家负责人Paco Guzman表示,SeamlessM4T的一大突破是它不依赖中间模型来产生结果,这使得它更加灵活,甚至支持动态更改语言这将促进更多人使用其进行日程对话不过,Meta建议不要使用SeamlessM4T进行长篇翻译,政府专用的认证翻译,以及不鼓励出于医疗或法律目的部署该模型,原因或与专业领域的翻译准确度有关。
科技网站《对话》(theconversation)最近表示,AI 翻译有许多缺陷,包括不同形式的性别错误和偏见、语音识别算法偏差等据报道称,Meta后续将把这些翻译和转录方面的 AI 进展,整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。
(本文首发钛媒体App,作者|林志佳,编辑|马金男)
解放军东部战区19日在台岛周边组织海空联合战备警巡,举行海空···
【粉丝投稿】王先生近期身体有些不适,从网络上查找资料后决定尝···
7月20日,知名影视演员李勤勤通过社交账号更新了一段视频,视···
我国的手工业早在百年前的清朝末年,就因为世界经济的冲击而一蹶···
每个人都曾梦想仗剑走天涯,但大部分人都悄然无踪影少有人能直面···
作者:北极猪前几天秋天的第二个节气处暑过了,也宣告了今年夏天···
来源:经济参考报最新公布的关键经济数据显示,欧洲服务业意外萎···
图①:航拍位于龙南市关西镇的西昌围施鸿雄摄 图②:在龙南市杨···
北京首钢男篮在21日更新了2023-24赛季球员注册名单,其···
作者:Sunnice 前段时间和朋友聚会时喝到了这款范佳乐教···