本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://mzwhys.cn/wiki/202506-1178.html
看来2023年是人工智能年度(AI),微软是最新一家热衷于采取行动的公司。
该公司的研究人员发布了一篇论文,详细介绍了一项新技术 ,该技术将在文本到语音工具中向前迈进。
该论文的摘要解释了该技术如何被称为VALL-E,“出现在文本学习能力中,可用于合成高质量的个性化语音 ,仅使用3秒的注册录音,将一位看不见的说话者作为声音提示 。”
你可能喜欢
什么是playai:我们对这个文本到语音,语音关闭平台的了解
我使用免费的AI应用程序在几秒钟内克隆了声音 ,我们真的需要谈论语音综合
什么是休ume:将情感理解带入AI生成的声音
Microsoft vall-e
这意味着简单的形式是,该工具现在可以通过Meta&rsquo的Encodec来分解使人的声音,包括音素和声音代码提示 ,并产生一种声音,并产生一种更紧密地模仿他们的人在样本语音录制的三秒钟之外可能听起来像是什么样的声音。通过分析超过60,000小时,VALL-E的早期阶段已成为可能。价值英语语言录音 。
GitHub邮政曲面表面许多示例 ,包括如何使用该技术,包括保持情感提示甚至环境效果,例如典型的电话交谈的断开声音。阅读更多
>这些是最好的在线协作工具
> OpenAI揭示了3D模型的AI工具
>黑客可以利用chatgpt攻击网络
虽然简洁,但提到了这种文本到语音工具的潜在影响 ,在AI发现我们只梦到的(或有噩梦)的时代,这越来越重要。
实际上,允许某些事物的允许(例如使用基于电话的语音识别身份验证的银行数量)可能会引起任何数量的问题 ,这会变得更糟 。
你是专业人士吗?订阅我们的新闻通讯
注册techradar Pro新闻通讯,以获取您的业务成功所需的所有首选,意见 ,功能和指导!取得成功!请与我联系我们的其他未来品牌的新闻,并代表我们值得信赖的合作伙伴或Sponsorsby提交您的信息,您同意您同意的条款和隐私政策 ,并年龄在16岁或超过16岁之间。
结论指出,VALL-E“可能在滥用模型时承担潜在的风险,例如欺骗语音识别或假冒特定的演讲者。ARSTechnica的Benj Edwards还指出 ,Microsoft尚未分享该项目的代码,以便其他任何人都在尝试相反的言论 。
赞 (7)
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《微软有一个新的文本到语音AI工具,可以使我们惊叹不已》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览: 看来2023年是人工智能年度(AI),微软是最新一家热衷于采取行动的公司。 该公司的研究人员发布了一篇论文,详细介绍了一项新技术,该技术将在文本到语音工具中向前迈...