推广 热搜： page 关键词红书链接搜索获取哪些数据数据分析服务

OpenAI展示新音频工具可朗读文本并模仿声音

日期：2025-01-02 作者：5n535 caijiyuan 评论：0 移动：https://sicmodule.kub2b.com/mobile/news/14906.html

核心提示：OpenAI公布了一项功能的早期结果，该功能可用令人信服的人声朗读文字。这彰显了人工智能的一个新领域，并引发了关于深度伪造的担

OpenAI公布了一项功能的早期结果，该功能可用令人信服的人声朗读文字。这彰显了人工智能的一个新领域，并引发了关于深度伪造的担忧。

该公司分享了名为“语音引擎”（Voice Engine）的文本转语音模型小规模试用的早期演示和用例，据发言人介绍，目前约有10家开发商可使用该模型。OpenAI在3月早些时候向记者介绍了这一功能，但决定暂不大规模发布。

OpenAI的发言人说该公司在收到政策制定者、行业专家、教育工作者和创意人士等利益相关方的反馈后决定缩减发布规模。据早前的新闻发布会介绍，该公司原本计划通过申请流程向多达100家开发商发布该工具。

其他AI技术已经在某些情境下被用来伪造声音。今年1月，一通自称乔·拜登（Joe Biden）总统打来的以假乱真的电话呼吁新罕布什尔州居民不要在初选中投票，这一事件在全球关键选举前加剧了对AI的恐惧。

与OpenAI过去生成音频的功能不同，语音引擎可以创建听起来像具体个人的声音，并完整呈现特有的语调和语气。该软件只需要一段15秒的录音，即可重现一个人的声音。

“只要音频设置得当，基本就能得出人类水准的声音。”OpenAI产品负责人杰夫·哈里斯（Jeff Harris）说，“这种技术质量非常了不起。”但哈里斯也表示，“准确模仿人类语音的能力显然存在很多安全上的不确定性。”

非营利性医疗系统Lifespan旗下的Norman Prince Neurosciences Institute是OpenAI目前的开发合作伙伴之一，该机构正在利用此项技术帮助患者恢复声音。例如，据OpenAI的文章，该工具被用于恢复一位因脑瘤失去清晰说话能力的年轻患者的声音，方法是复制她此前为一个学校项目录制的发言。

OpenAI的自定义语音模型还可将生成的音频翻译成不同语言。这对于音频行业公司非常有用，比如Spotify Technology SA。Spotify已经在自己的试点计划用该技术来翻译莱克斯·弗里德曼（Lex Fridman）等热门主持人的节目。OpenAI还宣传了该技术的其他有益应用，例如为儿童教育内容创建更多样化的声音。

在测试计划中，OpenAI要求合作伙伴同意其使用政策，即在使用原始声音前征得声音主人的同意，并告知听众他们听到的是AI生成的声音。该公司还加入了听不见的音频水印，以判断哪些音频由其工具创建。

OpenAI表示在决定是否大范围发布该功能前，正在征求外部专家的反馈。该公司在博文中表示：“让全球人民了解这项技术的发展方向至关重要，不论我们最终是否亲自广泛部署它。”

本文地址：https://sicmodule.kub2b.com/news/14906.html 企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

更多>同类最新资讯

0 条相关评论

文章列表

相关文章

先一步开启“年味”：鲸灵羽绒季&年货节刷新品牌战绩

最新动态

推荐图文

最新资讯

点击排行

• 30米内可穿墙？明基W1075无线影院体验手机端「	• 120W神仙秒充1亿像素手机「120W神仙秒充」
• 2024年折叠屏降温 AI加速渗透手机传音OV竞逐全	• 2022年三星与华为最新款手机上市，科技新篇章的
• ## 标题，iPhone恢复出厂设置后的数据恢复指南	• 盘点2024西安荣耀时刻！“西”引力爆表！
• 惠山街道2024年工作总结和2025年工作思路	• 天气｜明日“小寒”！最冷“三九”就要来！
• 枝江市2025年“十大民生项目”公布！	• 原来是这样｜又上热搜！最近很火的“煮苹果水

OpenAI展示新音频工具 可朗读文本并模仿声音

OpenAI展示新音频工具可朗读文本并模仿声音