OpenAI 仅需其人工智能 15 秒的音频即可克隆一个声音-北京着陆云科技有限公司

OpenAI 仅需其人工智能 15 秒的音频即可克隆一个声音

2024-04-11 11:03:09行业资讯

随着科技日新月异的进步，一个不容忽视的社会问题是它对传统声优行业可能带来的颠覆性影响。声优们正面临日益增长的压力，即为了适应人工智能技术的发展趋势，可能会被要求签署转让其声音使用权的协议，允许AI基于他们的声音特征创建出逼真的合成语音。这种情况下的报酬模式极有可能低于声优亲自完成配音工作的收入水平，这无疑加剧了从业者的担忧。

然而，我们也应当看到这项技术所带来的积极应用场景。OpenAI指出，通过运用先进的人工智能技术，能够生成具有高度自然感和丰富情感表现力的声音，从而拓宽了服务于非阅读群体和儿童的阅读辅助工具的可能性，使其超越传统预设语音的局限。例如，可以创造出更加多元化的、富于感情色彩的朗读声音，为教育和娱乐领域带来全新的体验。

此外，这一技术还有望助力视听媒体内容的无障碍化传播。例如，实现实时的视频和音频节目翻译功能，诸如音乐流媒体巨头Spotify已开始测试此类功能，使全球用户能够跨越语言障碍，即时欣赏到原本的语言内容。

再者，在医疗健康领域，这一技术展现出巨大的人文关怀潜力。对于因病痛逐渐失去发声能力的患者而言，他们有望借助人工智能生成的个性化、仿真人声，继续维持与外界的有效沟通，极大地提升了生活质量。

OpenAI在其官方网站上展示了一系列AI生成音频与真实参照音频的对比示例，听众无不惊叹于二者间的惊人相似度。尽管如此，伴随着这些令人瞩目的技术创新，我们必须同步深入探讨技术伦理、知识产权以及社会公平等相关议题，确保技术进步既能造福人类，又能尊重并保障所有相关利益方的权利。