MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计,这标志着语音合成技术的一次重大突破。自5月发布以来,MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一,并赢得了用户的广泛认可。迄今为止,Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音,与全球30多个国家的用户建立了合作。
Voice Design 功能允许用户通过自然语言描述自己理想中的音色,从而实现对语音的多维度精准控制,甚至可以生成一些世界上从未存在过的音色。这项新功能与 Speech-02语音模型紧密结合,用户在进行文字转语音时,能够真正实现 “所需即所得”。用户可以自由选择 “任意语言 × 任意口音 × 任意音色”,进行全自定义的无限组合。
通过简单的文本描述,用户可以得到不同风格的 AI 助手语音。例如,用户可以请求一个积极鼓励的 AI 助手,语调活泼,韵律变化丰富,来表达关心和支持;或者选择一个严厉的 AI 助手,快速的女声带有命令和责备的语气;还可以让助手以小心翼翼的语气表达歉意。
Voice Design 功能解决了语音合成领域的两个主要挑战。首先,现有的音色库虽然质量高,但通常难以满足用户在特定场景下的细分需求;其次,尽管复刻音色可以实现 “所听即所得”,用户为了获得满意的效果通常需要花费大量时间准备高质量的输入素材,还可能面临版权风险。
通过 Voice Design,用户只需描述他们对音色的需求,模型便会自动将其拆解为音色相关的描述信息,生成新的音色编码。用户还可以像抽卡一样多次尝试,轻松获得理想的专属音色,并将其存储用于后续音频创作。
MiniMax 始终致力于降低全球用户使用 AI 技术的门槛,让不同语言的用户都能体验到语音模型带来的价值。立即打开 MiniMax Audio,体验这一创新功能吧!
国内版:minimaxi.com/audio
海外版:minimax.io/audio
划重点:
🎤 MiniMax 推出 Voice Design 音色设计功能,用户可通过自然语言生成个性化语音。
🌍 该功能与 Speech-02模型结合,支持 “任意语言 × 任意口音 × 任意音色” 的自定义组合。
⚙️ Voice Design 解决了语音合成中的音色匹配难题,用户只需简单描述即可获得满意的音色。