FAQ

Custom Voices 常见问题

关于创建声音、生成音频、使用积分和保护声音资产的快速说明。

最后更新:2026 年 5 月 21 日

我可以生成什么类型的音频?

你可以使用 MiMo 内置声音、设计声音或授权克隆声音,把文本生成口播音频。清晰脚本加明确风格指令,通常能得到更好的结果。

我可以克隆任何声音吗?

不可以。你只能上传并克隆自己拥有或已获得明确授权的声音。不要用他人声音进行冒充、欺诈、误导背书或欺骗性内容。

什么样的样本适合声音克隆?

MiMo 克隆支持工作室中展示限制内的 MP3 或 WAV 样本。建议使用背景噪声少、音量稳定、只有一个说话人的干净语音。

为什么生成音频和预期不一样?

常见原因是风格指令太模糊、脚本太长、标点不清楚,或同时要求了互相冲突的情绪。可以先生成短测试,只保留一个主要语气,并标出关键停顿。

积分如何消耗?

创建声音和生成音频会根据所选工作流和模型消耗积分。如果服务商失败导致无法生成,系统会在适用场景下退款或避免扣费。

我的声音样本和生成音频存在哪里?

上传的声音样本和生成音频会作为私有工作区资产处理,并按照配置的存储服务和套餐保留规则保存。

我可以删除生成音频吗?

可以。生成音频可以从工作区删除;在存储服务支持的情况下,也会同步删除对应文件。

还需要帮助?

把你的使用场景、声音模式和期望结果发给我们,支持团队可以给出更具体的建议。