Custom Voices 可以生成什么内容？

Custom Voices 可以基于文本生成自然语音，并在获得授权的情况下创建可复用的声音档案。

Custom Voices 是否允许成人或 NSFW 内容？

不允许。Custom Voices 禁止 NSFW、成人、色情、违法、仇恨、欺诈和未经授权冒充他人的内容。

FAQ

关于创建声音、生成音频、使用积分和保护声音资产的快速说明。

最后更新：2026 年 5 月 21 日

你可以使用 MiMo 内置声音、设计声音或授权克隆声音，把文本生成口播音频。清晰脚本加明确风格指令，通常能得到更好的结果。

不可以。你只能上传并克隆自己拥有或已获得明确授权的声音。不要用他人声音进行冒充、欺诈、误导背书或欺骗性内容。

MiMo 克隆支持工作室中展示限制内的 MP3 或 WAV 样本。建议使用背景噪声少、音量稳定、只有一个说话人的干净语音。

常见原因是风格指令太模糊、脚本太长、标点不清楚，或同时要求了互相冲突的情绪。可以先生成短测试，只保留一个主要语气，并标出关键停顿。

创建声音和生成音频会根据所选工作流和模型消耗积分。如果服务商失败导致无法生成，系统会在适用场景下退款或避免扣费。

上传的声音样本和生成音频会作为私有工作区资产处理，并按照配置的存储服务和套餐保留规则保存。

可以。生成音频可以从工作区删除；在存储服务支持的情况下，也会同步删除对应文件。

把你的使用场景、声音模式和期望结果发给我们，支持团队可以给出更具体的建议。