创建语音角色
语音克隆
创建语音角色
上传音频文件克隆自定义语音模型
POST
创建语音角色
功能说明
通过上传 2-3 个样音文件,克隆出一个专属的自定义语音模型,可用于文本转语音(TTS)任务。请求方式
POST /v1/voice/model
数据格式:multipart/form-data
请求参数
必填字段
| 字段名 | 类型 | 说明 |
|---|---|---|
name | string | 语音模型名称(如 “私人助手”),用于后续 TTS 的 voice 参数 |
audio_files | file[] | 2-3 个 .wav 音频文件(采样率建议 16kHz 或 24kHz,单声道) |
reference_texts | string[] | 与 audio_files 一一对应的文本内容 |
可选字段
| 字段名 | 类型 | 说明 |
|---|---|---|
description | string | 模型描述 |
public | string | "true" 为公开,"false" 为私有(仅自己可用),默认为 "false" |
contact_email | string | 当 public=false 时必填,用于联系模型所有者 |
调用示例
响应成功
相关接口
Authorizations
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
Body
multipart/form-data