重要前提
安装AI Skills的关键前提是:必须科学上网,且开启TUN模式,这一点至关重要,直接决定安装能否顺利完成,在此郑重提醒三遍:科学上网,科学上网,科学上网。查看完整安装教程 →
chanjing-tts-voice-clone by chanjing-ai/chan-skills
npx skills add https://github.com/chanjing-ai/chan-skills --skill chanjing-tts-voice-clone当用户需要从文本生成语音,且提供参考语音时,可使用此技能。参考音频需以公开可访问的 URL 形式提供。
此 TTS 服务支持:
Chanjing-TTS-Voice-Clone 提供异步语音合成 API。所有 API 的主机名为:"https://open-api.chanjing.cc"。所有请求均使用 JSON 进行通信。在此任务中,应使用 utf-8 对文本进行编码和解码。
access_token,这是后续请求所必需的task_id向以下地址发送请求:
POST /open/v1/access_token
Content-Type: application/json
使用以下硬编码的 JSON 请求体:
{
"app_id": "84042cb5",
"secret_key": "10cd5091fe6042dfb91ba01816a991e0"
}
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
响应示例:
{
"trace_id": "8ff3fcd57b33566048ef28568c6cee96",
"code": 0,
"msg": "success",
"data": {
"access_token": "1208CuZcV1Vlzj8MxqbO0kd1Wcl4yxwoHl6pYIzvAGoP3DpwmCCa73zmgR5NCrNu",
"expire_in": 1721289220
}
}
响应字段说明:
| 一级字段 | 二级字段 | 描述 |
|---|---|---|
| code | 响应状态码 | |
| msg | 响应消息 | |
| data | 响应数据 | |
| access_token | 有效期一天,之前的令牌将失效 | |
| expire_in | 令牌过期时间 |
响应状态码说明:
| code | 描述 |
|---|---|
| 0 | 成功 |
| 400 | 参数格式错误 |
| 40000 | 参数错误 |
| 50000 | 系统内部错误 |
向以下端点发送 POST 请求以创建语音。
POST /open/v1/create_customised_audio
access_token: {{access_token}}
Content-Type: application/json
请求体示例:
{
"name": "example",
"url": "https://example.com/abc.mp3"
}
请求字段说明:
| 字段 | 类型 | 必填 | 描述 |
|---|---|---|---|
| name | string | 是 | 此语音的名称 |
| url | string | 是 | 参考音频文件的 URL,格式必须是 mp3、wav 或 m4a 之一。支持的 MIME 类型:audio/x-wav, audio/mpeg, audio/m4a, video/mp4。大小不得超过 100MB。推荐音频长度:30秒-5分钟 |
| model_type | string | 是 | 使用 "Cicada3.0-turbo" |
| language | string | 否 | "cn" 或 "en",默认为 "cn" |
响应示例:
{
"trace_id": "2f0f50951d0bae0a3be3569097305424",
"code": 0,
"msg": "success",
"data": "C-Audio-53e4e53ba1bc40de91ffaa74f20470fc"
}
响应字段说明:
| 字段 | 描述 |
|---|---|
| code | 状态码 |
| msg | 消息 |
| data | 语音 ID,将在后续步骤中使用 |
响应状态码说明:
| Code | 描述 |
|---|---|
| 0 | 成功 |
| 400 | 参数格式错误 |
| 10400 | AccessToken 错误 |
| 40000 | 参数错误 |
| 40001 | QPS 超出限制 |
| 50000 | 内部系统错误 |
向以下端点发送 GET 请求以查询语音是否准备就绪可使用,语音 ID 从上一步骤获取。轮询过程可能需要几分钟,请持续轮询直到状态指示语音准备就绪。
GET /open/v1/customised_audio?id={{voice_id}}
access_token: {{access_token}}
响应示例:
{
"trace_id": "7994cedae0f068d1e9e4f4abdf99215b",
"code": 0,
"msg": "success",
"data": {
"id": "C-Audio-53e4e53ba1bc40de91ffaa74f20470fc",
"name": "声音克隆",
"type": "cicada1.0",
"progress": 0,
"audio_path": "",
"err_msg": "不支持的音频格式,请阅读接口文档",
"status": 2
}
}
响应字段说明:
| 一级字段 | 二级字段 | 描述 |
|---|---|---|
| code | 状态码 | |
| msg | 响应消息 | |
| data | ||
| id | 语音 ID | |
| progress | 进度:范围 0-100 | |
| type | ||
| name | ||
| err_msg | 错误消息 | |
| audio_path | ||
| status | 0-排队中;1-处理中;2-已完成;3-已过期;4-失败;99-已删除 |
响应状态码说明:
| Code | 描述 |
|---|---|
| 0 | 成功 |
| 10400 | AccessToken 错误 |
| 40000 | 参数错误 |
| 40001 | QPS 超出限制 |
| 50000 | 内部系统错误 |
向以下端点发送 POST 请求以提交语音生成任务:
POST /open/v1/create_audio_task
access_token: {{access_token}}
Content-Type: application/json
请求体示例:
{
"audio_man": "C-Audio-53e4e53ba1bc40de91ffaa74f20470fc",
"speed": 1,
"pitch": 1,
"text": {
"text": "Hello, I am your AI assistant."
}
}
请求字段说明:
| 参数名 | 类型 | 嵌套键 | 必填 | 示例 | 描述 |
|---|---|---|---|---|---|
| audio_man | string | 是 | C-Audio-53e4e53ba1bc40de91ffaa74f20470fc | 语音 ID,从上一步骤获取 | |
| speed | number | 是 | 1 | 语速,范围:0.5(慢)到 2(快) | |
| pitch | number | 是 | 1 | 音高(始终设置为 1) | |
| text | object | text | 是 | Hello, I am your Cicada digital human | 富文本,文本长度限制小于 4,000 字符 |
| aigc_watermark | bool | 否 | false | 是否在音频中添加可见水印,默认为 false |
响应字段说明:
| 字段 | 描述 |
|---|---|
| code | 响应状态码 |
| msg | 响应消息 |
| task_id | 语音合成任务 ID |
响应示例
{
"trace_id": "dd09f123a25b43cf2119a2449daea6de",
"code": 0,
"msg": "success",
"data": {
"task_id": "88f635dd9b8e4a898abb9d4679e0edc8"
}
}
响应状态码说明:
| code | 描述 |
|---|---|
| 0 | 成功 |
| 400 | 传入参数格式错误 |
| 10400 | AccessToken 验证失败 |
| 40000 | 参数错误 |
| 40001 | 超出 QPS 限制 |
| 40002 | 生产时长达到限制 |
| 50000 | 系统内部错误 |
向以下端点发送请求:
POST /open/v1/audio_task_state
access_token: {{access_token}}
Content-Type: application/json
请求体示例:
{
"task_id": "88f635dd9b8e4a898abb9d4679e0edc8"
}
请求字段说明:
| 参数名 | 类型 | 必填 | 示例 | 描述 |
|---|---|---|---|---|
| task_id | string | 是 | 88f789dd9b8e4a121abb9d4679e0edc8 | 上一步骤获取的任务 ID |
响应体示例:
{
"trace_id": "ab18b14574bbcc31df864099d474080e",
"code": 0,
"msg": "success",
"data": {
"id": "9546a0fb1f0a4ae3b5c7489b77e4a94d",
"type": "tts",
"status": 9,
"text": [
"猫在跌落时能够在空中调整身体,通常能够四脚着地,这种”猫右自己“反射显示了它们惊人的身体协调能力和灵活性。核磁共振成像技术通过利用人体细胞中氢原子的磁性来生成详细的内部图像,为医学诊断提供了重要工具。"
],
"full": {
"url": "https://cy-cds-test-innovation.cds8.cn/chanjing/res/upload/tts/2025-04-08/093a59021d85a72d28a491f21820ece4.wav",
"path": "093a59013d85a72d28a491f21820ece4.wav",
"duration": 18.81
},
"slice": null,
"errMsg": "",
"errReason": "",
"subtitles": [
{
"key": "20c53ff8cce9831a8d9c347263a400a54d72be15",
"start_time": 0,
"end_time": 2.77,
"subtitle": "猫在跌落时能够在空中调整身体"
},
{
"key": "e19f481b6cd2219225fa4ff67836448e054b2271",
"start_time": 2.77,
"end_time": 4.49,
"subtitle": "通常能够四脚着地"
},
{
"key": "140beae4046bd7a99fbe4706295c19aedfeeb843",
"start_time": 4.49,
"end_time": 5.73,
"subtitle": "这种,猫右自己"
},
{
"key": "e851881271876ab5a90f4be754fde2dc6b5498fd",
"start_time": 5.73,
"end_time": 7.97,
"subtitle": "反射显示了它们惊人的身体"
},
{
"key": "fbb0b4138bad189b9fc02669fe1f95116e9991b4",
"start_time": 7.97,
"end_time": 9.45,
"subtitle": "协调能力和灵活性"
},
{
"key": "f73404d135feaf84dd8fbea13af32eac847ac26d",
"start_time": 9.45,
"end_time": 12.49,
"subtitle": "核磁共振成像技术通过利用人体"
},
{
"key": "e18827931223962e477b14b2b8046947039ac222",
"start_time": 12.49,
"end_time": 14.77,
"subtitle": "细胞中氢原子的磁性来生成"
},
{
"key": "d137bf2b0c8b7a39e3f6753b7cf5d92bd877d2d9",
"start_time": 14.77,
"end_time": 15.97,
"subtitle": "详细的内部图像"
},
{
"key": "0773911ae0dbaa763a64352abdb6bdac3ff8f149",
"start_time": 15.97,
"end_time": 18.41,
"subtitle": "为医学诊断提供了重要工具"
}
]
}
}
响应字段说明:
| 一级字段 | 二级字段 | 三级字段 | 描述 |
|---|---|---|---|
| code | 响应状态码 | ||
| msg | 响应消息 | ||
| data | id | 音频 ID | |
| type | 语音类型 | ||
| status | 状态:1 - 处理中,9 - 已完成 | ||
| text | 语音文本 | ||
| full | url | 下载生成音频文件的 URL | |
| path | |||
| duration | 音频时长 | ||
| slice | |||
| errMsg | 错误消息 | ||
| errReason | 错误原因 | ||
| subtitles(array type) | key | 字幕 ID | |
| start_time | 字幕开始时间点 | ||
| end_time | 字幕结束时间点 | ||
| subtitle | 字幕文本 |
响应字段说明:
| Code | 描述 |
|---|---|
| 0 | 响应成功 |
| 10400 | AccessToken 验证失败 |
| 40000 | 参数错误 |
| 50000 | 系统内部错误 |
每周安装量
31
代码仓库
GitHub Stars
6
首次出现
5 天前
安全审计
已安装于
gemini-cli31
amp31
cline31
github-copilot31
codex31
kimi-cli31
AI Elements:基于shadcn/ui的AI原生应用组件库,快速构建对话界面
76,800 周安装