找到了多个 **Kokoro 量化版本** 可以下载

简介: Kokoro语音合成模型提供多种量化版本:FP32(350MB)、FP16(169MB)、INT8/Q8(约100–103MB)、Q4及AMD NPU优化版,适配桌面、移动端、浏览器与嵌入式设备。支持GitHub、HuggingFace、npm多源下载,兼顾体积与性能。

根据我的搜索,找到了多个 Kokoro 量化版本 可以下载:


🔢 Kokoro 量化版本下载指引

📊 量化版本对比

版本 格式 大小 下载链接
FP32 原版 fp32 ~350MB GitHub Releases
FP16 半精度 fp16 ~169MB thewh1teagle/kokoro-onnx
INT8 量化 int8 ~103MB 见下方
Q8 量化 q8 ~100MB kokoro-js

方式一:thewh1teagle/kokoro-onnx (推荐)

这个项目提供了 fp16 量化版本,体积更小,性能更好:

# FP16 版本 (~169MB) - 推荐用于移动设备
wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/v1.0/kokoro-v1.0.fp16.onnx

# FP32 版本 (~310MB)
wget https://github.com/thewh1teagle/kokoro-onnx/releases/download/v1.0/kokoro-v1.0.onnx

GitHub Releases 页面: https://github.com/thewh1teagle/kokoro-onnx/releases


方式二:NeuML/kokoro-fp16-onnx (HuggingFace)

HuggingFace 上的 fp16 量化版本:

# 使用 huggingface-cli 下载
huggingface-cli download NeuML/kokoro-fp16-onnx --local-dir ./kokoro-fp16

# 或使用 Python
from huggingface_hub import snapshot_download
snapshot_download("NeuML/kokoro-fp16-onnx", local_dir="./kokoro-fp16")

HuggingFace 链接: https://huggingface.co/NeuML/kokoro-fp16-onnx


方式三:kokoro-js npm 包 (浏览器专用)

适用于浏览器端,支持多种量化格式:

npm install kokoro-js

使用示例:

import {
    KokoroTTS } from 'kokoro-js';

// 选择量化精度
const tts = await KokoroTTS.from_pretrained(
  'onnx-community/Kokoro-82M-v1.0-ONNX',
  {
    
    dtype: 'q8'  // 可选: 'fp32', 'fp16', 'q8', 'q4'
  }
);

// 生成语音
const audio = await tts.generate('Hello world!', {
    voice: 'af_sky' });

方式四:INT8 量化版本 (最小体积)

根据 sherpa-onnx 的 Issue #2374,INT8 版本体积约 103MB

sherpa-onnx 官方 INT8 版本

sherpa-onnx 提供了 kokoro.int8 版本,可在移动端使用:

# 如果 sherpa-onnx 有 int8 版本发布,可从以下链接下载
# 注意:具体链接需要查看最新 releases
wget https://github.com/k2-fsa/sherpa-onnx/releases/download/tts-models/kokoro-en-v0_19.int8.tar.bz2

iPhone 15 性能对比 (来自 Issue)

模型 包大小 性能
kokoro (fp32) 319 MB 基准
kokoro.int8 103 MB 略低于预期

方式五:AMD NPU 优化版本

针对 AMD Ryzen AI 硬件的 INT8 量化版本:

# 下载 NPU 优化版本
huggingface-cli download magicunicorn/kokoro-npu-quantized --local-dir ./kokoro-npu

包含文件:

  • kokoro-npu-quantized-int8.onnx (121.9 MB)

HuggingFace 链接: https://huggingface.co/magicunicorn/kokoro-npu-quantized


方式六:onnx-community 量化版本

HuggingFace onnx-community 提供的量化版本,支持多种精度:

# 下载所有量化版本
huggingface-cli download onnx-community/Kokoro-82M-v1.0-ONNX --local-dir ./kokoro-quantized

该仓库包含:

  • onnx/model_fp16.onnx - FP16 版本
  • onnx/model_q8.onnx - INT8 量化版本
  • onnx/model_q4.onnx - INT4 量化版本

📥 完整下载脚本

#!/bin/bash
# Kokoro 量化版本下载脚本

mkdir -p kokoro-models
cd kokoro-models

echo "=== 下载 FP16 版本 (~169MB) ==="
wget -q --show-progress \
  https://github.com/thewh1teagle/kokoro-onnx/releases/download/v1.0/kokoro-v1.0.fp16.onnx

echo "=== 下载 Q8 量化版本 (约100MB) ==="
# 使用 huggingface_hub
pip install huggingface_hub -q
python3 -c "
from huggingface_hub import hf_hub_download
hf_hub_download(
    repo_id='onnx-community/Kokoro-82M-v1.0-ONNX',
    filename='onnx/model_q8.onnx',
    local_dir='.'
)
"

echo "=== 下载完成! ==="
ls -lh *.onnx

🎯 推荐选择

使用场景 推荐版本
桌面/服务器 FP32 或 FP16
移动设备 (手机) INT8 / Q8
浏览器 (WebAssembly) Q8 或 Q4
AMD Ryzen AI NPU INT8 优化版
树莓派/嵌入式 INT8

🔗 汇总链接

资源 链接
thewh1teagle/kokoro-onnx https://github.com/thewh1teagle/kokoro-onnx/releases
NeuML/kokoro-fp16-onnx https://huggingface.co/NeuML/kokoro-fp16-onnx
onnx-community/Kokoro-82M-ONNX https://huggingface.co/onnx-community/Kokoro-82M-ONNX
onnx-community/Kokoro-82M-v1.0-ONNX https://huggingface.co/onnx-community/Kokoro-82M-v1.0-ONNX
magicunicorn/kokoro-npu-quantized https://huggingface.co/magicunicorn/kokoro-npu-quantized
kokoro-js (npm) https://www.npmjs.com/package/kokoro-js
相关文章
|
1月前
|
达摩院 运维 Linux
RISC-V 基金会 Data Center SIG 第七次会议圆满结束,研讨硬件加速机制
围绕“为何需要 TG、要做哪些规范工作、如何证明可行(PoC)以及如何组织生态协作”等关键点展开讨论。
|
1月前
|
人工智能 自然语言处理 API
2026年OpenClaw(Clawdbot)零基础接入WhatsApp保姆级教程
在2026年AI自动化办公与跨境沟通需求双重爆发的当下,OpenClaw(原Clawdbot、曾用名Moltbot)凭借“自然语言驱动、全场景任务自动化、多终端无缝适配”的核心优势,成为个人办公提效、跨境团队协同、轻量客户服务的优选工具。作为GitHub星标量超19万的开源AI自动化代理平台,它打破了传统AI仅能对话的局限,真正实现“能听指令、能做实事”——无论是文档生成、日程提醒、文件整理,还是联网搜索、简单代码开发、跨工具协同,只需一句口语化指令,就能自动完成全流程操作,无需手动干预,完美适配现代办公与跨境沟通的高效需求。
732 19
|
7月前
|
人工智能 IDE 开发工具
通义灵码 AI IDE使用体验(3)项目优化及bug修复
本文介绍了使用通义灵码 AI IDE进行项目重构与优化的全过程,涵盖页面调整、UI更新、功能修复等内容,并展示了多次优化后的成果与仍存在的问题。
603 0
|
1月前
|
人工智能 语音技术 云计算
书尖 AI 功能实测|基于阿里云 AI 技术,与微信读书阅读体验对比
本文深度实测阿里云赋能的智能阅读工具“书尖AI”,对比微信读书,客观呈现其1.2亿册书库、双人AI播客听书、2分钟极速解读等核心优势,展现高效轻松的智能阅读新体验。(239字)
|
开发工具 Android开发
Appium之获取app的package和activity以及UI界面定位方法
一、获取APP的package(包名)和activity 在使用android自动化测试工具monkeyrunner和appium中启动应用时,需要填写被测程序的包名和启动的Activity,以下有几种查看应用包名package和入口activity名称的方法: 1.
3372 0
|
机器学习/深度学习 算法 计算机视觉
yolov8人脸识别-脸部关键点检测(代码+原理)
yolov8人脸识别-脸部关键点检测(代码+原理)
|
22天前
|
人工智能 监控 安全
理性看待58倍收益!OpenClaw阿里云及本地集成 AI Agent 量化交易机器人保姆级策略教程
50美元启动资金,48小时滚增至2980美元——OpenClaw在Polymarket预测市场的实战案例,让不少人误以为“AI全自动炒股神话”降临。但深入拆解后会发现,这并非靠运气预测市场方向,而是利用预言机数据延迟的结构性套利:在中心化交易所价格变动与链上合约定价修正的2-5分钟时间差内,捕捉定价偏差获利。
553 5
|
22天前
|
人工智能 自然语言处理 API
AI漫剧零代码制作喂饭级教程:OpenClaw阿里云/本地部署+Seed2.0 Skills 实战指南
无需专业剪辑技术、不用复杂软件操作,甚至不用手动绘制分镜——借助OpenClaw与Seed2.0 Skills的组合,2026年普通人也能零门槛制作AI漫剧。从剧本创作、分镜设计到视频合成,全程AI自动化完成,手机端也能快速产出高质量作品。开源项目「AI漫导」(director_ai)已收获1.1k Star,其核心逻辑正是通过OpenClaw集成Seed2.0漫剧专属技能,让漫剧制作从“专业门槛”变为“人人可玩”。
1286 2
|
机器人 Shell Python
ROS2教程05 ROS2服务
这篇文章是关于ROS2(Robot Operating System 2)服务的教程,涵盖了服务的概念、特性、命令行工具的使用,以及如何编写服务的服务器和客户端代码,并提供了测试服务通信机制的示例。
649 4
ROS2教程05 ROS2服务