Wispr Flow 平替, 这款开源中文语音助手,程序员真该试试,本地离线的中文语音输入神器来了(开源白嫖版)

简介: 小华同学推荐开源神器「蛐蛐QuQu」:本地语音识别+AI润色,中文友好、隐私安全,免订阅费替代Wispr Flow。支持通义千问等国产模型,程序员专属语音工作流,写代码、记会议、回邮件效率翻倍!

嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

                               

如果你经常写长邮件、记会议纪要、写代码注释,却越来越不想敲键盘,那语音输入 + AI 帮你整理文稿,真的能省掉一大截时间。 而这次这款叫 「蛐蛐(QuQu)」 的工具,主打就是:给中文用户的本地语音工作流——既替代 Wispr Flow,又不用交月费,还把隐私锁在你电脑里。

解决啥问题

它是一个 开源桌面应用,用本地语音识别模型 + 你配置的大语言模型,把你说的话实时转成文字,再自动帮你润色、改错、整理成更成型的内容。

它解决的核心问题是:让中文用户可以不用付订阅费,也不用把语音丢到云端,就能用上接近 Wispr Flow 体验的语音输入工作流——写文案、写代码、写邮件都能用。

功能亮点

核心功能

先说几个最硬核的点:

  • 本地中文语音识别:内置阿里巴巴的 FunASR Paraformer 模型,在你电脑本地跑,不依赖云端,既听得懂中文互联网的各种梗,又不用担心语音被上传。
  • 两段式引擎:ASR + LLM:先精准语音转文字,再交给大模型做智能优化,自动删掉“嗯、啊”这类口头禅,还能把你刚才说错又改口的话,直接变成一版干净结果。
  • 支持国产大模型生态:只要是兼容 OpenAI API 的服务都能接,README 里点名支持通义千问、Kimi、智谱 AI 等,国内用户延迟和费用都更友好。
  • 为开发者优化的语音输入:能正确识别 camelCasesnake_case 等编程命名,还能通过自定义指令,让输出更贴合「写代码 / 写文档 / 回邮件」不同场景。

体验细节

再说几个用起来比较爽的小细节:

  • 一键唤醒就能说:全局快捷键默认是 F2(可以根据自己习惯调),不管你当前在什么应用里,按一下就能开始说。
  • 实时识别 + 自动粘贴:本地 FunASR 实时转写,等 AI 处理完文本,会自动粘贴到你当前光标所在位置,感觉像多了个“语音键盘”。
  • 界面偏极客但清晰:技术栈是 React 19 + TypeScript + Tailwind + Electron,一眼就能看出信息分区:录音区、识别文本、优化结果、设置页,结构对程序员/独立开发者比较友好。
  • 本地配置,少云端依赖:AI 模型配置(API Key、Base URL、模型名)都在设置页里,保存在本地,不需要额外注册它自己的账号。

进阶玩法

如果你是喜欢折腾的那种人 :

  • 三种 Python 环境方案:支持用 uv 自动管理 Python(最省心)、用系统 Python + venv、或者用嵌入式 Python 环境做完全隔离,适合从“先玩玩”到“打包发给团队”各种场景。
  • AI 指令高度可定制:因为本质上是“本地 ASR + 你自己的 LLM 后端”,指令可以玩得很花——比如「帮我整理成工作汇报要点」「按 Markdown 生成接口文档」「转成英文邮件草稿」这类都能通过 prompt 定制。
  • 有官方微信群社区:README 里专门放了微信交流群二维码,可以直接拉你进群,向作者提问题、分享自己折腾出来的语音工作流。

总结

如果你是 重度中文写作 / 会议记录 / 程序员用户,又在意隐私、想摆脱 Wispr Flow 订阅费,非常值得现在就 clone 下来折腾;但如果你只是偶尔录个语音、又完全不想碰 Node.js 和 Python 环境,那这款工具目前上手门槛会有点高,可以先收藏名字等它后面有更傻瓜的安装包再说。

项目地址

https://github.com/yan5xu/ququ

你要是已经在用蛐蛐,也欢迎在评论区分享一下:你都给它配了哪些大模型 / 指令,语音工作流是怎么搭的?我可以挑几种玩法单独做一期对比。

相关文章
|
4月前
|
文字识别 自然语言处理 Java
一键搞定人脸识别、语音识别、车牌识别本地化!离线跑模型不装框架!!!
SmartJavaAI 是专为 Java 开发者打造的离线 AI 工具箱,集成人脸识别、OCR、语音识别、机器翻译等 20+ 主流模型,基于 DJL + JNI 封装,支持 Maven 一键引入,两行代码调用,让 Java 工程师无需掌握 Python/C++ 即可轻松接入 AI 能力,高效落地各类智能场景。
401 1
|
自然语言处理 语音技术 开发者
开源上新|FunASR多语言离线文件转写软件包
开源上新|FunASR多语言离线文件转写软件包
|
3月前
|
人工智能 前端开发 程序员
ReAct 框架如何帮 Agent 摆脱 “脑补幻觉”,学会理性决策?
Agent是2024年AI革命的核心,它让大模型从“能说”进化到“能做”。相比ChatGPT仅能回答问题,Agent可自主规划、调用工具、执行任务,真正实现自动化。比尔·盖茨与吴恩达纷纷点赞,认为其将重塑软件与工作方式。实在智能等企业正推动“数字员工”落地,一句话即可生成流程,降低自动化门槛。从财务对账到旅行规划,Agent已渗透各行各业。尽管面临成本、隐私与稳定性挑战,但多智能体协作正开启“虚拟团队”新未来。拥抱Agent,就是拥抱下一个技术时代。
212 0
|
2月前
|
人工智能 安全 应用服务中间件
首个 Clawdbot 全流程部署方案!真“AI 个人助理”来了!
GitHub爆火AI Agent Moltbot(原Clawdbot)上线即获7.6万+ Star!它能理解自然语言、调用工具、自动执行任务。阿里云轻量应用服务器推出“开箱即用”部署方案:预装环境、直连百炼大模型、支持钉钉等消息通道,5分钟一键启用,稳定、安全、低成本。
首个 Clawdbot 全流程部署方案!真“AI 个人助理”来了!
|
25天前
|
人工智能 安全 网络协议
从对话到帮我干活:2026年快速部署OpenClaw(Clawdbot)及配置OpenClaw Skills全攻略
如果说OpenClaw与大模型的组合赋予了AI助理“智能大脑”,那么Skills就是让它具备执行能力的“灵活双手”。作为OpenClaw生态的核心扩展模块,Skills通过标准化工具封装,让AI能够自主完成网页浏览、信息检索、邮件管理等实际任务,彻底打破“只会说不会做”的局限。2026年最新版OpenClaw已默认集成agent-browser v0.2.0浏览器插件,无需额外配置即可实现网页交互。本文将先详解阿里云OpenClaw(原Clawdbot)的快速部署步骤,再拆解默认Skills的实战场景与新技能安装方法,搭配可直接复用的指令与代码,让新手也能快速解锁AI自动化能力。
1336 0
|
2月前
|
人工智能 前端开发
Skills火爆之后,我收集并整理了最近全网火爆的Skills,拿走不谢~~~
小华同学带你解锁AI高效工作新方式!详解Agent Skills原理与实用工具,分享开源技能、设计系统、音视频处理等精选资源,助力技术人提升效率50%以上。
1951 2
|
3月前
|
SQL 自然语言处理 数据挖掘
没有 GPU 不用 LLM 能把 Text2SQL 做到什么程度?
润乾 NLQ 抛弃大模型与昂贵算力,专注构建规则驱动的 Text2SQL 引擎。通过“业务词典+语法手册”实现自然语言到 SQL 的精准编译,支持复杂多表关联、聚合计算与智能语义解析,在 BI 场景下达成高准确率、可解释、低成本的查询能力,展现确定性智能在企业级应用中的强大潜力。
|
7月前
|
人工智能 语音技术 Docker
揭秘8.3k star 开源神器 VoiceCraft 用AI革新有声内容创作,只需几秒录音
VoiceCraft 是一款开源语音编辑与文本转语音(TTS)工具,仅需几秒录音即可实现语音克隆、插入、删除、替换等操作,支持零样本编辑和高自然度语音生成。适用于播客、短视频、有声书等内容创作场景,具备本地部署能力,已在 GitHub 获得 8.3k 星标。
804 0
|
3月前
|
人工智能 缓存 监控
Coze AI 智能体工作流配置与实战全指南
Coze工作流让AI智能体从问答工具进化为复杂任务执行者。通过可视化编排,可构建如智能旅行规划等多步骤自动化系统,支持并行处理、条件分支与错误恢复。结合触发、LLM、工具与判断节点,实现高效、可维护的智能流程,助力AI成为真正的“数字同事”。
|
4月前
|
机器学习/深度学习 人工智能 前端开发
终端里的 AI 编程助手:OpenCode 使用指南
OpenCode 是开源的终端 AI 编码助手,支持 Claude、GPT-4 等模型,可在命令行完成代码编写、Bug 修复、项目重构。提供原生终端界面和上下文感知能力,适合全栈开发者和终端用户使用。
36622 10

热门文章

最新文章