几百次迭代,只为更流畅的语音输入体验。
下面每一段都在 Mac 上实录,未剪接——你看到的就是它真实的样子。
点右 ⌥ 说话,录音中切右 ⌘ 让 AI 整理成清单,再说一句就重新排序。
Why SpellKey
市面上智能语音输入的那些老问题,SpellKey 基本都躲开了。
01 纯本地语音引擎和模型
录音、识别、AI 整理全在这台 Mac 上完成,一个字节都不出本机。不上传、不落盘,说什么只有你自己知道。
02 全程本地运行
飞机上、地铁里、信号差——想记就记,语音转写完全不靠网络,一个字都不会卡住。
03 本地推理够快
不用上传、排队、等回传,本地引擎最快约 0.06 秒落字;录音时灵动岛还能逐字实时预览。
04 高度可调 · 为你而配
语音引擎、快捷键、AI 模型、终端 Agent CLI…几乎每个环节都能按你的习惯配。尤其合 Vibe Coding 的人胃口——选中文件说一句,Agent 直接开干,顺手得像多了只手。
→ 全程本地、一次买断——不联网、不上传、不限量。
Speech engines
不用联网、不用注册,语音转写一个字都不往外传。轻量、均衡、高精度,按需选就行。
228MB
SenseVoice-Small
sherpa-onnx · 默认捆绑装完就有的默认引擎,约 0.06 秒出字,中文优先,内存占用最小。逐帧识别(CTC),录音时能在灵动岛里逐字实时预览。中 / 英 / 日 / 韩 / 粤 都认得,日常够用了。
740MB
FireRedASR2-CTC
sherpa-onnx · 均衡更稳的一档。长录音不容易飘,家里人说话带口音、方言重也扁得住。同样是逐帧识别,保留灵动岛里的逐字实时预览。速度和精度之间的平衡点。
1.8GB
Qwen3-ASR-0.6B
MLX · 高精度精度拉满的一档。它是「音频编码器 + 语言模型解码」的结构,能联系上下文消歧,所以中英混读最强、专有名词最准。支持识别层热词(喂一份术语表),覆盖 30 种语言 + 22 种中文方言口音。跑在 Apple Silicon 原生的 MLX 上,内存稳、不爆。出最终结果,不逐字蹦。
~2.4GB
想让 AI 帮你润色、整理文字又不想联网?菜单里点一下自动下载。空闲时不占内存,只在处理那几秒临时加载。下好之后飞行模式照样用,断网也能把大白话变成干净段落。
三个识别引擎任选,全在本机运行。SenseVoice / FireRedASR2 经 sherpa-onnx 推理,Qwen3-ASR 经 MLX 推理;本地 AI 整理由 llama.cpp 跑 Qwen3-4B。菜单里随时切换,最迟一分钟生效,不用重启。
Bring your own key
没问题。去任意 OpenAI 兼容的服务商申一个 key,填进来就能跑。
01 存哪?
密钥直接存进 macOS 自带钥匙串,跟你 iCloud 密码待在同一个地方。我们碰不到,也不会上传。
02 怎么用?
OpenAI 兼容接口,主流服务商都能接。多个服务商的 key 分开记,切来切去不用重新填。
Selection + voice
不只是从零开始说——你还可以先选中文字、文件、文件夹当上下文,然后下指令。
右 ⌘ + 选中文字
选一封邮件,按右 ⌘,说「帮我回这封」或者「给我个摘要」。AI 不会凭空编——它基于你选的内容来写。
右 ⌥⌘ + 选中内容
不止选文字——在访达里选中一个文件、整个文件夹,甚至多选一批,同按两键唤起终端。选中项的路径自动带进去当上下文,Agent 直接去读、去做,你说需求就行。
支持 12 多家 CLI Agent(Claude Code、Codex、Gemini、Hermes……),自动检测你装了哪个。提前设好工作区、选模型、选终端 App(Terminal 或 iTerm2),敲一下就有。Vibe coding 的时候别提多爽——选一段、说一句,结果直接出来,不用来回切窗口。
Thoughtful details
效率工具好不好用,往往就差这些不起眼的小细节。
Pricing
市面上语音工具基本都按月收、或按字数收——用得越多越贵,跟办卡似的。SpellKey 不搞这套:一次付费,终身用。
FAQ
AI语音转写全在电脑上跑,断网照样用。下载本地模型,AI整理、翻译彻底离线。
不会。录音和识别全在这台 Mac 上完成,音频不出本机、也不落盘。最近记录只在内存里,关软件就没了。
默认的 SenseVoice 引擎支持中 / 英 / 日 / 韩 / 粤 五种语言,可以在一句话里混着说。想要更强的话,菜单里切到 Qwen3-ASR——它覆盖 30 种语言,外加 22 种中文方言口音,中英混读也最准。另外还有独立翻译键(右 ⇧),说一段话直接翻成你设的目标语种,30 多种任选。
不用。AI 整理、翻译这些可以一键下载本地离线模型来做,下好之后断网照样跑;也可以填自己的云端 API Key,密钥锁在 macOS 钥匙串里,我们碰不到。(唤起终端 Agent 是另一个功能——它会用你电脑上已装的 Claude / Codex / Gemini 等 CLI,走你自己的额度。)
本地识别更快更准,中英混说没问题,点一下自动加标点落字。还能帮你写东西、翻译——而且全程不依赖网络。
目前只支持 Apple Silicon(M 系列芯片)+ macOS 14 以上。本地模型需要 M 系列芯片来保证速度和流畅度。