本地智能语音输入 · MAC 专属

SpellKey, 一键施法

几百次迭代,只为更流畅的语音输入体验。

原文转录 AI 整理 即时翻译 ⌥⌘终端 Agent
一键下载 SpellKey 看真机演示 ↓

全程本地运行 · macOS 14+ · 仅 Apple Silicon(M 系列芯片)

真机演示Demo, 全程实录

下面每一段都在 Mac 上实录,未剪接——你看到的就是它真实的样子。

0:00 / 0:00

点右 ⌥ 说话,录音中切右 ⌘ 让 AI 整理成清单,再说一句就重新排序。

Why SpellKey

为什么选 SpellKey,
而不是其他的云端语音输入?

市面上智能语音输入的那些老问题,SpellKey 基本都躲开了。

01 纯本地语音引擎和模型

你的声音不会被上传云端

录音、识别、AI 整理全在这台 Mac 上完成,一个字节都不出本机。不上传、不落盘,说什么只有你自己知道。

02 全程本地运行

断网、飞行模式照样用

飞机上、地铁里、信号差——想记就记,语音转写完全不靠网络,一个字都不会卡住。

03 本地推理够快

说完立刻出字,不用等

不用上传、排队、等回传,本地引擎最快约 0.06 秒落字;录音时灵动岛还能逐字实时预览。

04 高度可调 · 为你而配

处处能调,贴合你的工作流

语音引擎、快捷键、AI 模型、终端 Agent CLI…几乎每个环节都能按你的习惯配。尤其合 Vibe Coding 的人胃口——选中文件说一句,Agent 直接开干,顺手得像多了只手。

全程本地、一次买断——不联网、不上传、不限量

Speech engines

三种语音引擎各有所长,
按照实际需求挑选。

不用联网、不用注册,语音转写一个字都不往外传。轻量、均衡、高精度,按需选就行。

228MB

SenseVoice-Small

sherpa-onnx · 默认捆绑

装完就有的默认引擎,约 0.06 秒出字,中文优先,内存占用最小。逐帧识别(CTC),录音时能在灵动岛里逐字实时预览。中 / 英 / 日 / 韩 / 粤 都认得,日常够用了。

740MB

FireRedASR2-CTC

sherpa-onnx · 均衡

更稳的一档。长录音不容易飘,家里人说话带口音、方言重也扁得住。同样是逐帧识别,保留灵动岛里的逐字实时预览。速度和精度之间的平衡点。

1.8GB

Qwen3-ASR-0.6B

MLX · 高精度

精度拉满的一档。它是「音频编码器 + 语言模型解码」的结构,能联系上下文消歧,所以中英混读最强、专有名词最准。支持识别层热词(喂一份术语表),覆盖 30 种语言 + 22 种中文方言口音。跑在 Apple Silicon 原生的 MLX 上,内存稳、不爆。出最终结果,不逐字蹦。

~2.4GB

本地 AI 整理模型 · Qwen3-4B llama.cpp

想让 AI 帮你润色、整理文字又不想联网?菜单里点一下自动下载。空闲时不占内存,只在处理那几秒临时加载。下好之后飞行模式照样用,断网也能把大白话变成干净段落。

三个识别引擎任选,全在本机运行。SenseVoice / FireRedASR2 经 sherpa-onnx 推理,Qwen3-ASR 经 MLX 推理;本地 AI 整理由 llama.cpp 跑 Qwen3-4B。菜单里随时切换,最迟一分钟生效,不用重启。

Bring your own key

内存紧张,不想跑本地大模型?
用自己的API Key 也可以。

没问题。去任意 OpenAI 兼容的服务商申一个 key,填进来就能跑。

01 存哪?

存入macOS钥匙串,不上传服务器

密钥直接存进 macOS 自带钥匙串,跟你 iCloud 密码待在同一个地方。我们碰不到,也不会上传。

02 怎么用?

填一次就行

OpenAI 兼容接口,主流服务商都能接。多个服务商的 key 分开记,切来切去不用重新填。

Selection + voice

选中一段文字,
张嘴说你要干啥。

不只是从零开始说——你还可以先选中文字、文件、文件夹当上下文,然后下指令。

右 ⌘ + 选中文字

让 AI 处理你的内容

选一封邮件,按右 ⌘,说「帮我回这封」或者「给我个摘要」。AI 不会凭空编——它基于你选的内容来写。

右 ⌥⌘ + 选中内容

选中文件、文件夹,喂给终端 Agent

不止选文字——在访达里选中一个文件、整个文件夹,甚至多选一批,同按两键唤起终端。选中项的路径自动带进去当上下文,Agent 直接去读、去做,你说需求就行。

Agent CLI 配置 给终端玩家

支持 12 多家 CLI Agent(Claude Code、Codex、Gemini、Hermes……),自动检测你装了哪个。提前设好工作区、选模型、选终端 App(Terminal 或 iTerm2),敲一下就有。Vibe coding 的时候别提多爽——选一段、说一句,结果直接出来,不用来回切窗口。

Thoughtful details

那些替你想到的
小地方。

效率工具好不好用,往往就差这些不起眼的小细节。

01说错、手滑的补救
撤回刚落的字,说一句就能撤回,不用回头一个个手删。
历史记录不小心删掉了?在历史里就能翻回刚才说过的原文。
灵动岛上重新生成AI 整理得不满意,岛上一点让它换个版本,不用重说一遍。
永不丢内容后端逐级回退(BYOK → 本地 Qwen → 正则兜底),哪一级挂了都不吞你的话。
02录着录着改主意
录音中切模式右 ⌥开始转录,说到一半按右 ⌘直接交给 AI 整理,不用停下重来。
波形实时变色切到 Agent 波形当场变琥珀、翻译变青绿,一眼看出现在是哪个模式。
自动意图路由同样按右 ⌘,说「整理一下」走快档(约 1.7s),说「写封邮件」自动走慢档深思。
03带上下文,少打字
划选文字 + 触发键选中一段文字再口述,就是对这段动手:改写、翻译、AI 处理。
选中文件 + 和弦Finder / 桌面选中文件(可多选、含图片),路径直接进 Agent 终端当「相关文件」,它自己去读。
岛上标注「+选中 N 字」「+文件 N 个 · 文件名」,附了什么一目了然。
04识别质量的隐形照顾
中英纠错词表codex → Codex、claudecode → Claude Code 这类常见错拼自动纠。
繁简统一统一成简体,不会一句话半繁半简。
水词过滤「嗯、那个、就是」这类口头语气词自动去掉。
空闲杀 + 自愈ASR 子进程空闲自动回收省内存,卡住了自动重起。

Pricing

一次 买断,不月租。

市面上语音工具基本都按月收、或按字数收——用得越多越贵,跟办卡似的。SpellKey 不搞这套:一次付费,终身用。

SPELLKEY · 个人许可

¥79

一次付费,终身使用 · 不月租

  • 四种模式全包
  • 不限时长、不限字数
  • 1.x 持续维护更新免费
  • 一份许可,自用设备不限台数
免费试用 14 天

FAQ

你可能想问的。

要联网吗?+

AI语音转写全在电脑上跑,断网照样用。下载本地模型,AI整理、翻译彻底离线。

我的录音会上传吗?+

不会。录音和识别全在这台 Mac 上完成,音频不出本机、也不落盘。最近记录只在内存里,关软件就没了。

支持哪些语言?+

默认的 SenseVoice 引擎支持中 / 英 / 日 / 韩 / 粤 五种语言,可以在一句话里混着说。想要更强的话,菜单里切到 Qwen3-ASR——它覆盖 30 种语言,外加 22 种中文方言口音,中英混读也最准。另外还有独立翻译键(右 ⇧),说一段话直接翻成你设的目标语种,30 多种任选。

需要 API Key 吗?+

不用。AI 整理、翻译这些可以一键下载本地离线模型来做,下好之后断网照样跑;也可以填自己的云端 API Key,密钥锁在 macOS 钥匙串里,我们碰不到。(唤起终端 Agent 是另一个功能——它会用你电脑上已装的 Claude / Codex / Gemini 等 CLI,走你自己的额度。)

和系统自带听写比呢?+

本地识别更快更准,中英混说没问题,点一下自动加标点落字。还能帮你写东西、翻译——而且全程不依赖网络。

Intel Mac 能用吗?+

目前只支持 Apple Silicon(M 系列芯片)+ macOS 14 以上。本地模型需要 M 系列芯片来保证速度和流畅度。

下一句话,
直接说出来。

macOS 14+ · 仅 Apple Silicon(M 系列芯片)· 含离线语音模型