Mac 听写:2026 完整指南
如何配置 macOS 听写、什么时候系统自带功能不够用、以及哪一款第三方应用值得装——Superwhisper、Wispr Flow,还是 Viora。
Viora 团队 · 最近更新于 2026 年 6 月 14 日。
三四年前在 Mac 上试过听写的人,多半都是这种经历:开口说了一句带"逗号"的话,看着屏幕上真的出现了"逗号"两个字,然后再也没打开过这个功能。一直到 macOS Sonoma,Mac 听写大致都停在那个状态。这两年才有了实质变化。
这一页是我们做 Viora 那时候希望读到的一份指南。它会一步一步走过 macOS 自带听写功能,直白地说什么时候够用、什么时候不够,再客观地给出 2026 年 Mac 上真正值得花时间评估的四款第三方语音转文字应用——Superwhisper、Wispr Flow、Typeless,以及我们自己的产品 Viora。
我们是 Viora 团队,写在自己博客上,所以该有的免责声明你大概能想到。我们尽量以希望被对待的方式对待竞品:哪些地方它做得比我们好就直说,附上他们的官网链接,剩下的交给读者判断。

重点结论
- macOS 自带听写免费,短消息、简单笔记和表单输入已经够用。
- 自带功能写长一点会变慢,主要问题是标点、清理、自定义词和编辑都要手动处理。
- Superwhisper 更适合离线优先和本地模型控制。
- Wispr Flow 更适合跨平台、团队功能,以及公开 HIPAA / SOC 2 / ISO 27001 计划声明。
- Typeless 值得比较,尤其是长文清理、较高免费额度和跨平台听写。
- Viora 更适合一直在 macOS 上工作,并且想让语音做写作、编辑、问答和小型任务的人。
这份指南适合谁
这份指南适合正在比较 Mac 自带听写和第三方 Mac 听写应用的人。它覆盖设置、常用听写命令、什么时候该换第三方工具,以及 Superwhisper、Wispr Flow、Typeless 和 Viora 的差别。
它不适合直接做医疗听写、法庭转写、会议记录或受监管采购决策。如果 HIPAA、SOC 2、ISO 27001、本地处理或企业采购很重要,请把这篇文章当成初筛,再核对供应商合同、DPA、BAA、Trust Center 和当前隐私政策。
2026 年的 Mac 听写到底变了什么
过去两年里有两个变化,让自带功能从"玩具"变成了"短输入场景下真正能用"。
第一,Mac 听写在支持的通用文本听写路径下可以走设备端处理。Apple 的官方听写支持页说明,你可以在键盘设置里查看语音输入和转写是否在设备端处理;Apple 也把语言和地区支持放在当前的 macOS 功能可用性页面里。实际结论是:它会受语言、地区、macOS 版本和输入场景影响。
第二,Apple 上线了一个明显更好的神经模型,对常见名词和短语的处理都好不少。你聊过的人名、打过的地址、带本地上下文的术语——比以前都准了一截。
但决定你会不会继续用它的那一部分,没变。
你还是得开口念标点。"周五前发报告 句号 换行 有需要再告诉我 句号"——这就是你"听写"一封两句话邮件的真实样子。在 Messages 里口述一句"好的 谢谢",确实快;但口述一整段,你会失去耐心。
依然没有转写编辑器。文字直接出现在你正在打字的输入框里。要是你说到一半改主意重开了一句,两个版本就一起留在你的草稿里,要修改只能像处理普通错别字一样手改。
依然没有公开的词典编辑器。人名、产品名、内部术语——你没办法教自带功能怎么拼。macOS 会在使用过程中隐式适应,但你打不开一个列表把"Composio"加进去。
第三方应用要填的,就是这三个空。下面会回到这一点。
怎么开启 Mac 听写
不同 macOS 版本的设置路径不太一样。以 macOS Sonoma 14 与 Sequoia 15 为准:
- 打开系统设置(
⌘ + 空格,输入"系统设置")。 - 在侧栏滚到键盘。
- 在右侧面板中段找到听写这一节。
- 打开听写。macOS 会请求麦克风权限,授权即可。
完成。这个功能现在在 Mac 上任何输入框里都能用。
但你大概率不想用默认快捷键。默认是"按新款 Apple 键盘上的听写键"或"两次连按 fn"。两个都不顺手。前者只在带专属键的硬件上有效;后者是一个连按动作,大概用到第三次的时候就开始觉得别扭。
在同一面板点快捷键,挑一个按住即说的键。任意你能按住、又不会和其它快捷键冲突的键都行:
- 按住右
⌘ - 按住
fn(每个 Mac 键盘都有) - 右
⌥ - 右
⌃
心智模型变成"按住的时候我在听写"。按住、说、松开。形状像对讲机。我们看着不少人配置过这一步,挑按住即说的人一周后还在用,沿用连按默认的人不会再用。
接着点语言,只加你真的会说的那几种。自动识别不错,但不是魔法。如果你开了法语却从来不说法语,听写偶尔会把一句听感模糊的话当成法语来识,结果就是一段乱码。最多两到三种。

第一次测试时,把光标放进 Notes 窗口,按住快捷键,说一句"this is a test of dictation on my mac"。你应该能看到这句话被打出来,"Mac"还会被自动正确大写。
如果什么都没发生,最常见的原因是麦克风权限。检查系统设置 → 隐私与安全性 → 麦克风。macOS 听写在那个列表里需要自己的位置,而当前应用根据沙盒方式不同,可能也得开权限。
如果文字出来了,但识成了别的语言,回到语言里删掉你不用的那些。
如果说着说着突然在中途断了,那是设计如此,不是 bug。自带听写在几秒钟没声音以后会自动停止,没有调整超时的设置。这是很多人最后装第三方工具的主要原因之一。
你真正需要记住的几个听写命令
Apple 文档里那一长串听写命令大部分可以忽略。95% 的场景里,下面六个就够了:
- "comma" → ,
- "period" → 。
- "question mark" → ?
- "exclamation point" → !
- "new line" → 光标换行
- "new paragraph" → 空一行,开始新段落
值得再记几个的:"用 "open quote" / "close quote",: 用 "colon"(是的,得念出来),/ 用 "slash",@ 用 "at sign"(在某些上下文里能自识,但不稳定);"caps on" / "caps off" 切换大写;"stop dictation" 在不松键的情况下结束本次听写。
如果你发现自己在一封邮件里念了四遍"period new line let me know if",那就是这个功能的设计本意——它当初就是给短输入做的,不是给写作做的。
自带功能什么时候不够用
朋友问我们要不要装第三方工具时,我们会留意三个信号。
编辑的时间比听写还多。 如果原始转写文本必须先清理才能发出去,你其实没省时间,只是把时间从打字挪到了改字上。现代第三方工具会在转写之上跑一个小语言模型,自动处理标点、大小写和填充词。你不用再开口念"逗号"。
总是在改同一批名字。 自带功能没有公开词典。如果你的同事叫 Nguyen,你们公司有个外人没听过的内部产品,或者你的领域有专属术语——自带听写永远会写错。个人词典是自带与第三方差别最大的地方之一。
你想让"语音"做的不止是输出文字。 这是整个领域正在挪动的方向。语音作为一段写作的输入是一回事;语音作为日历查询、搜索、调用工具的入口,是另一种东西。下面四款里今天只有一款做这件事,另外三款仍然是纯听写工具——也可能这正是你想要的。
如果上面这三个信号你都没遇到过,那读到这里就可以停了。自带功能在它的定位上没问题,免费,而且系统自带。
2026 年真正值得了解的四款第三方应用
我们一直在留意这个赛道。Mac 上叫得出名字的语音转文字应用差不多有十几款,大多数是套着不同 UX 的同一个底层转写模型。下面这四款规模、势头、或定位有自己的特点,值得花时间评估。
我们尽量诚实地说每一款做得好和不好的地方,以及大致适合谁。价格、平台、隐私和功能声明以 2026 年 6 月 14 日各家公开页面为准。
Superwhisper —— 离线优先

Superwhisper 是 Mac 上"音频不上传也能处理"这件事的标杆。它的离线转写页面说明,app 可以在本机硬件上处理音频,不需要上传;官网也同时列出本地和云端模型。所以准确说,隐私结果取决于你选的是哪条 app 路径和模型,而不只是品牌名。
价格是这一类里比较清楚的一部分。我们在 2026 年 6 月 14 日查看时,Superwhisper 官网列出了免费层、每月 $8.49 的 Pro,以及 Monthly / Yearly / Lifetime 计费标签。购买前仍然要重新检查 checkout,因为 yearly 和 lifetime 的具体金额可能变化。
它没有的是 Agent 模式。它的 "Super" 模式把转写文本交给你选定的 LLM,更接近"用语音问 GPT 一个问题",而不是"调用工具的 Agent"。你说"明天上午安排一个 30 分钟的专注时段",Superwhisper 给你的是这句话的整理稿,不是真正建好的日历事件。如果想看更详细的横向对比,我们在这里写过 Viora 与 Superwhisper 的对比。
如果你在意离线、宁可一次付清不想订阅,或者你就是想自己挑本地 Whisper 模型,选 Superwhisper。
Wispr Flow —— 跨平台老牌选手

Wispr Flow 是这个赛道里成熟度最高、领先一截的产品。它在 Mac、Windows、iPhone、Android 四端都有,并且个人词典在四端之间同步。他们公布了一个 sub-700ms 的 p99 端到端延迟数字,跨设备的往返已经低到你不会注意到——Baseten 的案例 里讲了他们是怎么做到的。
价格是按用户每月 $12,年付,对应 Pro unlimited,来源是 2026 年 6 月 14 日查看的 Wispr Flow 价格页。同一页列出免费层:Mac 或 Windows 每周 2,000 字,iPhone 每周 1,000 字。Wispr Flow 的隐私和安全页列出 HIPAA availability with a BAA,并把 SOC 2 Type II / ISO 27001 放在 Enterprise 相关说明里。
我们圈子里说起 Wispr Flow,最常被提的是它的编辑层做得好。AI Auto Edits 有四档力度,个人词典会学你常用的词,语气会随着你当前在哪个应用里调。如果你大部分听写都进 Notion、Gmail、Slack,这是围绕这几个工作流打磨得最深的工具。
它没有的是离线(按官方隐私页的说法,"转写始终在云端发生"),也没有 Agent 能力。在 Wispr Flow 与 Superwhisper 之间的选择,主要是隐私偏好与定价偏好的取舍。
如果你的工作日在多个平台之间切换、需要 100+ 种语言、或者 HIPAA 合规是硬性要求,选 Wispr Flow。我们的 Viora vs Wispr Flow 写得更细。
Typeless —— 把"编辑器"做成主角

Typeless 是这四款里仍然值得比较的新工具。它的公开页面把产品重点放在 AI 语音听写、文本清理、个人写作风格、专属词典、按应用调整语气,以及多语言支持上。
他们的切入角度是后处理。宣传语是 "AI Voice Dictation That's Actually Intelligent",意思是编辑模型做的不仅仅是补标点。它会去除填充词("嗯""那个"),在你絮叨着列举几件事时把它们整理成清单,根据你当前在哪个应用里切换语气,还能对选中文字直接 "Ask Anything"。如果你的工作日大部分是长文写作——邮件、文档、长串讨论——这是后处理负担最重的工具。
价格是每席每月 $12 年付,月付的话 $30/月。免费层每周 8,000 字,是四款里最大方的。支持 Mac(Apple Silicon 与 Intel)、Windows、iOS、Android。
我们查看到的 Typeless 公开页面没有把它描述成离线听写工具,也没有公开一个让用户选择底层转写模型的设置层。Typeless 隐私政策说明,音频和上下文数据会在云端实时处理,并在返回结果后丢弃。所以不要把 Typeless 当成本地-only 工具来评估。
如果你写很多长文、想要这一类里整理能力最强的工具、并且不需要 Agent 能力,选 Typeless。
Viora —— 让语音不止是文字
Viora 是我们做的产品。我们直说今天有什么、没有什么。
定位是:和其它三家一样的按住即说快捷键、一样把整理好的文字落到光标处——但同一个快捷键还能触发 Agent。当你说出来的是一个问题或一个任务,而不是一段写作时,Viora 在屏幕上的悬浮球旁边打开 Agent Card,把答案流式输出给你。借 EventKit 的日历查询、网页搜索、通过 Composio 接的第三方连接器——都在这一个流程里完成。"明天上午安排一个 30 分钟的专注时段"可以进入日历相关工作流。在这四款公开定位里,Viora 是唯一把 agent-style Mac workflow 放在中心的产品。
另一个我们独有的是悬浮球这个 UI:停靠在屏幕四个角之一,没事的时候隐到边缘,需要看东西时再展开。是我们的视觉签名。
价格简单:免费层每月 20,000 字;Pro 每月 $20 或每年 $199。我们只有 macOS——Apple Silicon 与 Intel 都支持,没有 Windows,也没有移动端。
我们老实说没做的:不离线(转写在云端)、没有 HIPAA 合规、没有公开 API、语言只有 28+ 种(Wispr Flow 与 Typeless 都是 100+)。如果其中任何一条对你来说是硬性要求,这份名单里的正确答案就不是我们。
如果你在 macOS 上工作,并且想让语音做的不止是听写,选 Viora。
一表对比
| 自带 | Superwhisper | Wispr Flow | Typeless | Viora | |
|---|---|---|---|---|---|
| 价格 | 免费 | 免费 / Pro $8.49 月 / yearly 与 Lifetime 计费标签 | $12 / 用户 / 月,年付 | $12 / 成员 / 月,年付 | $20 / 月 或 $199 / 年 |
| 平台 | macOS | Mac / Win / iOS | Mac / Win / iOS / Android | Mac / Win / iOS / Android | 仅 macOS |
| 离线 | 是(多数语言) | 是(Apple Silicon) | 否 | 否 | 否 |
| 自动整理 | 否 | 可配置 | 是 | 是 | 是 |
| 个人词典 | 否 | 是 | 是 | 是 | 是 |
| Agent / 工具调用 | 否 | Super 模式(LLM 直通) | 否 | 否 | 是 |
| 合规 | n/a | 官网列出 SOC 2 / HIPAA 相关声明,需核对合同 | HIPAA-ready;Enterprise 列出 SOC 2 Type II 和 ISO 27001 | 有 zero-data-retention 隐私表述;未按离线工具核验 | 暂未声明 |
怎么实际做选择
绕了这么多,决策通常归到四个问题,大致按这个顺序:
你跨平台吗? 如果你的一天在 Mac 与 Windows 之间切,或者也想在手机上用语音,名单就剩 Wispr Flow 和 Typeless 了。Superwhisper 有 Windows 与 iOS,但它最大的卖点——本地 Whisper 模型——只在 Apple Silicon 上跑得好。Viora 只支持 Mac。
离线是不是硬性要求? 如果"音频永远不离开 Mac"不可妥协——为了法务审查、公司政策、或者你就是要这样——Superwhisper 是这组里最干净的答案。自带 macOS 听写在支持的通用文本路径下可能走设备端处理,但你需要按 Apple 当前设置和语言可用性核对自己的情况。
你想让语音做事,还是只想生成文字? 如果你总是发现自己在向 ChatGPT 听写,让它拿这段话再去做点别的,那语音对你来说已经变成一个路由问题,正确答案是 Agent 路线。这是 Viora 押的方向。如果语音对你来说就是"我想用嘴打字",剩下三款里挑一款都是干净的选择。
订阅还是一次性? Superwhisper 公开列出 Lifetime 计费选项。其它几款,包括 Viora,在我们检查到的公开价格页上都是订阅制。购买前重新看 checkout,因为语音工具经常改套餐。
这里没有一个适合所有人的答案。我们见过朋友因为各自合理的理由选了四款里的每一款。最常见的失误是默认选最有营销声量的那一款,然后默默不打开它,因为它根本不贴合自己的工作流。在掏钱之前,先用免费层用一个小时。
FAQ
2026 年 Mac 上最好的听写应用是哪一款? 没有单一答案。短输入用 macOS 自带;想离线选 Superwhisper;想跨平台 + HIPAA 选 Wispr Flow;写长文选 Typeless;想让语音跑 Agent 任务选 Viora。上面那四个问题是通往答案最短的路径。
macOS 听写离线能用吗? Apple 说明里写的是:你可以在键盘设置里查看通用文本听写是否在设备端处理。语言、地区、macOS 版本和输入场景都会影响结果。
Mac 听写在 2026 年的准确率怎么样? 在安静房间里说清晰内容,上面五个选项都足够日常使用。差距体现在嘈杂环境、口音、技术术语、长句和后处理上。我们这次没有跑受控错误率测试,所以准确率判断是方向性的,不是实验室结论。
为什么我的 Mac 听写说到一半就停了? 自带功能在几秒钟没声音之后会停止。没有可以延长超时的设置。如果你说话时会停下来想,听写就会结束。按住即说的第三方应用更适合这种工作流。
能在 Cursor 或 VS Code 里听写吗? 可以。听写在输入框里都能用,包括代码编辑器。Wispr Flow 公开宣传 Cursor 与 Windsurf 的集成;其它几款通常依赖系统级文本注入。
能给 Mac 听写加自定义词吗? 不能加给自带功能——它没有公开词典编辑器。四款第三方应用都支持个人词典。
Mac 上有免费听写应用吗? macOS 自带功能免费。Wispr Flow、Typeless、Viora 和 Superwhisper 也公开提供免费层、免费额度或试用选项,选择前应以各自官网为准。
关于这份指南
这一页由 Viora 团队发布。我们尽量以希望被对待的方式对待竞品——直说他们做得比我们好的地方、附上他们的链接、把判断留给读者。价格、平台支持、隐私姿态和功能列表均以 2026 年 6 月 14 日各家公开页面为准。任何一款产品有实质变化时我们会重新核对。
方法
我们在 2026 年 6 月 14 日复查了这篇指南。对比范围刻意收窄:Apple 自带 macOS Dictation,加上四个 Mac 用户会认真比较的第三方产品。我们优先看官方页面,再把没有公开来源支撑的说法删除或改窄。
本次标准是:平台支持、价格形态、离线或云端处理、语言覆盖、个人词典、清理和编辑流程、Agent 或工具调用能力,以及公开合规声明。我们没有跑受控错误率测试、噪声测试或长期留存测试。
来源
- Apple: Dictate messages and documents on Mac
- Apple: Commands for dictating text on Mac
- Apple: macOS Feature Availability
- Superwhisper homepage and pricing
- Superwhisper offline transcription
- Superwhisper Privacy Policy
- Wispr Flow pricing
- Wispr Flow privacy and security
- Wispr Flow Privacy Policy
- Typeless pricing
- Typeless Privacy Policy
- Viora voice dictation for macOS
- Viora Privacy Policy
- Viora pricing
如果你读到这里,正在 macOS 上工作,并且想专门试一下 Agent 这条路,请下载 Viora。免费层,装上不用注册账号。如果这份名单里的另一款更贴合你的工作流,那就是对的选择。我们更希望你用上真正适合你的工具,而不是装了我们的然后从此不再打开。


