VioraEarly Access
  • 功能
  • 价格
  • 下载
  • 博客

作者

avatar for Viora 团队
Viora 团队

分类

  • 教程

目录

  • 2026 年的 Mac 听写到底变了什么
  • 怎么开启 Mac 听写
  • 你真正需要记住的几个听写命令
  • 自带功能什么时候不够用
  • 2026 年真正值得了解的四款第三方应用
  • Superwhisper —— 离线优先
  • Wispr Flow —— 跨平台老牌选手
  • Typeless —— 把"编辑器"做成主角
  • Viora —— 让语音不止是文字
  • 一表对比
  • 怎么实际做选择
  • FAQ
  • 关于这份指南
2026/04/28

Mac 听写:2026 完整指南

如何配置 macOS 听写、什么时候系统自带功能不够用、以及哪一款第三方应用值得装——Superwhisper、Wispr Flow,还是 Viora。

Viora 团队 · 最近更新于 2026 年 4 月 28 日。

三四年前在 Mac 上试过听写的人,多半都是这种经历:开口说了一句带"逗号"的话,看着屏幕上真的出现了"逗号"两个字,然后再也没打开过这个功能。一直到 macOS Sonoma,Mac 听写大致都停在那个状态。这两年才有了实质变化。

这一页是我们做 Viora 那时候希望读到的一份指南。它会一步一步走过 macOS 自带听写功能,直白地说什么时候够用、什么时候不够,再客观地给出 2026 年 Mac 上真正值得花时间评估的四款第三方语音转文字应用——Superwhisper、Wispr Flow、Typeless,以及我们自己的产品 Viora。

我们是 Viora 团队,写在自己博客上,所以该有的免责声明你大概能想到。我们尽量以希望被对待的方式对待竞品:哪些地方它做得比我们好就直说,附上他们的官网链接,剩下的交给读者判断。

Viora 在 macOS Mail 里听写,悬浮球停在屏幕右上角

2026 年的 Mac 听写到底变了什么

过去两年里有两个变化,让自带功能从"玩具"变成了"短输入场景下真正能用"。

第一,Mac 听写现在大多数主要语言都在本地运行。macOS 第一次下完语言包以后,你的音频不会离开 Mac。覆盖的语言包括英语、法语、德语、西班牙语、普通话、粤语、日语,还有一小批其它语种——完整列表以 Apple 官方听写支持页为准。冷门语种仍然走 Apple 的服务器,但对大多数人真正会用来听写的语言来说,断网也能正常工作。

第二,Apple 上线了一个明显更好的神经模型,对常见名词和短语的处理都好不少。你聊过的人名、打过的地址、带本地上下文的术语——比以前都准了一截。

但决定你会不会继续用它的那一部分,没变。

你还是得开口念标点。"周五前发报告 句号 换行 有需要再告诉我 句号"——这就是你"听写"一封两句话邮件的真实样子。在 Messages 里口述一句"好的 谢谢",确实快;但口述一整段,你会失去耐心。

依然没有转写编辑器。文字直接出现在你正在打字的输入框里。要是你说到一半改主意重开了一句,两个版本就一起留在你的草稿里,要修改只能像处理普通错别字一样手改。

依然没有公开的词典编辑器。人名、产品名、内部术语——你没办法教自带功能怎么拼。macOS 会在使用过程中隐式适应,但你打不开一个列表把"Composio"加进去。

第三方应用要填的,就是这三个空。下面会回到这一点。

怎么开启 Mac 听写

不同 macOS 版本的设置路径不太一样。以 macOS Sonoma 14 与 Sequoia 15 为准:

  1. 打开系统设置(⌘ + 空格,输入"系统设置")。
  2. 在侧栏滚到键盘。
  3. 在右侧面板中段找到听写这一节。
  4. 打开听写。macOS 会请求麦克风权限,授权即可。

完成。这个功能现在在 Mac 上任何输入框里都能用。

但你大概率不想用默认快捷键。默认是"按新款 Apple 键盘上的听写键"或"两次连按 fn"。两个都不顺手。前者只在带专属键的硬件上有效;后者是一个连按动作,大概用到第三次的时候就开始觉得别扭。

在同一面板点快捷键,挑一个按住即说的键。任意你能按住、又不会和其它快捷键冲突的键都行:

  • 按住右 ⌘
  • 按住 fn(每个 Mac 键盘都有)
  • 右 ⌥
  • 右 ⌃

心智模型变成"按住的时候我在听写"。按住、说、松开。形状像对讲机。我们看着不少人配置过这一步,挑按住即说的人一周后还在用,沿用连按默认的人不会再用。

接着点语言,只加你真的会说的那几种。自动识别不错,但不是魔法。如果你开了法语却从来不说法语,听写偶尔会把一句听感模糊的话当成法语来识,结果就是一段乱码。最多两到三种。

Viora 的设置——麦克风、识别语言与快捷键配置

第一次测试时,把光标放进 Notes 窗口,按住快捷键,说一句"this is a test of dictation on my mac"。你应该能看到这句话被打出来,"Mac"还会被自动正确大写。

如果什么都没发生,最常见的原因是麦克风权限。检查系统设置 → 隐私与安全性 → 麦克风。macOS 听写在那个列表里需要自己的位置,而当前应用根据沙盒方式不同,可能也得开权限。

如果文字出来了,但识成了别的语言,回到语言里删掉你不用的那些。

如果说着说着突然在中途断了,那是设计如此,不是 bug。自带听写在几秒钟没声音以后会自动停止,没有调整超时的设置。这是很多人最后装第三方工具的主要原因之一。

你真正需要记住的几个听写命令

Apple 文档里那一长串听写命令大部分可以忽略。95% 的场景里,下面六个就够了:

  • "comma" → ,
  • "period" → 。
  • "question mark" → ?
  • "exclamation point" → !
  • "new line" → 光标换行
  • "new paragraph" → 空一行,开始新段落

值得再记几个的:"用 "open quote" / "close quote",: 用 "colon"(是的,得念出来),/ 用 "slash",@ 用 "at sign"(在某些上下文里能自识,但不稳定);"caps on" / "caps off" 切换大写;"stop dictation" 在不松键的情况下结束本次听写。

如果你发现自己在一封邮件里念了四遍"period new line let me know if",那就是这个功能的设计本意——它当初就是给短输入做的,不是给写作做的。

自带功能什么时候不够用

朋友问我们要不要装第三方工具时,我们会留意三个信号。

编辑的时间比听写还多。 如果原始转写文本必须先清理才能发出去,你其实没省时间,只是把时间从打字挪到了改字上。现代第三方工具会在转写之上跑一个小语言模型,自动处理标点、大小写和填充词。你不用再开口念"逗号"。

总是在改同一批名字。 自带功能没有公开词典。如果你的同事叫 Nguyen,你们公司有个外人没听过的内部产品,或者你的领域有专属术语——自带听写永远会写错。个人词典是自带与第三方差别最大的地方之一。

你想让"语音"做的不止是输出文字。 这是整个领域正在挪动的方向。语音作为一段写作的输入是一回事;语音作为日历查询、搜索、调用工具的入口,是另一种东西。下面四款里今天只有一款做这件事,另外三款仍然是纯听写工具——也可能这正是你想要的。

如果上面这三个信号你都没遇到过,那读到这里就可以停了。自带功能在它的定位上没问题,免费,而且系统自带。

2026 年真正值得了解的四款第三方应用

我们一直在留意这个赛道。Mac 上叫得出名字的语音转文字应用差不多有十几款,大多数是套着不同 UX 的同一个底层转写模型。下面这四款规模、势头、或定位有自己的特点,值得花时间评估。

我们尽量诚实地说每一款做得好和不好的地方,以及大致适合谁。价格和平台支持以 2026 年 4 月 28 日各家官网上发布的为准。

Superwhisper —— 离线优先

Superwhisper 官网——"Just speak. Write faster."

Superwhisper 是 Mac 上"音频永远不离开本机"这件事的标杆。它打包了一整套本地 Whisper 变体——Whisper Ultra V3 Turbo、通过 WhisperKit 跑的 Parakeet、几款更小的模型——并且支持你接自己的 LLM API 密钥(Claude、GPT、Llama 等)来做转写后处理。如果你选了本地选项,整条流程就在你的 Mac 上跑完。它的隐私页面对"音频不离开设备"这一点写得毫不含糊。

价格是这一类里最干净的部分。Pro 是每月 $8.49 或每年 $84.99,但真正的卖点是 $249.99 的终身授权。一次性付清,所有你之后会用的 Mac 都能装。在一个清一色订阅制的赛道里,这种定价根本不需要包装。

它没有的是 Agent 模式。它的 "Super" 模式把转写文本交给你选定的 LLM,更接近"用语音问 GPT 一个问题",而不是"调用工具的 Agent"。你说"明天上午安排一个 30 分钟的专注时段",Superwhisper 给你的是这句话的整理稿,不是真正建好的日历事件。如果想看更详细的横向对比,我们在这里写过 Viora 与 Superwhisper 的对比。

如果你在意离线、宁可一次付清不想订阅,或者你就是想自己挑本地 Whisper 模型,选 Superwhisper。

Wispr Flow —— 跨平台老牌选手

Wispr Flow 官网——"Don't type, just speak"

Wispr Flow 是这个赛道里成熟度最高、领先一截的产品。它在 Mac、Windows、iPhone、Android 四端都有,并且个人词典在四端之间同步。他们公布了一个 sub-700ms 的 p99 端到端延迟数字,跨设备的往返已经低到你不会注意到——Baseten 的案例 里讲了他们是怎么做到的。

价格是按用户每月 $12,年付。免费层在 Mac 与 Windows 上每周 2,000 字,iPhone 上每周 1,000 字。他们也把合规这块跑通了——HIPAA-ready 在所有套餐都给,SOC 2 Type II 是企业版——如果你在受监管行业,这一条很重要。

我们圈子里说起 Wispr Flow,最常被提的是它的编辑层做得好。AI Auto Edits 有四档力度,个人词典会学你常用的词,语气会随着你当前在哪个应用里调。如果你大部分听写都进 Notion、Gmail、Slack,这是围绕这几个工作流打磨得最深的工具。

它没有的是离线(按官方隐私页的说法,"转写始终在云端发生"),也没有 Agent 能力。在 Wispr Flow 与 Superwhisper 之间的选择,主要是隐私偏好与定价偏好的取舍。

如果你的工作日在多个平台之间切换、需要 100+ 种语言、或者 HIPAA 合规是硬性要求,选 Wispr Flow。我们的 Viora vs Wispr Flow 写得更细。

Typeless —— 把"编辑器"做成主角

Typeless 官网——"Speak, don't type"

Typeless 是这四款里最年轻的一位。五个月里三次拿到 Product Hunt 第一——2025 年 11 月桌面端、12 月 iOS、2026 年 1 月 Android 第三名——这种节奏说明团队在快速出货。

他们的切入角度是后处理。宣传语是 "AI Voice Dictation That's Actually Intelligent",意思是编辑模型做的不仅仅是补标点。它会去除填充词("嗯""那个"),在你絮叨着列举几件事时把它们整理成清单,根据你当前在哪个应用里切换语气,还能对选中文字直接 "Ask Anything"。如果你的工作日大部分是长文写作——邮件、文档、长串讨论——这是后处理负担最重的工具。

价格是每席每月 $12 年付,月付的话 $30/月。免费层每周 8,000 字,是四款里最大方的。支持 Mac(Apple Silicon 与 Intel)、Windows、iOS、Android。

他们目前公开页面上还没补齐的:SOC 2 与 ISO 27001 仍在 "in progress",没有离线,且不公开底层用的转写模型。子处理方列表里出现 OpenAI 和 Gemini,意味着大概是云端 Whisper 加 Gemini 做后处理。如果模型透明度或合规认证对你重要,这点要权衡。

如果你写很多长文、想要这一类里整理能力最强的工具、并且不需要 Agent 能力,选 Typeless。

Viora —— 让语音不止是文字

Viora 是我们做的产品。我们直说今天有什么、没有什么。

定位是:和其它三家一样的按住即说快捷键、一样把整理好的文字落到光标处——但同一个快捷键还能触发 Agent。当你说出来的是一个问题或一个任务,而不是一段写作时,Viora 在屏幕上的悬浮球旁边打开 Agent Card,把答案流式输出给你。借 EventKit 的日历查询、网页搜索、通过 Composio 接的第三方连接器——都在这一个流程里完成。"明天上午安排一个 30 分钟的专注时段"会真的建出一个日历事件。这件事四款里今天只有我们做。

另一个我们独有的是悬浮球这个 UI:停靠在屏幕四个角之一,没事的时候隐到边缘,需要看东西时再展开。是我们的视觉签名。

价格简单:免费层每月 20,000 字;Pro 每月 $20 或每年 $199。我们只有 macOS——Apple Silicon 与 Intel 都支持,没有 Windows,也没有移动端。

我们老实说没做的:不离线(转写在云端)、没有 HIPAA 合规、没有公开 API、语言只有 28+ 种(Wispr Flow 与 Typeless 都是 100+)。如果其中任何一条对你来说是硬性要求,这份名单里的正确答案就不是我们。

如果你在 macOS 上工作,并且想让语音做的不止是听写,选 Viora。

一表对比

自带SuperwhisperWispr FlowTypelessViora
价格免费$249.99 终身 / $8.49 月$12 / 用户 / 月$12 / 席 / 月$20 / 月 或 $199 / 年
平台macOSMac / Win / iOSMac / Win / iOS / AndroidMac / Win / iOS / Android仅 macOS
离线是(多数语言)是(Apple Silicon)否否否
自动整理否可配置是是是
个人词典否是是是是
Agent / 工具调用否Super 模式(LLM 直通)否否是
合规n/a企业版有 BAA全套餐 HIPAAGDPR/HIPAA、SOC 2 进行中暂未声明

怎么实际做选择

绕了这么多,决策通常归到四个问题,大致按这个顺序:

你跨平台吗? 如果你的一天在 Mac 与 Windows 之间切,或者也想在手机上用语音,名单就剩 Wispr Flow 和 Typeless 了。Superwhisper 有 Windows 与 iOS,但它最大的卖点——本地 Whisper 模型——只在 Apple Silicon 上跑得好。Viora 只支持 Mac。

离线是不是硬性要求? 如果"音频永远不离开 Mac"不可妥协——为了 HIPAA、为了法务审查、或者你就是要这样——Superwhisper 是答案。自带功能在多数语言下也是离线,但没有后处理。

你想让语音做事,还是只想生成文字? 如果你总是发现自己在向 ChatGPT 听写,让它拿这段话再去做点别的,那语音对你来说已经变成一个路由问题,正确答案是 Agent 路线。这是 Viora 押的方向。如果语音对你来说就是"我想用嘴打字",剩下三款里挑一款都是干净的选择。

订阅还是一次性? Superwhisper 一次性 $249.99,对任何会用语音超过 16 个月的人来说都是这一类里最便宜的。其它所有,包括我们,都是订阅制。

这里没有一个适合所有人的答案。我们见过朋友因为各自合理的理由选了四款里的每一款。最常见的失误是默认选最有营销声量的那一款,然后默默不打开它,因为它根本不贴合自己的工作流。在掏钱之前,先用免费层用一个小时。

FAQ

2026 年 Mac 上最好的听写应用是哪一款? 没有单一答案。短输入用 macOS 自带;想离线选 Superwhisper;想跨平台 + HIPAA 选 Wispr Flow;写长文选 Typeless;想让语音跑 Agent 任务选 Viora。上面那四个问题是通往答案最短的路径。

macOS 听写离线能用吗? 主要语言下载过一次语言包之后是离线的。冷门语种仍然走 Apple 的服务器。

Mac 听写在 2026 年的准确率怎么样? 在安静房间里说清晰英语,上面五个选项都已经达到人类级别的转写准确率。差距体现在嘈杂环境、口音、技术术语上——这正是个人词典与更强后处理模型重要的地方。

为什么我的 Mac 听写说到一半就停了? 自带功能在几秒钟没声音之后会停止。没有可以延长超时的设置。如果你说话时会停下来想,听写就会结束。按住即说的第三方应用没有这个问题。

能在 Cursor 或 VS Code 里听写吗? 可以。听写在任意输入框里都能用,包括代码编辑器。Wispr Flow 公开宣传 Cursor 与 Windsurf 的集成;其它几款依赖系统级注入,对所有应用都一样有效。

能给 Mac 听写加自定义词吗? 不能加给自带功能——它没有公开词典编辑器。四款第三方应用都支持个人词典。

Mac 上有免费听写应用吗? macOS 自带功能免费。Wispr Flow 有每周 2,000 字的免费层。Typeless 有每周 8,000 字。Viora 有每月 20,000 字。Superwhisper 有 15 分钟试用。

关于这份指南

这一页由 Viora 团队发布。我们尽量以希望被对待的方式对待竞品——直说他们做得比我们好的地方、附上他们的链接、把判断留给读者。价格、平台支持、功能列表均以 2026 年 4 月 28 日各家自家页面为准。任何一款产品有实质变化时我们会重新核对。

如果你读到这里,正在 macOS 上工作,并且想专门试一下 Agent 这条路,请下载 Viora。免费层,装上不用注册账号。如果这份名单里的另一款更贴合你的工作流,那就是对的选择。我们更希望你用上真正适合你的工具,而不是装了我们的然后从此不再打开。

Viora 价格 · Viora vs Wispr Flow · Viora vs Superwhisper

全部文章
Viora

macOS 上的语音 AI 助手, 悄悄做着,替你想着。

产品
  • 功能
  • 价格
  • 常见问题
  • 博客
  • 更新日志
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 Viora. All Rights Reserved.