文档

60 秒上手

安装 OFFTYPE,按下热键,开始说话。此页面涵盖其他所有内容。

这是什么

OFFTYPE 是一款全离线语音输入工具。说话自动变文字,注入到你正在使用的任何软件里。不需要联网,数据不出你的电脑。

  • 语音输入:说话 → 文字直接上屏,替代打字
  • 翻译:说中文 → 输出英文/日文/韩文/法文/西班牙文/德文
  • 润色:把口语写成正式/随意/简练风格
  • 自定义词典:告诉软件你的人名、术语、缩写该写成什么

系统要求

项目最低配置
操作系统Windows 10 64-bit 或更新
内存8 GB
磁盘空间2 GB(含 SenseVoice 模型)
网络仅首次下载模型时需要

安装

  1. 双击 OFFTYPE-Setup-1.0.0.exe

  2. 按向导提示操作(选安装目录、是否创建桌面快捷方式)

  3. 安装完成后自动启动

你可能遇到的安全提示

OFFTYPE 内嵌了 llama.cpp(MIT 开源协议)来做本地翻译和润色。这个开源软件的 Windows 可执行文件叫 llama-cli.exe,因为没有商业代码签名证书(年费 $200-400),Windows 安全中心可能把它当作未知应用拦截。

如果你看到 “受控文件夹访问已阻止 llama-cli.exe”:

  1. 打开 Windows 安全中心 → 病毒和威胁防护
  2. 点击"管理受控文件夹访问"
  3. 点击"允许应用通过受控文件夹访问"→ 添加允许的应用
  4. 浏览到 C:\Program Files\OFFTYPE\speech-server\_internal\llama-cpp\llama-cli.exe
  5. 确认

不添加会怎样? 翻译和润色功能不工作,语音输入(ASR)不受影响。你自己选择。

为什么不能自动帮你处理? 修改系统安全设置是对你电脑的重大变更,OFFTYPE 不会替你做这个决定。

首次使用

OFFTYPE 启动后会自动连接本地服务。如果模型还没下载,会提示你下载。

必须下载的模型

模型大小用途
SenseVoice~239 MB语音识别(必装)

首次启动会自动弹出下载窗口。

可选下载的模型

模型大小用途
Qwen3-ASR~988 MB多语种 + 方言增强:30 语种 + 22 种汉语方言(四川话、广东话、越南语、阿拉伯语等)
Local LLM(1.5B)~1.04 GB本地翻译/润色,不需要装 Ollama

没有 Local LLM 也能用语音输入。翻译和润色也可以选装 Ollama 用更大的模型。

基本使用

按住说话(PTT)

  1. 点击 "Push to Talk"
  2. 按住 Ctrl+Space,开始说话
  3. 说完松开 —— 文字自动上屏到你当前光标位置

这是默认模式,适合短句输入。

持续监听(VAD)

  1. 展开设置面板
  2. Trigger 选 VAD
  3. 开始说话 —— 软件自动检测说话和停顿,每说完一句自动上屏

不需要按键。适合大段语音输入。

如何判断 VAD 是否正常工作?

看 Push to Talk 按钮的颜色:

  • 绿灯闪烁(呼吸灯):检测到语音,正常工作
  • 绿灯常亮不灭:VAD 引擎已启动但未检测到语音,可能是麦克风问题或模型未加载成功。退出后重试,若仍常亮请检查 Preferences 中 ASR 模型是否已下载

切换模式

在展开面板的 Process 下拉框中选择:

模式效果
Input说话 → 文字(默认)
Translate说中文 → 翻译成目标语言上屏
Polish说中文 → 改写风格后上屏

设置面板

展开,包含 4 个配置项:

  • Trigger:PTT(按住说话)或 VAD(持续监听)
  • Process:Input / Translate / Polish
  • Target:目标语言(翻译模式)
  • Style:润色风格(Formal 正式 / Casual 随意 / Simple 简练)

偏好设置

点击齿轮图标打开。包含:

ASR Model

语音识别模型选择。下拉框自动显示已下载的模型,未下载的标注"(download required)"。

  • SenseVoice:默认,支持中英日韩粤 5 语种,速度快
  • Qwen3-ASR:30 语种 + 22 汉语方言(四川话、广东话、越南语等),速度比 SenseVoice 慢

Ollama

如果你已安装 Ollamaollama pull qwen2.5:7b),打开此开关可以用 7B 大模型做翻译和润色,质量比本地 1.5B 好。

Local LLM

Qwen2.5 1.5B 本地模型。没装 Ollama 时,翻译和润色全靠它。点击 Download 下载。

Dictionary

自定义词典编辑器。适合添加固定术语映射:

原文字替换为
壳牌OFFTYPE
阿里八八阿里巴巴

不能修方言口音问题。词典是纯文字替换,“四川人说四"和"是"没法靠字典区分。

Fast Typing

开启后使用 SenseVoice 内置标点,跳过 LLM 纠错。速度快,但标点可能不太准。适合快速输入。

托盘操作

关闭窗口(点 X)→ 缩到系统托盘,后台继续工作。双击托盘图标恢复窗口,右键菜单:

  • Show:恢复窗口
  • Exit:完全退出

故障排除

翻译/润色没反应?

  1. 偏好设置 → Ollama 开关是否开启且 Ollama 是否在运行?(开启且不在线 = 一直等连接)
  2. Local LLM 是否已下载?
  3. 是否被 Windows 受控文件夹访问拦截?(见上方"安装"章节)

下载速度慢?

  • SenseVoice 从 HuggingFace / ModelScope 下载,国内通常走 ModelScope,速度应正常。
  • Qwen3-ASR 从 GitHub Releases 下载,国内可能慢。软件会自动测速选最快的镜像。

启动后没反应?

  1. 等 5 秒 —— 服务端需要启动时间
  2. 打开任务管理器看 speech-server.exe 是否在运行
  3. 如果上一步已安装过旧版,手动杀进程再启动:taskkill /F /IM speech-server.exe

如何卸载?

  • 开始菜单 → 设置 → 应用 → 已安装的应用 → 搜索 OFFTYPE → 卸载。
  • 模型文件在 %APPDATA%\OFFTYPE\models\,卸载后需手动删除。

常见问题

OFFTYPE 会把我的声音发送到别处吗?

不会。语音识别、标点和翻译全部在你的机器上完成。请参阅隐私保护页面查看 Wireshark 证明。

OFFTYPE 能离线使用吗?

可以,在首次下载模型后即可完全离线使用。

能在 macOS 或 Linux 上使用吗?

目前不能。OFFTYPE 仅支持 Windows。macOS 和 Linux 不在近期路线图中。

有付费版吗?

OFFTYPE 目前完全免费,没有订阅,没有账户,没有支付。

能在企业网络环境中使用吗?

可以。OFFTYPE 仅在初始模型下载和可选更新检查时需要网络。之后完全离线工作。如果你的防火墙屏蔽了 Hugging Face,配置 ModelScope 镜像即可。

如何卸载?

Windows 设置 → 应用 → OFFTYPE → 卸载。要彻底删除所有数据,手动删除 `%APPDATA%\OFFTYPE\`。

获取支持

如果有问题,请发送邮件给我们,附上:

  • 你的 Windows 版本
  • OFFTYPE 版本(托盘图标 → 关于)
  • 你尝试做什么
  • 你看到的任何错误信息

还是不行?发送邮件至 support@offtype.app,附上你的 Windows 版本、OFFTYPE 版本、你尝试做什么以及任何错误信息。我们会阅读每一条消息。