什么是 DeLive?
DeLive 是一个桌面转录工作台:捕获系统音频,路由到最合适的 ASR 后端,数据保留在本机,并将转录结果转化为可搜索、AI 驱动的复盘工作区。
核心能力
多 Provider ASR
DeLive 在统一界面下支持 六种 ASR 后端:
| Provider | 类型 | 模式 | 亮点 |
|---|---|---|---|
| Soniox V4 | 云端 | 实时流式 | Token 级转录、实时翻译、双语字幕、说话人分离 |
| 火山引擎 | 云端 | 实时流式 | 中文优化;内置代理处理所需 Header |
| Groq | 云端 | 窗口批处理 | Whisper large-v3-turbo,准实时更新 |
| 硅基流动 | 云端 | 窗口批处理 | SenseVoice、TeleSpeech、通义千问 Omni 模型 |
| 本地 OpenAI 兼容 | 本地 | 窗口批处理 | 兼容 Ollama 或任何 /v1/audio/transcriptions 端点 |
| 本地 whisper.cpp | 本地 | Electron 托管运行时 | 完全离线;DeLive 管理二进制文件和模型生命周期 |
AI 复盘工作台
录制结束后,会话进入全页复盘工作区,包含四个标签:
- 概览 — AI 摘要、行动项、关键词、章节、标题/标签建议
- 转录 — 带时间戳的分段,支持说话人标记,可导出 TXT/Markdown/SRT/VTT
- 对话 — 多线程 AI 对话,支持 GFM Markdown 渲染和代码高亮
- 思维导图 — 生成并编辑 Markmap 兼容 Markdown,导出 SVG/PNG
开放生态
DeLive 通过本地 API 暴露数据:
- REST API — 8 个端点,覆盖会话、主题、标签和录制状态
- WebSocket — 在
/ws/live进行实时转录推流 - MCP 服务器 — 独立 stdio 服务器,供 Claude Desktop、Cursor 等 AI Agent 使用
- Agent Skill — 为 AI Agent 提供结构化使用指南
本地优先架构
- 会话存储在 IndexedDB,配合内存缓存
- API 密钥通过 Electron
safeStorage加密 - 上下文隔离、可信 IPC 校验、CSP 注入
- Open API 默认关闭,可选 Bearer Token 鉴权
支持平台
DeLive 运行于 Windows、macOS 和 Linux。
| 平台 | 格式 |
|---|---|
| Windows | .exe 安装包、便携版 .exe |
| macOS | .dmg(Intel x64 和 Apple Silicon arm64) |
| Linux | .AppImage、.deb |