十二大 ASR 后端,统一界面
Soniox、火山引擎、ElevenLabs、Mistral AI、Gladia、Deepgram、AssemblyAI、Cloudflare Workers AI、硅基流动、Groq、本地 OpenAI 兼容、本地 whisper.cpp — 三种执行模式覆盖所有场景。
实时转录、AI 复盘、智能归档 — 尽在一个桌面应用










高级 UI 重构、八种主题配色、AI 流式对话、实时波形等
上传音频/视频文件,使用十种云端 ASR 引擎离线转录 — Soniox、火山引擎、ElevenLabs、Mistral、Gladia、Deepgram、AssemblyAI、Cloudflare、硅基流动和 Groq。支持说话人分离和词级时间戳。
新增 ASR 提供商 — 基于 Whisper 模型的 Cloudflare Workers AI 转录。低成本、免费额度充裕,支持 VAD 过滤和防幻觉。
Solaria-1 实时流式转录,延迟低于 300ms,支持 100+ 种语言。内嵌代理处理会话初始化和认证。
纠错流式文本跨标签页持久化、实时进度显示(字数、已用时间)、改进的 AI 分析状态追踪。
AI 后处理现在自动使用纠错后的文本。支持偏好设置(自动 / 始终原始 / 始终纠错后),各标签页实时状态横幅。
Provider 选择列表重新排序:Soniox、火山引擎、ElevenLabs、Mistral AI、Gladia、Deepgram、AssemblyAI、Cloudflare、硅基流动、Groq、本地 OpenAI、whisper.cpp。
扩展测试套件至 32 个文件 314 个测试,新增 AI 校正、假设缓冲区、PCM/WAV 编码等测试覆盖。
提取 WindowedBatchTranscriptionProvider 基类 — 共享区间重转写、静音检测和假设缓冲区管理逻辑。
主进程托盘菜单、对话框标题和系统通知现在跟随用户语言设置。