开源自荐：自部署的多平台（YouTube/B站/抖音/小红书/播客）音视频转文字+总结服务

zhanglixing · 2026 年4 月 3 日 02:58

工具名称

多平台音视频下载=》本地转录成文字=》调用 LLM 总结=》生成网页版 & 推送到企业微信群在微信查看。

贴链接就能用：支持 YouTube / B站 / 抖音 / 小红书 / 小宇宙 / 通用直链，不用自己下载视频
全流程自动化：下载 → 本地 ASR 转录 → LLM 校对错别字 → 生成内容总结，一个请求全部搞定
标准 API 接口：天然适合接入各种自动化平台。比如 iOS 捷径在 Safari 里分享链接直接转录，Android 用 Fv 悬浮球一键触发，Windows 用 Quicker
选中链接就出文字稿，也可以接飞书/Slack 机器人给团队用
有网页版查看页面：转录结果生成独立网页，带一键复制按钮，方便直接丢进 ChatGPT、豆包、Kimi 等 LLM 工具里继续追问
本地 ASR，不走第三方：语音识别跑在自己机器上，没有敏感词审查、没有内容风控、没有按分钟计费，爱转什么转什么
说话人识别：自动区分"谁在说话"，再用 LLM 把说话人1 说话人2 还原成真实姓名，播客/访谈类内容阅读体验好很多

话题		回复	浏览量
【开源自荐】一个全程免费的音频转录+校准+摘要工具，支持API调用发现频道	0	352	2025 年6 月 9 日
【自荐】VideoCaptioner - 基于 LLM 的智能视频字幕助手，支持生成、断句、优化、翻译全流程，一键高质量字幕视频合成！发现频道	12	1516	2024 年11 月 15 日
一个离线运行的本地语音识别工具讨论分享 openai	2	977	2024 年1 月 2 日
几款开源的视频生成字幕、字幕翻译项目讨论分享字幕	7	1854	2025 年3 月 2 日
【开源工具推荐】自部署的飞书妙记/通义听悟——pickpod 发现频道 chrome	0	1307	2023 年8 月 31 日