[已开源] AI-Media2Doc: 一键音视频转文档

前言

大家好, 我是韩数，不知不觉间已经三个月没有更新博客了，不过我本地倒是积攒了非常多的文字，有时间整理下搬到掘金上，掘金虽然现在流量大不如前了，但是在我心中仍然算是小而美的。

不知不觉间，Nping 开源已经六个月了，在 Github 上也拿到了 1.8K 的 Star，不过最近太忙, 好久没有更新新版本了，完全 0 收入的情况下坚持了六个月也终于体会到了开源的艰辛, 不过自己仍然还是会尽量坚持下去维护的。 4 月份开始做小红书，当时想到能不能把一些知识视频一键转化成小红书笔记呢？于是网上搜了一些在线的 Saas 服务，实在是太贵了，一个月的费用都是按照美刀算的，溜了溜了，还好我的时间不值钱，不如自己开发一个算了，于是在 AI 的帮助下(我前端实在是写的太菜了)，完成了 AI-Media2Doc 的第一个 Mvp 版本，自己也总算是用上了。

虽然功能简陋不强大，但是依靠字节火山引擎免费送的额度，实测十块钱可以转录十个小时的视频还不止，这个成本已经低了非常非常多了，即使使用付费的服务，成本也要比第三方的 Saas 低很多。

📖 项目简介

AI-Media2Doc 视频图文创作助手是一款 Web 工具, 基于AI大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署，以极低的成本体验 AI 视频/音频转风格文档服务, 五块钱我开发测试了一月刚好用完。

github.com/hanshuaikan…

✨ 核心功能

完全开源

隐私保护

前端处理

多种风格支持

AI 对话

一键部署

🔜 未来计划

📷 支持智能截取视频关键帧，智能推荐文章图片。🎙️ 支持字幕生成，利用 ffmpeg 应该可以完成字幕合并的操作。🎨 学习前端 css, 努力重构前端页面，带来更加流畅丝滑的体验。

项目截图:

使用很简单，把音视频拖进去就行了。

支持生成思维导图也可以基于视频内容和 AI 进行二次对话。

思维导图:

关于部署

前后端我都编写了详细的本地部署流程，目前也支持了本地 Docker 一键启动, 本地启动起来应该不难，如果遇到问题直接和我提 Issue 就可以了，我看到一定会处理的。

前言

📖 项目简介

✨ 核心功能

🔜 未来计划

项目截图:

关于部署

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签