前言
大家好, 我是韩数,不知不觉间已经三个月没有更新博客了,不过我本地倒是积攒了非常多的文字,有时间整理下搬到掘金上,掘金虽然现在流量大不如前了,但是在我心中仍然算是小而美的。
不知不觉间,Nping
开源已经六个月了,在 Github
上也拿到了 1.8K 的 Star,不过最近太忙, 好久没有更新新版本了,完全 0 收入的情况下坚持了六个月也终于体会到了开源的艰辛, 不过自己仍然还是会尽量坚持下去维护的。 4 月份开始做小红书,当时想到能不能把一些知识视频一键转化成小红书笔记呢? 于是网上搜了一些在线的 Saas 服务,实在是太贵了,一个月的费用都是按照美刀算的,溜了溜了,还好我的时间不值钱,不如自己开发一个算了,于是在 AI 的帮助下(我前端实在是写的太菜了),完成了 AI-Media2Doc
的第一个 Mvp 版本,自己也总算是用上了。
虽然功能简陋不强大,但是依靠字节火山引擎免费送的额度,实测十块钱可以转录十个小时的视频还不止,这个成本已经低了非常非常多了,即使使用付费的服务,成本也要比第三方的 Saas 低很多。
📖 项目简介
AI-Media2Doc 视频图文创作助手是一款 Web 工具, 基于AI大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务, 五块钱我开发测试了一月刚好用完。
✨ 核心功能
- ✅ 完全开源:MIT 协议授权,支持本地部署。🔒 隐私保护:无需登录注册,任务记录保存在本地💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。🤖 AI 对话:支持针对视频内容进行 AI 二次问答。🐳 一键部署:支持 Docker 一键部署。
🔜 未来计划
- 📷 支持智能截取视频关键帧,智能推荐文章图片。🎙️ 支持字幕生成,利用 ffmpeg 应该可以完成字幕合并的操作。🎨 学习前端 css, 努力重构前端页面,带来更加流畅丝滑的体验。
项目截图:
使用很简单,把音视频拖进去就行了。
支持生成思维导图 也可以基于视频内容和 AI 进行二次对话。
思维导图:
关于部署
前后端我都编写了详细的本地部署流程,目前也支持了本地 Docker 一键启动, 本地启动起来应该不难,如果遇到问题直接和我提 Issue 就可以了,我看到一定会处理的。