掘金 人工智能 07月17日 10:05
【开源软件推荐】 SmartSub,一个可以快速识别视频/音频字幕的工具
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了一款名为妙幕SmartSub的跨平台开源工具,用于将语音转换为字幕。作者因剪映App的字幕识别功能收费过高,转而寻找替代方案,最终发现了妙幕SmartSub。该工具基于OpenAI的Whisper模型,支持离线运行,并提供多种模型选择,包括适合国内环境的镜像模型。文章详细介绍了妙幕SmartSub的下载、安装、使用方法,以及在剪映中导入字幕的流程,强调了其快速、准确的识别效果和便捷的校对功能。

🎤 妙幕SmartSub是一款跨平台客户端工具,完全开源免费,在Github上拥有2.6k的星标,更新频率高,支持视频和音频文件。

💡 该工具基于OpenAI的Whisper模型,提供离线运行能力,并整合了模型,还支持接入百度火山deepseek等大模型服务对字幕进行翻译,满足不同需求。

💾 使用方面,用户需从Github Release页面下载对应系统的安装包,安装后下载所需模型。作者推荐使用large-v3-turbo-q8_0模型,亲测效果快速准确。

📝 妙幕SmartSub提供校对功能,在播放时实时定位字幕,方便用户校对。校对无误后,字幕文件可保存为.srt格式,并导入剪映等视频编辑软件中使用。

背景介绍

我就说Github上面能找到好东西吧

事情是这样的

我最近在用PC端的剪映剪辑视频

需要用到它的语音转字幕功能

转完之后,导出的时候

发现 赫然有一项字幕识别的会员权益

我寻思看看什么价格

不贵的话就充了

好家伙,这不看不知道,一看吓一跳

599?一年?

连续包年首年也需要399的啊喂!

我......就用个转字幕,其他功能基本上都用不上的

真不划算啊

但凡250以内我还考虑一下

手动加字幕,那也有点太累了

寻找替代方案

Github 上去搜搜

关键字:

语音转文本, 语音转字幕, voice to srt

反正用这几个关键字结合搜索了一下

大概有了点认知,目前市面上比较流行的语音转文本的方案

基本上都是基于 openaiwhisper 模型的,可以离线运行

发现神器:妙幕SmartSub

最终筛选出来这个应用

妙幕SmartSub

是个跨平台客户端工具,完全开源免费,在Github上已经有 2.6k 的 star 了

截止到现在已经有 194个commit 了,更新频率很高,上次提交是在 一周前

界面样式也还挺好看,视频和音频都支持

做了模型整合,也有适合国内宝宝体质的镜像模型

还支持接入百度火山deepseek等大模型服务对字幕进行翻译

这是官方的特性

如何选择模型

就是它了!

下载安装

下载也很方便, Realease页面有不同系统的安装包,下载安装即可

github.com/buxuku/Smar…

作者也很贴心的加上了夸克网盘的下载链接

使用教程

安装之后打开,先下载几个模型

模型的选择和注意事项上文已经提到过,更详细的请查看官方 Github 仓库说明文档

如果遇到下载比较慢的情况,建议切换至国内模型镜像站点

模型下载完之后,上传你的视频或者音频,在左侧菜单栏选择模型,开始任务

我用的 large-v3-turbo-q8_0 模型,亲测效果巨好,5分多钟音频 22秒 就识别完成了,又快又准

校对与导出

识别完成之后可以点击校对按钮,弹出校对模块

这里会在播放的时候,实时定位到哪一行字幕。

太细节了吧!!!

校对无误后点击保存

字幕文件默认跟你导入的音视频文件在一个根目录下

字幕导入剪映

接下来打开剪映,选择文本 - 导入本地字幕

将校对完成后的字幕文件 .srt 拖入剪映字幕中

完活儿~


如果对您有所帮助,还请不要忘了点个关注呦

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

妙幕SmartSub 语音转字幕 开源 Whisper模型 剪映
相关文章