掘金 人工智能 04月28日 10:32
DeepSeek + 通义万相+并行智算云打造高质量AI视频详细步骤
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了如何利用DeepSeek的脚本生成能力、通义万相的视频生成能力以及并行智算云的强大算力,高效地生成高质量的AI视频。文章详细阐述了从环境准备、视频脚本生成、视频素材生成、视频剪辑与合成,到视频优化与发布的完整流程,并提供了相应的代码示例。通过DeepSeek生成视频脚本,通义万相生成视频素材,FFmpeg进行剪辑合成,最后进行视频优化并发布到各大平台。此外,还介绍了如何通过对比优化前后的视频,进一步优化提示词,以获得更高质量的视频。

💻 环境准备与部署:首先需要在并行智算云上注册账号,选择合适的镜像与实例配置,并通过远程登录工具连接到实例,为后续操作奠定基础。

✍️ 视频脚本生成(DeepSeek):利用DeepSeek SDK,可以根据设定的风格、时长和主题,自动生成包含分镜头描述、旁白内容和镜头时长的视频脚本,极大地提高了视频创作的效率。

🎬 视频素材生成(通义万相):通过通义万相 SDK,根据脚本中的分镜头描述,可以生成对应的视频素材和旁白,并利用 FFmpeg 将这些素材按照脚本顺序进行拼接和添加字幕,从而完成视频的初步合成。

✨ 视频优化与发布:最后,使用通义万相的 VideoEnhancer 对合成后的视频进行色彩校正、帧插值和自动节拍剪辑等优化,然后通过 VideoPublisher 将优化后的视频自动发布到各大视频平台,实现一键发布。

📈 效果对比与优化:通过对比优化前后的视频,可以直观地看到优化带来的提升。根据生成效果,可以进一步调整 DeepSeek 的提示词,以获得更高质量的视频,从而不断优化视频生成的效果。

目录

    环境准备与部署

    视频脚本生成(使用 DeepSeek)

    视频素材生成(使用通义万相)

    视频剪辑与合成

    视频优化与发布

    效果对比与优化


1. 环境准备与部署

1.1 注册并行智算云账号

访问并行智算云官网,填写11307,充多少返多少。完成注册并登录。ai.paratera.com/#/registerhttps://ai.paratera.com/#/register

编辑

1.2 选择镜像与实例配置

在并行智算云平台中,选择适合通义万相2.1的镜像版本(如1.3B或14B参数版本),并根据需求配置实例(如显存大小等)。1.3B模型仅需8.2GB显存即可生成480P视频。

编辑

1.3 远程登录

完成实例部署后,通过远程登录工具(如SSH)连接到实例。


2. 视频脚本生成(使用 DeepSeek)

2.1 安装 DeepSeek SDK

在云实例中安装 DeepSeek 的 Python SDK。

2.2 生成视频脚本

Python

复制

from deepseek import VideoScriptGeneratorgenerator = VideoScriptGenerator(style="科技解说", duration=180, lang="zh")script = generator.generate(topic="量子计算原理", key_points=["量子比特", "叠加态", "量子纠缠"], examples=["参考油管大V风格"])print(f"生成分镜脚本:\n{script.to_json()}")

该脚本会包含视频的分镜头描述、旁白内容、镜头时长等信息。


3. 视频素材生成(使用通义万相)

3.1 安装通义万相 SDK

在云实例中安装通义万相的 Python SDK。

3.2 生成视频素材

Python

复制

from tywx import MediaGeneratorclass AssetFactory:    def __init__(self):        self.generator = MediaGenerator()    def create_scene(self, description):        return self.generator.video(prompt=description, resolution="1080p", style="cinematic", length=15)    def create_voiceover(self, text):        return self.generator.tts(text=text, voice="professional_male", speed=1.1)factory = AssetFactory()scene1 = factory.create_scene(script.scenes[0]['visual'])voice1 = factory.create_voiceover(script.scenes[0]['narration'])

根据脚本中的每个分镜头描述,调用通义万相模型生成对应的视频素材和旁白。


4. 视频剪辑与合成

4.1 安装 FFmpeg

在云实例中安装 FFmpeg,用于视频剪辑和合成。

4.2 生成 FFmpeg 配置文件

Python

复制

def generate_ffmpeg_config(assets):    with open("input.txt", "w") as f:        for asset in assets:            f.write(f"file '{asset['path']}'\n")            if asset['transition']:                f.write(f"file '{TRANSITIONS[asset['transition']]}'\n")    return "input.txt"

4.3 调用 FFmpeg 合成视频

Python

复制

import subprocessdef auto_edit(assets, output_path="final.mp4"):    config = generate_ffmpeg_config(assets)    cmd = f"ffmpeg -y -f concat -i {config} -c:v h264_nvenc {output_path}"    subprocess.run(cmd, shell=True, check=True)    add_subtitles(output_path, script.subtitles)

将生成的视频素材和旁白按照脚本顺序进行拼接,并添加字幕。


5. 视频优化与发布

5.1 视频优化

Python

复制

from tywx import VideoEnhancerenhancer = VideoEnhancer()enhanced_video = enhancer.process(input_path="final.mp4", enhancements=["color_grading", "frame_interpolation", "auto_beat_cut"])

对合成后的视频进行色彩校正、帧插值和自动节拍剪辑等优化。

5.2 视频发布

Python

复制

from tywx import VideoPublisherpublisher = VideoPublisher()publisher.upload(video=enhanced_video, platforms=["抖音", "B站", "YouTube"], auto_thumbnail=True)

将优化后的视频自动发布到各大视频平台。


6. 效果对比与优化

6.1 对比优化前后的视频

通过对比使用 DeepSeek 优化后的提示词生成的视频和未优化的视频,可以看到优化后的视频在细节和丰富度上有显著提升。

6.2 进一步优化提示词

根据生成效果,进一步调整 DeepSeek 的提示词,以获得更高质量的视频。


通过以上步骤,结合 DeepSeek 的脚本生成能力、通义万相的视频生成能力和并行智算云的强大算力,可以高效地生成高质量的 AI 视频

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI视频生成 DeepSeek 通义万相 并行智算云 FFmpeg
相关文章