掘金 人工智能 07月03日 19:07
5 秒预览物理世界,2 行代码启动生成——ComfyUI-Cosmos-Predict2 本地部署教程,重塑机器人训练范式!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了Cosmos-Predict2,一个基于Cosmos世界基金会模型(WFM)的物理AI生态系统,专注于未来状态预测,具备文本到图像和视频到世界生成功能。文章详细阐述了在ComfyUI中本地部署Cosmos-Predict2的步骤,包括环境配置、依赖安装、模型下载以及启动ComfyUI的流程,并提供了使用Cosmos-Predict2工作流的指导。旨在帮助用户在本地环境中体验和应用Cosmos-Predict2的强大功能。

🖼️ **Cosmos-Predict2 的核心功能**: Cosmos-Predict2 具备两项核心能力:文本到图像生成(Text2Image)和视频到世界生成(Video2World)。前者允许用户通过文本描述创建高质量图像,后者则能从视频输入生成视觉模拟。

💻 **本地部署环境准备**: 部署Cosmos-Predict2需要配置特定的环境,包括Python 3.12、PyTorch 2.5.1和CUDA 12.4。文章详细介绍了在Ubuntu 22.4.0系统上使用Miniconda安装和配置Python环境的步骤,包括更新系统、下载Miniconda、验证安装、运行安装脚本、激活环境以及更新conda。

⚙️ **ComfyUI 的安装与配置**: 本文详细说明了ComfyUI的安装流程,包括克隆代码仓库、创建conda虚拟环境、安装PyTorch和依赖项。此外,还介绍了ComfyUI Manager的安装方法,以及如何下载并放置Cosmos-Predict2所需的模型文件,包括文本到图像模型和视频到世界生成模型等。

🚀 **启动与使用**: 在完成所有准备工作后,用户可以通过运行`python main.py`命令启动ComfyUI,并在浏览器中访问指定网址(如http://127.0.0.1:8188)进入ComfyUI界面。文章最后,提供了使用Cosmos-Predict2工作流的简要指导,方便用户体验。

一、简介

Cosmos-Predict2 是 Cosmos 世界基金会模型 (WFM) 物理 AI 生态系统的一个关键分支,专门通过高级世界建模进行未来状态预测。它提供两项强大的功能:用于从文本描述创建高质量图像的文本到图像生成,以及用于从视频输入生成视觉模拟的视频到世界生成。

我们在下图中可视化了 Cosmos-Predict2 的架构。

模型

注意:

本次部署使用的是这两个模型,应为ComfyUI不支持多卡,因为使用的是4090,所以采用2B的模型。

Cosmos-Predict2-2B-Video2World:基于视频 + 文本的未来视觉世界生成

二、本地部署

注意:本文主要介绍部署到 ComfyUI 中使用

环境版本号
Python=3.12
PyTorch=2.5.1
cuda=12.4
Ubtuntu22.4.0

1.安装 Miniconda

步骤 1:更新系统
首先,更新您的系统软件包:

sudo apt updatesudo apt upgrade -y

步骤 2:下载 Miniconda 安装脚本
访问 Miniconda 的官方网站或使用以下命令直接下载最新版本的安装脚本(以 Python 3 为例):

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

步骤 3:验证安装脚本的完整性(可选)
下载 SHA256 校验和文件并验证安装包的完整性:

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh.sha256sha256sum Miniconda3-latest-Linux-x86_64.sh

比较输出的校验和与.sha256 文件中的值是否一致,确保文件未被篡改。

步骤 4:运行安装脚本
为安装脚本添加执行权限:

chmod +x Miniconda3-latest-Linux-x86_64.sh

运行安装脚本:

./Miniconda3-latest-Linux-x86_64.sh

步骤 5:按照提示完成安装
安装过程中,您需要:

阅读许可协议 :按 Enter 键逐页阅读,或者按 Q 退出阅读。
接受许可协议 :输入 yes 并按 Enter。
选择安装路径 :默认路径为/home/您的用户名/miniconda3,直接按 Enter 即可,或输入自定义路径。
是否初始化 Miniconda :输入 yes 将 Miniconda 添加到您的 PATH 环境变量中。
步骤 6:激活 Miniconda 环境
安装完成后,使环境变量生效:

source ~/.bashrc

步骤 7:验证安装是否成功
检查 conda 版本:

conda --version

步骤 8:更新 conda(推荐)
为了获得最新功能和修复,更新 conda:

conda update conda

2.部署 ComfyUI

2.1 克隆代码仓库

git clone https://github.com/comfyanonymous/ComfyUI.git

2.2 安装依赖

conda create -n comfyenv python==3.12conda activate comfyenv
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
cd ComfyUIpip install -r requirements.txt
#进入插件的文件cd /ComfyUI/custom_nodes/#下载ComfyUI Managergit clone https://github.com/Comfy-Org/ComfyUI-Manager.git

3.下载模型

推荐在魔搭社区中下载模型

#启动虚拟环境conda activate comfyenv#进入项目文件cd ComfyUI#下载modelscopepip install modelscope#下载模型文件到指定文件夹(需要下载三个模型)modelscope download --model Comfy-Org/Cosmos_Predict2_repackaged cosmos_predict2_2B_t2i.safetensors  --local_dir /models/diffusion_models/modelscope download --model Comfy-Org/Cosmos_Predict2_repackaged cosmos_predict2_2B_video2world_480p_16fps.safetensors  --local_dir /models/diffusion_models/modelscope download --model Comfy-Org/Cosmos_Predict2_repackaged cosmos_predict2_2B_video2world_720p_16fps.safetensors  --local_dir /models/diffusion_models/#下载vae模型modelscope download --model Comfy-Org/Wan_2.1_ComfyUI_repackaged split_files/vae/wan_2.1_vae.safetensors --local_dir /models/vae/#下载text_encoders模型modelscope download --model comfyanonymous/cosmos_1.0_text_encoder_and_VAE_ComfyUI text_encoders/oldt5_xxl_fp8_e4m3fn_scaled.safetensors --local_dir /models/text_encoders/

模型网址:

Cosmos_Predict2_repackaged · 模型库

Wan_2.1_ComfyUI_repackaged · 模型库

cosmos_1.0_text_encoder_and_VAE_ComfyUI · 模型库

模型名称:

cosmos_predict2_2B_t2i.safetensors

cosmos_predict2_2B_video2world_480p_16fps.safetensors

cosmos_predict2_2B_video2world_720p_16fps.safetensors

模型放置路径:ComfyUI/models/omnigen2_fp16.safetensors

oldt5_xxl_fp8_e4m3fn_scaled.safetensors

模型放置路径:ComfyUI/models/text_encoders

wan_2.1_vae.safetensors
模型放置路径:ComfyUI/models/vae

4.启动 ComfyUI

python main.py

输入网址进入 ComfyUI:

http://127.0.0.1:8188

5.使用 Cosmos-Predict2 工作流


点击如图所示的文件图标,然后选取想使用的 Cosmos-Predict2 工作流

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Cosmos-Predict2 ComfyUI AI绘画 文本到图像 视频生成
相关文章