字节跳动在火山引擎 Force 大会上正式发布豆包视觉理解模型,该模型以极具竞争力的价格,千tokens输入仅需3厘,大幅降低企业使用多模态大模型的成本。同时,豆包3D生成模型首次亮相,结合火山引擎数字孪生平台,实现高效的AIGC创作。此外,豆包通用模型pro对齐GPT-4o,价格仅为后者的1/8,音乐模型升级至生成3分钟完整作品,文生图模型2.1版本首次实现精准生成汉字和一句话P图,多款产品迎来重要更新。火山引擎也升级了多款平台产品,包括火山方舟、扣子和HiAgent,进一步降低延迟和成本,并提供全域AI搜索。
🖼️ 豆包视觉理解模型:以极低的价格(千tokens 3厘)提供多模态大模型能力,一元可处理284张720P图片,成本仅为行业15%。
🧮 豆包3D生成模型:首次亮相,结合火山引擎数字孪生平台veOmniverse,支持AIGC创作的物理世界仿真模拟,用于智能训练、数据合成和数字资产制作。
🎵 豆包大模型产品更新:通用模型pro全面对齐GPT-4o,价格仅为1/8;音乐模型可生成3分钟完整作品;文生图模型2.1版本首次实现精准生成汉字和一句话P图功能。
🚀 火山引擎平台升级:火山方舟发布大模型记忆方案,降低延迟和成本;并推出全域AI搜索,提供场景化搜索推荐和企业私域信息整合服务。
在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。
此前,豆包视觉理解模型已经接入豆包App和PC端产品。会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
另外,火山引擎也升级了火山方舟、扣子和 HiAgent 三款平台产品。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。