快科技资讯 2024年12月18日
字节跳动正式发布豆包视觉理解模型:1元可处理近300张高清图
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

字节跳动在火山引擎Force大会上正式发布豆包视觉理解模型,该模型以极具性价比的多模态大模型能力为企业赋能。其千tokens输入价格仅为3厘,一元可处理284张720P图片,成本远低于行业平均水平,旨在推动AI技术普及。豆包视觉理解模型不仅能精准识别图像内容,还具备强大的理解和推理能力,可进行复杂的逻辑计算,处理图表、代码和解答学科问题。该模型已应用于豆包App和PC端产品,并计划在2025年春季推出更强大的视频生成模型1.5版和实时语音模型。目前,豆包大模型已与多家主流汽车品牌合作,覆盖3亿终端设备,调用量在半年内增长百倍。

🖼️ 豆包视觉理解模型以低至3厘/千tokens的价格,大幅降低了多模态AI的使用成本,一元钱即可处理284张720P图片,比行业平均价格便宜85%。

🧠 该模型不仅能识别视觉内容,还具备出色的理解和推理能力,可进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,展现强大的AI能力。

🚀 豆包大模型已广泛应用于豆包App、PC端产品,并与八成主流汽车品牌合作,覆盖约3亿终端设备,半年内调用量增长100倍,体现了其强大的市场应用潜力。

🎥 字节跳动计划在2025年春季推出豆包视频生成模型1.5版,该版本将具备更长的视频生成能力,同时豆包端到端实时语音模型也将很快上线,进一步拓展豆包大模型的能力边界。

快科技12月18日消息,在今天举办的火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。

豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。

火山引擎总裁谭待介绍,豆包视觉理解模型不仅能精准识别视觉内容,还具备出色的理解和推理能力,可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务。

此前,豆包视觉理解模型已经接入豆包App和PC端产品。

值得一提的是,字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线

目前,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

豆包视觉理解模型 多模态大模型 AI普惠 字节跳动 火山引擎
相关文章