原创 橘子OrangeAI 2025-06-16 12:11 北京
最近一年,国产大模型和国际领先的大模型,有两个巨大的差距:代码能力和视觉理解能力。
最近一年,国产大模型和国际领先的大模型,有两个巨大的差距:
代码能力和视觉理解能力。
DeepSeek R1 在 0528 版本更新之后,代码能力大幅提升,在我的初步测试中,已经基本达到 Claude 3.5 或以上的水平。
但遗憾的是 DeepSeek 一直没有支持视觉理解。
在 Vibe Coding 中,经常需要截图让 AI 改bug,还经常需要截图让 AI 复刻一个组件或页面,这些都离不开模型的视觉理解。
上周末看到 Doubao Seed 1.6 更新,不仅大幅提升了编程、数学、推理能力的同时,也支持文本、图片、视频的输入,终于把国产大模型的视觉理解能力也补齐了。
我用这个模型复刻了一堆网页,用完之后的感受是:
Doubao Seed 1.6 是国产大模型的写轮眼时刻。
我从复刻的一堆网页里,找出三个放在下面,可以一起看看这个写轮眼能力如何。
1. 小红书管理后台复刻
我们先来看看对小红书后台的复刻。
流程非常简单,打开一个网页、截图然后传到模型里、输入提示词【复刻这个网页】,我们就能得到一个复刻的网页了。
上面是原网页,下面是复刻好的网页,两个网页,风格一致、布局相仿。
当我去看左侧的菜单,发现每个菜单都配了合适的图标,太细了。
右侧的图片卡片排版,第一眼的感觉,审美比官方的还要好一点。
2. Product Hunt 官网复刻
Product Hunt,众所周知是国产 AI 软件的出海第一站。
整体网站的风格和布局都非常经典。
复刻版本的还原度非常高,顶栏、左侧、右侧,不仅是长得像,连页面滑动时,右侧的悬浮都很像。
并且复刻好的网页自带了移动端适配,适配效果比很多人类程序员写的网站都要好。
3. Linear 界面复刻
Linear 是业界口碑极好的项目管理工具,其高效简洁但不乏细节的设计理念令人印象深刻。
这种软件界面的细节非常多,复刻难度要比静态网页要高出不少。
复刻的网页布局相似,包含了很多可交互的小组件,遗憾的是在主面板中有明显的对齐问题。
模型的能力测试
除了复刻网页这个强项,我也对 Doubao Seed 1.6 做了一些其他测试。
比如天气卡片测试,这是第二个能做到国产模型。
宝可梦表情包测试
这是 Doubao seed 1.6,算接近 Claude 3.7 的水平了。
这是 Qwen3,目前还是很抽象的阶段。
这是 Claude 4 的,依然最强。
网页绘制测试
我让模型把 WWDC25 的所有信息做成了一个网页,并且参考官方的彩色渐变配色风格。
完成度非常不错,还有一些小动效细节加分。
模型使用
Doubao Seed 1.6 模型,目前可以在火山引擎进行调用,价格按照输入输出的长度进行计费。
最低:
推理输入 0.8元/百万tokens
推理输出 2元/百万tokens
最高:
推理输入 2.4元/百万tokens
推理输出 24元/百万tokens
详细信息和模型试用地址(包含50万token免费额度):
特别注意:
这个模型的使用有两个地方需要特别注意。
1.这个模型的上下文最大 256K,输出上下文最大 16K,但是不改参数的话,默认只有 4K。
4K 的时候画网页根本不够,所以一定要记得把最大输出改成 16K,特别是 ChatWise 这个客户端,每次都要填写,有点麻烦。
2.这个模型支持图片、视频输入,但是 Trae 里会提示模型不支持包含图片的提问,希望 Trae 赶紧更新,支持一下,不然很不方便。
结语
Doubao Seed 1.6,是国产大模型的的写轮眼时刻。
在视觉理解与代码生成的融合上实现了关键突破。
所见即所得的能力,加上低廉的使用价格。
会成为很多 AI 编程类产品的首选模型。
以上,就是今天橘子汽水铺分享的全部内容了。
既然看到这里了,不如顺手点赞、转发给朋友。
我们,下次再见👋。