热点
关于我们
xx
xx
"
视觉理解
" 相关文章
Response Wide Shut? Surprising Observations in Basic Vision Language Model Capabilities
cs.AI updates on arXiv.org
2025-07-15T04:24:16.000000Z
AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
AI前线
2025-07-13T07:11:52.000000Z
2025.07.11 | 长视频推理效率提升;单图像定制模型防过拟合。
HuggingFace 每日AI论文速递
2025-07-11T23:10:59.000000Z
2025.07.07 | GPT-4o在语义任务中表现良好;潜在空间模拟精度高。
HuggingFace 每日AI论文速递
2025-07-07T23:11:51.000000Z
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
智源社区
2025-05-31T07:44:06.000000Z
GPT-4o-Image仅完成28.9%任务,上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
36kr-科技
2025-05-30T09:33:22.000000Z
极限测试豆包视频通话,聊了一天一夜后我发现事情并不简单
爱范儿
2025-05-28T07:56:25.000000Z
小学数学题,大模型集体不及格!达摩院推出新基准VCBench
量子位
2025-05-23T00:45:17.000000Z
AI遭遇灵魂拷问,这道题所有模型集体翻车,网友:我也不会啊
36kr-科技
2025-05-19T12:43:41.000000Z
AI遭遇灵魂拷问!这道题所有模型集体翻车 网友:我也不会啊
快科技资讯
2025-05-19T12:11:41.000000Z
AI遭遇灵魂拷问!这道题所有模型集体翻车,网友:我也不会啊
量子位
2025-05-19T09:23:06.000000Z
视觉理解+深度思考,豆包深度思考模型来了
橘子汽水铺
2025-05-14T21:02:08.000000Z
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
机器之心
2025-05-14T19:00:01.000000Z
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
掘金 人工智能
2025-05-14T09:08:01.000000Z
告别“图文不符”!FG-CLIP实现细粒度跨模态对齐,360开源模型重塑AI视觉理解
智源社区
2025-04-29T14:30:25.000000Z
ICLR 2025 | 计算开销减半!Dynamic-LLaVA刷新多模态大模型推理加速上限
PaperWeekly
2025-04-27T16:37:28.000000Z
夸克AI超级框上新“拍照问夸克”功能:拍照就行、啥都能答
Cnbeta
2025-04-27T07:42:32.000000Z
夸克AI超级框上新“拍照问夸克”功能:拍照就行、啥都能答
快科技资讯
2025-04-27T04:16:43.000000Z
刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
机器之心
2025-04-18T09:01:10.000000Z
阶跃星辰Step-1o重大升级,多模态视觉双榜夺冠,国内第一!
阶跃星辰
2025-04-09T10:06:08.000000Z