热点
"指令遵循" 相关文章
推理能力飙升,指令遵循暴跌?MathIF基准揭示大模型“服从性漏洞”
PaperWeekly 2025-06-09T09:27:36.000000Z
【复杂指令遵循 Benchmark】论文分享:CodeIF-Bench
掘金 人工智能 2025-06-05T08:53:54.000000Z
上海AI Lab 提出ULTRAIF方法,通过两阶段过程合成高质量指令遵循数据集,代码与数据集完全开源!
掘金 人工智能 2025-05-30T03:23:05.000000Z
o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制
智源社区 2025-05-28T01:17:54.000000Z
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
智源社区 2025-05-27T05:23:03.000000Z
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
量子位 2025-05-24T11:56:19.000000Z
DeepSeek们越来越聪明,却也越来越不听话了
虎嗅 2025-05-20T14:29:40.000000Z
DeepSeek们越来越聪明,却也越来越不听话了。
数字生命卡兹克 2025-05-20T04:51:13.000000Z
「开源版GPT-4o」来了!这个17B国产模型生图效果比肩4o,还可商用
机器之心 2025-04-15T08:56:18.000000Z
论文 | 2025 | 论文综述:大型语言扩散模型(LLDM)
智源社区 2025-03-26T15:13:50.000000Z
GPT-4o 生图实测:很强(附:20+场景示例 & 缺陷整理)
赛博禅心 2025-03-26T09:57:36.000000Z
用ChatGPT新功能修了张图发朋友圈,结果私信全在问怎么做到的?
爱范儿 2025-03-26T09:48:34.000000Z
Achieving Critical Reliability in Instruction-Following with LLMs: How to Achieve AI Customer Service That’s 100% Reliable
MarkTechPost@AI 2025-03-23T17:54:37.000000Z
Meet Attentive Reasoning Queries (ARQs): A Structured Approach to Enhancing Large Language Model Instruction Adherence, Decision-Making Accuracy, and Hallucination Prevention in AI-Driven Conversational Systems
MarkTechPost@AI 2025-03-15T20:11:10.000000Z
IBM AI Releases Granite 3.2 8B Instruct and Granite 3.2 2B Instruct Models: Offering Experimental Chain-of-Thought Reasoning Capabilities
MarkTechPost@AI 2025-03-01T20:50:13.000000Z
SPAR:自我博弈,增强指令遵循
GLM大模型 2024-12-28T09:44:22.000000Z
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
机器之心 2024-12-18T09:24:10.000000Z
​阿里通义实验室发布IOPO,提升LLM复杂指令遵循能力
PaperWeekly 2024-12-06T13:06:14.000000Z
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
智源社区 2024-11-26T05:07:59.000000Z
指令跟随大比拼,Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
36氪 - 科技频道 2024-11-25T07:29:04.000000Z