原创 小茸茸 2025-05-23 09:39 重庆
Mistral AI 发布高精度 Document AI:支持公式手写多语言解析;DMind-1:专为 Web3 领域优化的大模型;Anthropic 发布 Claude 4 系列;昆仑万维天工超级智能体:支持文档到音视频的全能 AI 创作
Mistral AI 发布高精度 Document AI:支持公式手写多语言解析
Mistral AI[1] 最新推出企业级 Document AI 解决方案,基于 OCR 技术实现高精度文档解析。
官方号称该产品能够以 99% 以上的准确率提取复杂文本内容,包括数学公式、手写笔记、表格数据和图像信息,并支持全球多种语言处理。
背后应该是通过Mistral OCR [2]提供支持,之前佬友实测似乎效果一般。
Mistral Document AI 官网: https://mistral.ai/solutions/document-aiMistral OCR 实测报告: https://sanhua.himrr.com/news/049f1389-685a-4a1f-b3c4-657d1fb54837
DMind-1:专为 Web3 领域优化的大模型
DMind-1[3] 是专为 Web3 领域任务(如区块链、DeFi、智能合约开发等)优化的专用大模型。基于 Qwen3-32B 进行深度微调,在 Web3 专项基准测试中性能表现远超所有一线通用模型。
有搞 Web3 的佬友们可以重点关注下这个!
DMind-1 官网: https://dmind.ai/
Anthropic 发布 Claude 4 系列
Anthropic 正式发布 Claude4 系列型:Claude Opus 4[4] 和 Claude Sonnet 4。这两款模型都是混合模型支持低延迟的即时响应模式和深度推理模式。
Claude Opus 4 在编程能力应该是世界顶级。其兄弟型号 Sonnet 4 也实现了重大升级,在编程和逻辑推理能力上都有显著提升。
两款模型均已面向所有付费用户开放。Sonnet 4 也向免费计划提供。
Claude Opus 4 详情页: https://www.anthropic.com/news/claude-4
昆仑万维天工超级智能体:支持文档到音视频的全能 AI 创作
昆仑万维推出的天工(Skywork)[5]超级智能体基于先进的 AI Agent 架构和 Deep Research 技术,能够一站式生成多种内容格式:文档、PPT、表格、网页、播客以及音视频等多模态内容。
官方还提供了国际版[6],佬们可以实际体验对比效果。
值得一提的是,其深度研究 Agent[7] 已在 GitHub 上开源。
天工国内版官网: https://www.tiangong.cn/天工国际版官网: https://skywork.aiSkyworkAI GitHub开源项目: https://github.com/SkyworkAI/DeepResearchAgent
❝如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注、点赞、在看、收藏、分享 五连警告,这对我真的很重要!