第一财经杂志 2024年07月20日
百度推出数字人视频聊天App「文小言」;海螺AI测试「悬浮球」功能……|本周模型与应用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本周AI领域发生多项更新:OpenAI推出GPT-4o mini,百度发布「文小言」App,海螺AI测试「悬浮球」功能,Mistral发布新模型,Cropin Technology推出智能解决方案。

🌟 OpenAI发布GPT-4o mini,这是一个参数更小的简化版本,成本降低超过60%,性能在多任务语言理解测试中表现优异,尤其在数学能力上,GPT-4o mini展现了较高的正确率。

📱 百度推出「文小言」AI数字人社交App,提供仿真数字人形象和视频聊天体验,虽然数字人在肢体动作上尚有僵硬感,但交互方式多样,包括手写、语音、图片等。

🎈 海螺AI测试「悬浮球」功能,该功能允许用户在不切换界面的情况下与AI进行交互,提供总结文章要点、识别物品、语音对话等便捷服务。

🧮 Mistral发布两款新模型,Codestral-Mamba-7B和Mathstral-7B,分别面向代码生成和数学推理,Mathstral-7B在数学推理上超越了同类模型。

🌾 Cropin Technology推出Sage智能解决方案,预测农作物未来产量,结合生成式AI和多年气候数据,为农业提供数字化运营支持。

本周模型与应用

OpenAI发布GPT 4o mini,加入小模型竞争;

百度推出数字人视频聊天App「文小言」;

海螺AI测试「悬浮球」功能;

Mistral发发布两款新模型,这次注重数学能力;

Cropin Technology发布解决方案预测农作物的未来产量。

 

本周模型与应用

OpenAI发布GPT 4o mini,加入小模型竞争

7月19日,OpenAI发布GPT-4o更小参数量的简化版本——GPT-4o mini。即日起,ChatGPT的用户可以免费使用GPT-4o mini而非GPT-3.5 Turbo了,企业用户也将在下周获得GPT-4o mini的权限。

OpenAI称,GPT-4o mini每百万token的输入成本仅为15美分,每百万token的输出成本为60美分,相较于GPT-3.5 Turbo降低了超过60%。

而在性能上,OpenAI称GPT-4o mini在大规模多任务语言理解(MMLU)测试中取得了82%的得分,高于竞品的Gemini Flash(77.9%)和Claude Haiku(73.8%),Gemini Flash和Claude Haiku分别是Gemini和Claude的小模型。尤其在数学能力上,OpenAI声称GPT-4o mini表现更好,在MGSM数学推理能力基准测试中,GPT-4o mini、Gemini Flash、Claude Haiku分别有87.0%、 75.5%和71.7%的正确率。

 

百度推出数字人视频聊天App「文小言」

百度近日上线了一款名为「文小言」的 AI 数字人社交App,用户在该App中不仅可以文字聊天,还可以直接和虚拟人视频对话。

和其他AI聊天产品相比,该App最大的区别在于其界面中呈现大幅仿真数字人形象,试图塑造真人在线视频聊天的体验。数字人有自己的年龄、地方、性格、职业的特色设置,不仅能呈现面部表情,也支持身体语言等复杂动作。用户能通过手写、语音、发送图片等方式与其互动,数字人则以语音、文字及肢体语言回应。

不过实测体验中,数字人在肢体动作上仍有一定的僵硬感。目前该App也不支持用户创建自己专属的数字人,仅可使用官方预设的数字人。

 

海螺AI测试「悬浮球」功能

有报道称海螺AI正在测试「悬浮球」功能。该App是由AI独角兽MiniMax研发的智能聊天机器人,支持文本、音频和图像等多模态互动。

此次新推出的「悬浮球」功能允许用户在操作其他应用时,无需切换界面,即可通过悬浮在操作界面最上层的「悬浮球」图标随时与海螺AI交互。例如在阅读长篇文章时,用户可直接通过悬浮球让海螺AI总结要点;遇到不认识的物品,拍照后通过悬浮球也能快速了解相关信息;此外,用户还可以直接利用悬浮球与海螺AI语音对话。

「悬浮球」功能相当于一种插件,某种程度上提供了类似于操作系统级的AI体验,这一赛道是微软、苹果等巨头正在争夺的阵地。MiniMax成立于2021年,今年4月时其估值已超过25亿美元。

 

Mistral发发布两款新模型,这次注重数学能力

7月16日,法国AI初创公司Mistral AI发布了两款7B级别的AI模型,分别是代码生成模型Codestral-Mamba-7B和专注于数学推理的Mathstral-7B模型。

Codestral Mamba 7B模型是面向程序员和开发人员的代码生成工具,具有更快的推理速度和更长的上下文处理能力。该模型能够处理高达25.6万个token的输入,是OpenAI GPT-4o模型的两倍。

Mathstral 7B模型则是专为数学相关推理和科学发现而设计,拥有32K的上下文窗口。Mistral AI声称,该模型在数学推理方面的表现超越了所有同类模型,尤其是在需要更多推理时间的计算基准上,能够获得更好的结果。

目前,这两款新模型均在其la Plateforme API上免费使用,并通过GitHub和HuggingFace提供源代码,以便开发人员可以修改和部署。

一个月前,这家成立于2023年的公司刚刚完成了约合6.4亿美元的B轮融资,估值达到64亿美元。此前,Mistral AI已经获得了累计超过5亿美元的三轮融资,投资者包括英伟达、微软、Salesforce等科技公司,以及Lightspeed和Andreessen Horowitz等硅谷风投。

 

Cropin Technology发布解决方案预测农作物的未来产量

7月17日,农业科技公司Cropin Technology Solutions推出了一款名为Sage的实时智能解决方案,该方案能够预测13种关键作物的未来产量。据Cropin提供的数据,全球农业土地面积达到48亿公顷,该公司的技术将生成式AI与40年的气候数据、地球数据和知识图谱相结合,逐国解码每种作物,从而能够预测特定作物在本季、明年或未来5年的表现。

Cropin成立于2010年,总部位于印度班加罗尔。该公司开发了全球首个农业行业的云平台Cropin Cloud,通过AI、遥感、数据分析等技术,帮助客户从农场到餐桌的各个环节实现数字化运营。

Cropin的Sage解决方案是与Google的Gemini模型合作开发的。Cropin的创始人兼首席执行官Krishna Kumar表示,随着世界人口激增和食品安全问题增加,生成式AI和LLM有潜力在受气候影响的世界中转变现代农业,从而帮助从消费品制造商、种子制造商到金融机构和政府等一系列客户规划作物生产。

图片来源:unsplash

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT-4o mini 百度 文小言 海螺AI 悬浮球 Mistral AI模型 Cropin Technology 智能解决方案
相关文章