暗涌Waves 01月06日
独家|3个月估值超2亿美金!00后大模型公司再获数千万美金融资
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Sapient Intelligence获数千万美金Seed+轮融资,致力于开发通用大模型,跳过LLM理论限制,其模型在数独等问题上表现出色,已完成新模型预训练并组建双研发中心。

Sapient Intelligence再获数千万美金融资,投资方包括JAFCO等

该模型致力于解决复杂问题,能跳过LLM限制,像人类一样思考

模型在数独游戏中准确率超95%,具有速度和准确率优势

已完成新模型架构预训练并进行多问题测试,性能超Llama模型

组建北京&湾区双研发中心,新加入清华北大研究员等人才

原创 暗涌 2024-12-12 09:01 北京


 | 徐牧心



「暗涌Waves」获悉,Sapient Intelligence再获数千万美金Seed+轮融资,距离上一轮千万级美金融资仅过去不到3个月。本轮投资方包括日本最大的私募股权投资集团JAFCO以及其他知名海外投资机构。Minerva Capital持续担任长期独家财务顾问。

我们曾在《那个要挑战GPT的00后清华男孩|WAVES》报道过Sapient及其创始人,00后清华毕业生王冠。Sapient致力于开发一个用于解决复杂问题的通用大模型,从而跳过LLM的理论限制,使AI能更快达到L2阶段,即拥有长程推理能力,甚至能像人类一样思考和自我进化。

Sapient Intelligence的联创Austin表示,Sapient模型研发至今,已达成数个里程碑节点,尤其在于该模型在数学类开放问题中的自我学习能力。以专家级的数独游戏为例,该模型的准确率可以超过95%,这是以GPT架构为基础的模型无法做到的。Austin告诉我们,这种速度和准确率上的优势在于:“其他模型本质上是通过用海量CoT数据,把数独的解法通过数据蒸馏到模型里,而Sapient不需要任何中间步和CoT数据。”

目前,Sapient已经完成首个新模型架构的预训练,新模型Sapient H已经在复杂约束满足问题、高维离散变量最优化问题以及数学推理问题上进行了测试,从有效性、准确率、参数效率和模型性能上均超过经过深度网络优化的Llama DeepNet 100L模型。团队方面,Sapient已经完成北京&湾区双研发中心的组建,新加入的技术人才包括清华北大的资深研究员,Deepseek和强化学习之父Richard Sutton团队的核心成员等。

图片来源 |《Detroit: Become Human》官方截图

排版|刘鸿宇




阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sapient Intelligence 通用大模型 数独 研发中心 融资
相关文章