AI & Big Data 06月23日
人類AI評估系統Yupp上線,可測試逾500個大型語言模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Yupp是一个去年成立的AI新创公司,推出了一个用户评估系统,旨在帮助用户比较和评估全球超过500个大型语言模型,包括ChatGPT、Claude、Gemini等。用户通过提问、比较不同模型的回答并提供反馈,从而获得积分,这些积分可用于持续使用模型或兑换奖励。Yupp的AI VIBE排行榜基于用户反馈,为用户提供了不同维度下的最佳模型列表,从而帮助用户更好地选择和使用AI模型。

💡Yupp平台允许用户比较不同AI模型的回答,并提供优劣原因的勾选,用户也可直接输入意见。

💰用户通过反馈可以获得积分,积分可用于持续使用模型或兑换加密货币及法币,新注册用户可获得5,000积分。

📊Yupp AI VIBE排行榜基于用户反馈,提供了包括最受欢迎、最快、最佳低价、最佳开源等多个维度的模型排名。

🔒用户提示是私密的,除非用户选择分享。Yupp通过收集全球用户的反馈数据,帮助AI模型供应商改进系统。

去年成立的AI新創Yupp日前正式推出人類評估系統,邀請使用者協助評估全球逾500個大型語言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama 等,也涵蓋了必須付費訂閱的各種Pro與Max模型,並根據使用者的回饋制定Yupp AI VIBE(Vibe Intelligence BEnchmark)排行榜

曾於Twitter共事的Pankaj Gupta與Gilad Mishne是在2024年6月共同創立了Yupp,當時獲得了由Andreessen Horowitz(a16z)領投的3,300萬美元的種子資金,也有超過40名科技業的天使投資人參與,包括Twitter共同創辦人Biz Stone、Google首席科學家Jeff Dean、Perplexity AI 執行長Aravind Srinivas,以及Coinbase法務長Paul Grewal等。

當使用者在Yupp上問問題時,系統會提供兩個不同模型的答案供使用者比較,並列出優、劣原因供使用者勾選,亦允許使用者直接輸入意見,回答後系統就會出現「積分刮刮樂」,讓使用者刮出積分,這些積分可用來持續使用模型,或是用來兌換加密貨幣及法幣,目前新註冊的使用者可直接獲得5,000積分。

圖片來源/Yupp

系統所提供的模型可能是隨機的、符合提示需求的、匿名的,但使用者也可指定特定模型來回答,一個問題最多可測試6個模型,但如果一直問問題卻不提供比較結果,就可能會被系統踢出去。

Yupp執行長Gupta說明,該平臺透過Yupp積分運作,每個人在註冊時都會收到積分,以用來使用各種AI模型,也會因為回饋而獲得積分,回饋的品質愈高,積分就愈多;使用者的提示永遠是私密的,除非使用者選擇對外分享。

Gupta表示,回饋有助於打造個人化AI,也可幫助AI社群建置更好的模型。來自一個用戶的意見或許不夠可靠,但凝聚全球數百萬用戶的資料便會產生強大的訊號,讓AI模型供應商可以使用這些訊號來改善它們的系統及代理人。

至於Yupp AI VIBE提供了使用者最喜愛的模型、最快的模型、最好的低價模型、最好的開源模型、最好的圖像生成模型、最好的推理模型、最好的即時模型、最好的文字模型,以及最常被否決的模型的列表供外界參考。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Yupp AI模型评估 用户反馈 AI VIBE
相关文章