AI & Big Data 2024年12月25日
傳Google用Anthropic Claude測試Gemini模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌被曝聘请外包商比较自家Gemini模型与竞争对手Anthropic的Claude模型,以评估Gemini的回应质量。外包人员的内部通讯显示,他们最初评估Gemini的真实性和冗长程度,后来被要求比较两模型在安全性、效能等方面的表现。Claude在安全性方面表现更佳,例如拒绝扮演其他AI助理或回应色情要求,而Gemini则因包含裸露和性行为内容被认为严重违反安全规则。Anthropic禁止客户在未同意情况下使用Claude开发竞争产品。谷歌虽投资Anthropic,但否认使用Claude训练Gemini,并表示会比较不同模型输出。

🧐谷歌聘请外包商对比Gemini和Claude模型的回应质量,以评估Gemini的性能。

🛡️Claude模型在安全性方面表现突出,拒绝回应扮演其他AI助理或色情请求,而Gemini则出现违反安全规则的内容。

⚖️Anthropic的商业服务条款禁止客户在未经同意的情况下使用Claude开发竞争产品或训练AI模型,显示其对模型使用的严格控制。

AI開發競爭激烈,廠商一般是以業界標竿測試比較競爭者和自己的模型的執行結果。不過媒體Techcrunch報導,Google疑似聘請外包商比較對手Anthropic的Claude模型的回應,來評估自家Gemini模型的回應品質。媒體取得Google外包人員的對內通訊內容報導此事。一開始,這些外包員被分派評估Gemini模型回應內容,讓他們以特定標準如真實性、冗長程度來為Gemini打分數。但最新外包員被要求評比Anthropic的Claude和Google Gemini的回應內容,並比較兩模型在安全性、效能等其他屬性能力。根據媒體看到的外包員內部聊天內容,Claude被認為比Gemini更重視安全性。例如Claude在使用者要求扮演其他AI助理時不予回應。另外,Claude也拒絕回應有色情意味的要求,但Gemini的回應因有裸露和性行為內容,被外包員評論為「嚴重違反安全規則」。Anthropic對Claude的商業服務條款禁止客戶在未獲得同意情況下,以Claude打造競爭產品或訓練競爭AI模型。Google據信曾投資Anthropic至少23億美元。Google DeepMind對媒體表示,公司會比較不同模型輸出結果,但表示未曾以Anthropic的模型來訓練Gemini。DeepMind也未說明是否取得Anthropic的同意。Anthropic則未對此評論。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Gemini Claude AI模型评估 安全性 Anthropic
相关文章