傳Google用Anthropic Claude測試Gemini模型

AI & Big Data 2024年12月25日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

谷歌被曝聘请外包商比较自家Gemini模型与竞争对手Anthropic的Claude模型，以评估Gemini的回应质量。外包人员的内部通讯显示，他们最初评估Gemini的真实性和冗长程度，后来被要求比较两模型在安全性、效能等方面的表现。Claude在安全性方面表现更佳，例如拒绝扮演其他AI助理或回应色情要求，而Gemini则因包含裸露和性行为内容被认为严重违反安全规则。Anthropic禁止客户在未同意情况下使用Claude开发竞争产品。谷歌虽投资Anthropic，但否认使用Claude训练Gemini，并表示会比较不同模型输出。

🧐谷歌聘请外包商对比Gemini和Claude模型的回应质量，以评估Gemini的性能。

🛡️Claude模型在安全性方面表现突出，拒绝回应扮演其他AI助理或色情请求，而Gemini则出现违反安全规则的内容。

⚖️Anthropic的商业服务条款禁止客户在未经同意的情况下使用Claude开发竞争产品或训练AI模型，显示其对模型使用的严格控制。

AI開發競爭激烈，廠商一般是以業界標竿測試比較競爭者和自己的模型的執行結果。不過媒體Techcrunch報導，Google疑似聘請外包商比較對手Anthropic的Claude模型的回應，來評估自家Gemini模型的回應品質。媒體取得Google外包人員的對內通訊內容報導此事。一開始，這些外包員被分派評估Gemini模型回應內容，讓他們以特定標準如真實性、冗長程度來為Gemini打分數。但最新外包員被要求評比Anthropic的Claude和Google Gemini的回應內容，並比較兩模型在安全性、效能等其他屬性能力。根據媒體看到的外包員內部聊天內容，Claude被認為比Gemini更重視安全性。例如Claude在使用者要求扮演其他AI助理時不予回應。另外，Claude也拒絕回應有色情意味的要求，但Gemini的回應因有裸露和性行為內容，被外包員評論為「嚴重違反安全規則」。Anthropic對Claude的商業服務條款禁止客戶在未獲得同意情況下，以Claude打造競爭產品或訓練競爭AI模型。Google據信曾投資Anthropic至少23億美元。Google DeepMind對媒體表示，公司會比較不同模型輸出結果，但表示未曾以Anthropic的模型來訓練Gemini。DeepMind也未說明是否取得Anthropic的同意。Anthropic則未對此評論。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签