Reddit CEO吐槽封锁必应等搜索引擎太麻烦微软等公司总想着白嫖数据

蓝点网 2024年08月01日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Reddit 最近封禁了包括必应、DuckDuckGo 在内的多个搜索引擎，原因是这些搜索引擎未经授权抓取 Reddit 内容用于训练 AI 模型，而没有支付任何费用。Reddit 首席执行官表示，搜索引擎从网站获取内容并用于训练模型，而不提供任何补偿的传统模式正在发生改变，抓取内容以换取流量的价值正在变得模糊。

🤔 Reddit 封禁必应等搜索引擎的原因：这些搜索引擎未经授权抓取 Reddit 内容用于训练 AI 模型，但没有支付任何费用。 Reddit 认为，搜索引擎从网站获取内容并用于训练模型，而不提供任何补偿的传统模式正在发生改变。过去，搜索引擎索引网站内容并为网站带来流量，这是一种等价交换。但现在，搜索引擎抓取数据用于训练模型，不再是等价交换。

💰 Reddit 要求搜索引擎为抓取内容付费： Reddit 首席执行官表示，搜索引擎从网站获取内容并用于训练模型，而不提供任何补偿的传统模式正在发生改变。他认为，抓取内容以换取流量的价值正在变得模糊，搜索引擎应该为抓取内容付费。

🚫 微软等公司拒绝与 Reddit 进行内容授权谈判：据悉，微软等公司已经明确拒绝与 Reddit 进行内容授权谈判。即使被封禁，他们也不会向 Reddit 支付任何费用换取解禁或购买内容数据。

📈 AI 数据付费成为新趋势： Reddit 的举动引发了人们对 AI 数据付费的思考。随着 AI 技术的发展，越来越多的公司开始使用网络数据训练 AI 模型。这引发了关于数据所有权和使用权的争议。 Reddit 的做法表明，未来，越来越多的网站可能会要求 AI 开发者为使用其数据付费。

早前知名网络社区 Reddit 已经封禁除谷歌以外的所有搜索引擎，也就是只允许谷歌继续抓取 Reddit 上的内容并将其编入索引，原因很简单：谷歌每年向 Reddit 支付 6,000 万美元获得内容授权，可以抓取这些内容用来训练人工智能。

而其他搜索引擎开发商不愿意支付费用因此自然会被封禁，当时微软必应搜索主管还表示早在 2023 年 9 月必应就为所有网站提供了抓取控件，该控件可以用来控制必应搜索的抓取情况。

不过随后微软必应主管还是透露 Reddit 确实已经屏蔽必应搜索的爬虫和其他数据，这不仅影响必应搜索获取 Reddit 上的内容，也影响其他基于必应搜索的搜索引擎例如 DuckDuckGo 等。

因此现在用户通过必应和 DuckDuckGo 等无法搜索到 Reddit 上的内容，只能切换成谷歌搜索后才能从搜索引擎上找到 Reddit 论坛上更多有用的或者最新帖子、评论。

Reddit 首席执行官史蒂夫霍夫曼日前在接受采访时透露了封禁这些搜索引擎的原因：

微软已经从 Reddit 获取数据并将这些数据用于人工智能模型的训练，同时「在不知情的情况下」将 Reddit 的内容编入必应搜索中。

另外两家人工智能开发商 Anthropic (主要产品是 Claude) 和 Perplexity (主要产品是同名 AI 搜索引擎) 也通过 Reddit 上的数据训练他们的系统。

微软、Anthropic 和 Perplexity 都表现得好像互联网上的所有内容都可以免费供他们使用，这才是他们真正的立场。

霍夫曼还表示封锁这些公司实在太麻烦了，他认为搜索引擎从网站获取内容并不提供任何补偿的传统情况正在发生改变，即抓取内容以换取流量的价值正在变得模糊。

传统模式中搜索引擎索引网站内容并在用户搜索时呈现，搜索引擎可以为网站带来流量并转化为收益，而现在搜索引擎则是抓取数据用来训练模型，所以霍夫曼觉得这已经不是等价交换了。

另外还有消息称微软等公司都已经明确拒绝与 Reddit 进行内容授权谈判，即便搜索引擎已经被 Reddit 封禁他们也不会向该论坛支付任何费用换取解禁或购买内容数据。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签