AI & Big Data 07月02日 14:52
Cloudflare將預設封鎖AI網頁爬蟲 除非付費給內容網站
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Cloudflare推出新措施,应对AI模型未经许可抓取网页内容的问题。为保护出版商的利益,Cloudflare将默认封锁AI爬虫,并提供允许爬虫访问但需付费的方案。此举旨在解决AI爬虫对出版商收入的侵蚀,因为AI直接提供答案,减少了用户访问网页的需求,导致广告和订阅收入下降。Cloudflare的新方案允许出版商控制收费策略,建立付费内容访问框架,为内容创作者开辟新的收入来源。

🛡️ Cloudflare采取行动,应对AI爬虫未经许可抓取网页内容的问题,将默认封锁AI爬虫,以保护出版商的利益。

💰 Cloudflare推出了“Pay per crawl”的支付方案,允许AI爬虫访问内容,但需要支付费用。该方案整合了Web基础设施,通过HTTP状态码建立验证机制,当AI爬虫未展示支付意图时,将收到402 Payment Required的回应。

⚙️ 出版商可以完全控制收费策略,定义站点的计费费率,并决定允许、收费或封锁。Cloudflare作为记录商户,负责所有爬虫呼叫和支付活动的记录、收费和报告发布。

因應AI模型業者以網頁爬蟲(robot)未經同意擷取網頁內容訓練模型,本周內容遞送網路(CDN)業者Cloudflare宣布新措施,將預設封鎖AI網頁爬蟲。同時間,Cloudflare提供出版商能以允許爬蟲賺取收入的方案。

在周二(7/1)Cloudflare稱為內容獨立日(Content Independency Day)最新措施,也是去年Cloudflare提供網頁爬蟲的封鎖工具給客戶後更進一步。

Cloudflare指出,Google、OpenAI及Anthropic AI業者提供的聊天機器人在其回應中,已提供75%用戶需要的答案,而無需用戶造訪網頁,而Google的AI Overview的推出將使比例更向上攀高。

然而AI網頁爬蟲(或網頁機器人)擷取了出版商網頁內容提供的回答,已經對出版商造成營運傷害,因為來自廣告及訂閱的收入消失。

過去10年,內容創作者想再產生同樣流量,困難幾乎成長10倍,這還是來自Google造成的損害。根據Cloudflare的數據,因OpenAI及Anthropic再產生同樣流量,困難度達到750及30,000倍。可以說AI爬蟲侵害已嚴重侵害網路產業。

因此Cloudflare宣布,已和主要出版商和AI公司合作,採取新措施來防範AI網頁爬蟲不當擷取出版商的內容,並為創作者開闢新的營收來源。Cloudflare將預設封鎖AI爬蟲,除非AI業者支付創作者費用。

Cloudflare也宣布Pay per crawl的支付方案。它整合有Web基礎架構,運用HTTP status codes建立驗證機制,以建立付費內容存取框架。

技術原理如下。AI爬蟲每次呼叫內容時,若不能request headers經由展示支付意圖(intent)就會接收到一個附有收費價格的402 Payment Required的回應。Pay per crawl的紀錄商戶(Merchant of Record)和底層技術架構都是由Cloudflare扮演。

Pay per crawl框架提供網域持有者(出版商)收費策略完整控制權。他們可以定義站上以呼叫次數計費的單一費率,也能決定允許、收費和封鎖。但必要時,出版商必要時也可繞過收費,以免費內容執行外部內容合作。而AI網頁爬蟲操作單位及內容擁有者(出版商)必須在Cloudflare帳號下設定pay per crawl支付細部規定,所有爬蟲呼叫及支付活動都會紀錄下來,再由Cloudflare集結、收費並將報告發布給出版商。

不過Pay per crawl最重要的是出版商願意使用。目前Pay per crawl以不公開beta版本測試,Cloudflare邀請出版商報名加入

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Cloudflare AI爬虫 内容付费 出版商
相关文章