Claude團隊因數據抓取問題引衆怒爲繞開規則不擇手段

在數據驅動的AI時代，獲取大量數據已成爲訓練強大模型的關鍵。然而，獲取數據的方式卻引發了爭議。最近，Claude團隊因不當的數據抓取行爲而激起了衆怒。

事件的起因是Claude團隊的爬蟲在24小時內對某公司服務器進行了100萬次訪問，以不付費的形式抓取網站內容。這一行爲不僅明目張膽地無視了網站的"禁止爬取"公告，還強行佔用了大量服務器資源。

受害公司儘管盡力進行了防禦，但最終未能阻止Claude團隊的數據抓取。公司負責人憤怒地在社交媒體上發聲，譴責Claude團隊的行爲。許多網友也表達了他們的不滿，有人甚至建議用"偷"這個詞來描述這種行爲。

涉事的公司是iFixit，一家美國電子商務和操作指南網站。iFixit提供數百萬個頁面的免費在線維修指南，涵蓋消費電子產品和小工具。然而，iFixit發現Claude的爬蟲程序ClaudeBot在短時間內發起了大量請求，一天內訪問了10TB的文件，整個5月份總計訪問了73TB。

iFixit的CEO Kyle Wiens表示，ClaudeBot未經許可就"偷走"了他們的所有數據，並佔用了服務器資源。儘管iFixit在其網站上明確聲明禁止未經許可的數據抓取，但Claude團隊似乎對此視而不見。

Claude團隊的行爲並非個例。今年4月，Linux Mint論壇也曾遭受ClaudeBot的頻繁訪問，導致論壇運行緩慢甚至崩潰。此外，還有聲音指出，除了Claude和OpenAI的GPT以外，還有許多其他AI公司也在無視網站的robots.txt設置，強行抓取數據。

面對這種情況，有人建議網站所有者在頁面中添加帶有可追蹤或獨特信息的虛假內容，以檢測數據是否被非法抓取。iFixit實際上已經採取了這一措施，並發現他們的數據不僅被Claude，還被OpenAI抓取。

這一事件引發了關於AI公司數據抓取行爲的廣泛討論。一方面，AI的發展確實需要大量數據作爲支撐;另一方面，數據抓取也應尊重網站所有者的權益和規定。如何在推動技術進步和保護版權之間找到平衡點，是整個行業需要思考的問題。

三星會長李在鎔警告:三星在AI芯片競賽中落後對手集團處於生死存亡關頭

據韓聯社報道，三星電子會長李在鎔近日向公司高管發出嚴厲警告，稱三星集團已失去內生動力，正處於生死存亡關頭，並要求高管們必須以"置之死地而後生"的態度應對AI時代的挑戰。三星集團自上月底起組織了一場名爲"重塑三星力量"的大規模研討會，共有三星電子等子公司的2000多名高管參加。在研討會上播放的視頻中，李在鎔雖未露面但傳達了強烈信息:"重要的不是危機形勢，而是我們應對危機的態度，即使要犧牲眼前的利潤，也要爲未來投資。"參會的每位高管還收到了一塊刻有李在

馬雲談AI未來:技術重要，但獨特價值才決定未來命運

2024年12月8日，馬雲在螞蟻集團20週年慶典上發表了精彩的演講，回顧了互聯網時代的機遇，並展望了AI時代的巨大變革。馬雲表示，20年前，當互聯網剛剛興起時，他和他的同代人非常幸運，抓住了這一歷史機遇。但在他看來，未來20年，AI時代的到來將帶來前所未有的變革，甚至超出所有人的想象。馬雲強調，AI將是一個更加偉大的時代，它會改變一切，但他也指出，AI不會決定一切。儘管技術在未來發展中至關重要，但馬雲認爲，真正決定未來勝負的，仍然是今天人類爲即將到來的AI時代

Anthropic的爬蟲機器人無視網站反AI抓取政策遭吐槽

Anthropic的ClaudeBot網絡爬蟲在24小時內頻繁訪問iFixit網站，涉嫌違反使用條款，未經授權使用內容並消耗開發資源。iFixit已通過在robots.txt中添加crawl-delay擴展限制爬蟲訪問。此事件也波及其他網站，如Read the Docs和Freelancer.com。AI公司如OpenAI通過robots.txt拒絕爬蟲訪問，但不提供靈活定義訪問權限的選項。Perplexity公司被發現忽略robots.txt規則。儘管如此，使用robots.txt仍然是保護數據不被用於AI訓練的常見策略之一。Reddit最近也採取行動打擊網絡爬蟲。

Claude團隊因數據抓取問題引衆怒爲繞開規則不擇手段

相關推薦

支付寶推出“AI付”服務，業內第一次在智能體內說話完成下單支付

B站陳睿稱AI只是工具人才是創作主體

三星會長李在鎔警告:三星在AI芯片競賽中落後對手集團處於生死存亡關頭

馬雲談AI未來:技術重要，但獨特價值才決定未來命運

Anthropic的爬蟲機器人無視網站反AI抓取政策遭吐槽

Claude團隊因數據抓取問題引衆怒 爲繞開規則不擇手段

相關推薦

支付寶推出“AI付”服務，業內第一次在智能體內說話完成下單支付

B站陳睿稱AI只是工具 人才是創作主體

三星會長李在鎔警告:三星在AI芯片競賽中落後對手 集團處於生死存亡關頭

馬雲談AI未來:技術重要，但獨特價值才決定未來命運

Anthropic的爬蟲機器人無視網站反AI抓取政策遭吐槽

Claude團隊因數據抓取問題引衆怒爲繞開規則不擇手段

B站陳睿稱AI只是工具人才是創作主體

三星會長李在鎔警告:三星在AI芯片競賽中落後對手集團處於生死存亡關頭