互联网上的数字资源争夺战变得异常激烈。anthropic 还有openai 这些公司,拿着网络爬虫工具把全网内容都给

随着人工智能技术大规模铺开,互联网上的数字资源争夺战变得异常激烈。Anthropic还有OpenAI这些公司,拿着网络爬虫工具把全网内容都给扫了一遍。这种玩法彻底打破了互联网以前那种“用一次回一回”的规矩。以前大家都遵守那个看不见的契约:引用别人东西时必须留个跳转链接,这能给人家引流。结果现在这些AI爬虫来了,完全不讲这一套。 Cloudflare在2025年开始专门盯着这个事儿。他们弄了个“抓取与回流比”的表格来算笔账。数据出来吓了一跳:Anthropic每抓100次网站内容,真正给网站带去的流量可能连1次都不到,OpenAI那边也差不多。 这种高索取低回馈的局面太伤了。不仅让网站创作者白忙活一场,还得额外花钱去修云服务器。《商业内幕》在2024年末就提到,有些AI爬虫访问太猛,导致网站的云账单直接翻了一倍。这简直就是拿钱来抢人饭碗。 技术上的问题更让人头疼。普通的搜索引擎爬取比较节制,但AI训练需要的海量数据往往是全覆盖、高频率的,完全不把网站设置的频率限制放在眼里。Cloudflare虽然最近推出了专门对付“恶意AI爬虫”的工具,但光靠技术堵截解决不了根本问题。 法律这块儿更是个大麻烦。各国关于AI训练数据获取的法规现在都还没太完善。虽然欧盟的《人工智能法案》提了提数据治理的事,但具体咋执行还是一笔糊涂账。 说到底,这就是个数字时代的价值分赃问题。AI公司靠海量数据训练模型赚钱了,可提供数据的那些人却没捞着好处。时间长了肯定影响大家做内容的积极性,到头来反而会把自己的发展路给堵死。 要想真正解决问题,光靠技术上的修补肯定不够。还得靠产业界、法律界、伦理学界一起定规矩。只有让大家都能在这张网上公平地获得利益,才能让人工智能和互联网生态实现真正的良性循环。