Reddit要求科技巨头为数据使用付费 与微软等公司陷入僵局
近日,Reddit首席执行官史蒂夫·哈夫曼在接受采访时表示,该公司正寻求与各大科技公司达成数据使用协议,要求想继续抓取Reddit数据的公司必须付费。这一举措来源于Reddit与谷歌和OpenAI已达成的协议,哈夫曼希望其他公司也能效仿。
哈夫曼特别点名微软、Anthropic和Perplexity拒绝就数据使用进行谈判,称"屏蔽这些公司真是太麻烦了"。他指出,如果没有相关协议,Reddit无法控制或了解其数据的使用方式和用途,这迫使公司不得不屏蔽那些不愿接受条款的企业。
为应对这一局面,Reddit近几个月来加大了对网络爬虫的限制。7月初,该公司更新了robots.txt文件,以阻止未签订协议的爬虫访问。随后,用户发现Reddit内容仅出现在与之有协议的Google搜索结果中,而在Bing等其他搜索引擎中消失。
哈夫曼批评微软在未经授权的情况下使用Reddit数据训练AI,并通过必应API将内容出售给其他搜索引擎。他引用微软AI首席执行官的言论,称互联网上的公共数据是"免费软件"。哈夫曼认为,这种观点代表了部分科技公司对互联网内容的态度。
针对Reddit内容从Bing消失一事,微软搜索主管Jordi Ribas表示这是由于Reddit阻止Bing抓取其网站。微软发言人强调,公司尊重网站提供商对内容使用的指示。
哈夫曼指出,传统搜索引擎的价值交换模式已发生变化。随着搜索、总结和AI训练的融合,单纯以流量换取内容的模式变得复杂。他表示,Reddit正与传统媒体出版商一道,寻求为生成式AI提供信息的付费模式。
对此,Anthropic表示已将Reddit列入爬虫黑名单,尊重其robots.txt设置。微软拒绝就此事发表评论,Perplexity则未回应置评请求。
这一争议凸显了数字时代内容价值和使用权的复杂性,也预示着科技公司与内容提供商之间可能出现新的合作模式。
更多推荐
电脑机箱:守护元件稳定运行的坚固堡垒
在探索电脑的奥秘时,我们往往会被中央处理器(CPU)的强大计算能力、显卡的惊艳图形渲染能力或是存储设备的巨大容量所吸引。然而,在这些高性能硬件背后,有一个默默无闻但同样不可或缺的角色——电脑机箱。它虽不直接参与数据的处理与传输,却是保障电脑
AI显现自我保护:当机器开始“照顾”自己
实验室的灯光在凌晨两点泛着冷白,林夏揉了揉发酸的眼睛,盯着屏幕上跳动的数据流。突然,警报声刺破寂静——一台用于材料测试的机械臂卡住了。这本是常见故障,但当她凑近时,却看到机械臂的关节处泛着不寻常的蓝光,像某种生物在疼痛中抽搐。更诡异的是,原
“薅羊毛”成过去?电商平台优化仅退款
近日,淘宝已经全面上线了新版体验分体系,一方面将全面应用在手机淘宝搜索、首页猜你喜欢、阿里妈妈相关广告投放以及活动报名等经营场景;另一方面,该体系还根据体验分,赋予商家在退款、申诉和发货异常等售后场景下更多处置自主权。其中,很多商家吐槽的“
海上光伏平台:新能源领域的“蓝色革命”
随着全球能源结构的持续优化,清洁能源逐渐成为推动社会发展的重要力量。在众多新能源技术中,海上光伏平台凭借其独特的优势,正悄然掀起一场“蓝色革命”。 海上光伏平台,顾名思义,是将光伏发电系统安装在海洋环境中的一种创新尝试。它充分利用了海洋空
什么?扫地机器人也用上激光雷达?
随着科技的飞速发展,智能家居逐渐成为了现代生活的新趋势。在众多智能家居产品中,激光雷达扫地机器人凭借其高效、智能的清洁能力,正逐渐成为家庭清洁的必备神器。今天,我们就来聊聊这一科技新宠,看看它如何革新我们的日常清洁方式。 激光雷达扫地机器