QQ登录

只需一步,快速开始

手机号码,快捷登录

手机号码,快捷登录

微信扫一扫 分享朋友圈

已有 174 人浏览分享

开启左侧

华为PanguBot实在太过分了,为所欲为爬取数据把网站当矿机

[复制链接]
174 0
  兄弟们,我真的服了!
  本来我们玩慈利网之前一直运营得好好的,响应速度也非常快,结果这几天服务器突然网速打满,网站直接卡成 PPT。
  一开始以为被黑了,赶紧看日志——好家伙,不是黑客,是 “AI 贵宾” 来了!
  全是这种请求:
image.jpg
  User-Agent 清清楚楚写着:
  Mozilla/5.0 (compatible;PanguBot;pangubot@huawei.com)
  我寻思着,华为你训练盘古大模型,缺数据我能理解,但你连个招呼都不打,直接拿我们网站当免费数据矿机?
  更离谱的是:
  我 robots.txt 早就写了 Disallow: /,人家理都不理;
  每秒 5~10 个请求,IP 还轮着换(但都在 110.41.65 和 113.45.167 这俩 C 段);
  抓的全是动态页,连插件都翻出来扒!
  我一个小站长,没广告没收入,就图个 hobby,结果成了“华为AI训练燃料”?
  你吃肉,我买单,这合理吗?
  现在我已经:
  ✅ Nginx 返回 403
  ✅ 防火墙 DROP 整个 IP 段
  ✅ 日志单独记一份,准备留证
  还给pangubot@huawei.com 发了邮件,不知道会不会回。
  但我想说:AI 再牛,也不能把互联网当自家后花园随便薅啊!
  尊重下我们这些“数字地主”行不行?
  至少给个 opt-out 开关,或者限个速,别把人服务器干崩了再装没事发生。
  建议华为给每个被爬的网站发个感谢信+10块钱电费补贴(狗头)

上一篇:DiscuzX3.5支持emoji表情和回帖内容重复问题解决过程分享
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

37

关注

177

粉丝

16407

主题
  • 公众号

    微信公众号

  • 微信

    站长微信

关于我们|手机版|玩慈利网 湘公网安备 43082102000138号 ( 湘ICP备12012604号-1 )

GMT+8, 2026-1-22 00:21 , Processed in 0.040573 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! 在此致以诚挚谢意!

CopyRight © 2011-2026 wancili.com