玩慈利网 发表于 2025-12-18 21:28:23

华为PanguBot实在太过分了,为所欲为爬取数据把网站当矿机

  兄弟们,我真的服了!
  本来我们玩慈利网之前一直运营得好好的,响应速度也非常快,结果这几天服务器突然网速打满,网站直接卡成 PPT。
  一开始以为被黑了,赶紧看日志——好家伙,不是黑客,是 “AI 贵宾” 来了!
  全是这种请求:
  User-Agent 清清楚楚写着:
  Mozilla/5.0 (compatible;PanguBot;pangubot@huawei.com)
  我寻思着,华为你训练盘古大模型,缺数据我能理解,但你连个招呼都不打,直接拿我们网站当免费数据矿机?
  更离谱的是:
  我 robots.txt 早就写了 Disallow: /,人家理都不理;
  每秒 5~10 个请求,IP 还轮着换(但都在 110.41.65 和 113.45.167 这俩 C 段);
  抓的全是动态页,连插件都翻出来扒!
  我一个小站长,没广告没收入,就图个 hobby,结果成了“华为AI训练燃料”?
  你吃肉,我买单,这合理吗?
  现在我已经:
  ✅ Nginx 返回 403
  ✅ 防火墙 DROP 整个 IP 段
  ✅ 日志单独记一份,准备留证
  还给pangubot@huawei.com 发了邮件,不知道会不会回。
  但我想说:AI 再牛,也不能把互联网当自家后花园随便薅啊!
  尊重下我们这些“数字地主”行不行?
  至少给个 opt-out 开关,或者限个速,别把人服务器干崩了再装没事发生。
  建议华为给每个被爬的网站发个感谢信+10块钱电费补贴(狗头)
页: [1]
查看完整版本: 华为PanguBot实在太过分了,为所欲为爬取数据把网站当矿机