新闻动态
新闻动态
- 什么是歼20完全体?
- 为什么面向对象编程这么困难?
- 怎么样才能让大模型的RAG迅速落地?
- DLM(扩散语言模型)会成为2025年的Mamba吗?
- 以色列是如何从三天前的不可一世要灭了伊朗到今天的哭哭啼啼要“为生存而战”的?
- 商城里如何缓存商品信息?
- 鱼缸能不能做到一直不换水还很清澈?
- Trae和Cursor对比有什么优势吗?
- 公园坐椅应该多长?
- 6 月 21 日「苏超」第五轮南京队 4-0 战胜常州队,如何评价这场比赛?
联系我们
邮箱:youweb@qq.com
手机:13988888888
电话:020-88888888
地址:广东省广州市番禺经济开发区
公司动态
12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
作者:admin 发布时间:2025-06-22 17:35:17 点击:
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
新闻资讯
-
2025-06-22 07:15:15360 集团周鸿袆努力拼了 4 年,最后反而跌了近 4000 亿,其原因是什么?
-
2025-06-22 08:40:21Windows上有没有一分多屏和多屏合一的软件?
-
2025-06-22 07:50:15当量子计算机能预测人类选择,自由意志是否沦为算法的注脚?
-
2025-06-22 08:15:15J***a 除了 Spring 还有什么?
-
2025-06-22 07:35:15内蒙古通报那尔那茜定向委培争议,称其涉嫌高考报名材料造***,将严肃追责问责,涉事人员面临哪些责任处罚?
-
2025-06-22 07:40:16作为普通中国人,我们可以为以色列人民做点什么?
相关产品