最近网盘爬虫非常火,很多网站都做得很好,因此我也很好奇其中涉及的技术,进行了一点点研究。
结论放最前,原理无非是这句:XXX site:pan.baidu.com
先查看了最近比较流行的搜索引擎,
前三甲是百度、360搜索、新搜狗。其中百度和360都对
site:pan.baidu.com进行和谐,出现的结果非常有限,因此有两种方法:
前三甲是百度、360搜索、新搜狗。其中百度和360都对
site:pan.baidu.com进行和谐,出现的结果非常有限,因此有两种方法:
1.在新搜狗中进行百度网盘搜索;
2.在百度中对于其他网盘进行搜索,类似于:
photoshop.rar site:dl.vmall.com。
photoshop.rar site:dl.vmall.com。
【具体代码仍在施工中,请原谅博主的懒惰并自行探索】
版权声明:本文为chengxuyuan_1992原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。