最近网盘爬虫非常火,很多网站都做得很好,因此我也很好奇其中涉及的技术,进行了一点点研究。

结论放最前,原理无非是这句:XXX site:pan.baidu.com

先查看了最近比较流行的搜索引擎,
前三甲是百度、360搜索、新搜狗。其中百度和360都对
site:pan.baidu.com进行和谐,出现的结果非常有限,因此有两种方法:
1.在新搜狗中进行百度网盘搜索;
2.在百度中对于其他网盘进行搜索,类似于:
photoshop.rar site:dl.vmall.com。
【具体代码仍在施工中,请原谅博主的懒惰并自行探索】

版权声明:本文为chengxuyuan_1992原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/chengxuyuan_1992/article/details/46722983