写爬虫爬取阿里巴巴数据，为什么使用高匿代理ip仍然会被识别出来呢？ - Python论坛

| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛 |

编程论坛 → 开发语言 → 『 Python论坛』 → 写爬虫爬取阿里巴巴数据，为什么使用高匿代理ip仍然会被识别出来呢？

我的收件箱(0)

欢迎加入我们，一同切磋技术

共有 2120 人关注过本帖

标题：写爬虫爬取阿里巴巴数据，为什么使用高匿代理ip仍然会被识别出来呢？

只看楼主加入收藏

萌萌01

等　级：新手上路
帖　子：5
专家分：7
注　册：2018-11-15
结帖率：0

楼主

已结贴√ 问题点数：10 回复次数：1

写爬虫爬取阿里巴巴数据，为什么使用高匿代理ip仍然会被识别出来呢？

我最近实习，领导让我爬取阿里巴巴供应商数据，刚开始目标是爬取阿里巴巴电脑端的数据，发现模拟登陆很麻烦，需要短信验证，而且即使登录也需要不断输入验证码，就换成爬取阿里巴巴移动端的数据，不需要登录，但是访问频繁就会返回重定向的页面 404-阿里巴巴，即使换代理ip也不行，这是为什么呢？有没有成功爬取阿里巴巴的项目可以借鉴一下？