| 网站首页 | 业界新闻 | 小组 | 交易 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
Reworld,下班在家制作游戏,1500万奖金等你拿以码会友 以友辅仁
共有 231 人关注过本帖
标题:有大佬了解过“速卖通”网站的反爬机制吗?
只看楼主 加入收藏
bin376240554
Rank: 1
等 级:新手上路
帖 子:7
专家分:0
注 册:2019-8-14
  问题点数:0  回复次数:3   
有大佬了解过“速卖通”网站的反爬机制吗?
程序代码:
import requests
from lxml import extree

url = 'https://www.'

headers = {'User-Agent': 'Mizilla/5.0}

html_text = requests.get(url=url, headers=headers).text
html = extree.HTML(html_text)
print(html)


这里只能获取部分网页内容,哪位大佬了解速卖通的反爬机制
搜索更多相关主题的帖子: 网站 机制 import url html 
2019-08-26 16:16
bakchoi
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2019-9-2
  得分:0 
这个貌似需要先模拟登陆?
2019-09-02 14:17
南山剑客
Rank: 2
等 级:论坛游民
威 望:3
帖 子:50
专家分:60
注 册:2019-8-6
  得分:0 
javascript生成的内容,requests库爬不到,得用selenium库

我傻我快乐 仗剑走天涯
2019-09-02 14:26
南山剑客
Rank: 2
等 级:论坛游民
威 望:3
帖 子:50
专家分:60
注 册:2019-8-6
  得分:0 
https://selenium-python.readthedocs.io/

我傻我快乐 仗剑走天涯
2019-09-02 14:27
快速回复:有大佬了解过“速卖通”网站的反爬机制吗?
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.070251 second(s), 8 queries.
Copyright©2004-2019, BCCN.NET, All Rights Reserved