| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1599 人关注过本帖
标题:pd.read_html爬取网页特殊汉字问题
只看楼主 加入收藏
contentzhh
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2020-7-12
收藏
 问题点数:0 回复次数:2 
pd.read_html爬取网页特殊汉字问题
url2="http://data.,2020-01-03,000018.html"
tb = pd.read_html(url2)[1]
tb1=pd.read_html(url2)[2]

爬取数据时遇 “光大证券股份有限公司佛山顺德北滘证券营业部”中的特殊汉字 “滘” 中断,那位高手帮忙解决一下
搜索更多相关主题的帖子: 网页 数据 中断 汉字 有限公司 
2020-07-12 17:06
contentzhh
Rank: 1
等 级:新手上路
帖 子:3
专家分:0
注 册:2020-7-12
收藏
得分:0 
回复 楼主 contentzhh
自己解决了tb = pd.read_html(url2,encoding="gb18030")[1]
2020-07-14 14:18
sssooosss
Rank: 9Rank: 9Rank: 9
等 级:禁止访问
威 望:3
帖 子:664
专家分:1115
注 册:2019-8-27
收藏
得分:0 
厉害,自己解决的问题印象更深刻
2020-07-20 08:46
快速回复:pd.read_html爬取网页特殊汉字问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.037761 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved