注册 登录
编程论坛 Python论坛

pd.read_html爬取网页特殊汉字问题

contentzhh 发布于 2020-07-12 17:06, 1651 次点击
url2="http://data.,2020-01-03,000018.html"
tb = pd.read_html(url2)[1]
tb1=pd.read_html(url2)[2]

爬取数据时遇 “光大证券股份有限公司佛山顺德北滘证券营业部”中的特殊汉字 “滘” 中断,那位高手帮忙解决一下
2 回复
#2
contentzhh2020-07-14 14:18
回复 楼主 contentzhh
自己解决了tb = pd.read_html(url2,encoding="gb18030")[1]
#3
sssooosss2020-07-20 08:46
厉害,自己解决的问题印象更深刻
1