| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1542 人关注过本帖
标题:python爬虫,输出过程中遇到问题,UnicodeEncodeError:
只看楼主 加入收藏
walkerxrc
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2019-7-2
收藏
 问题点数:0 回复次数:0 
python爬虫,输出过程中遇到问题,UnicodeEncodeError:
经常看到这种UnicodeEncodeError,希望懂的人,详细的讲解一下,或者推荐几篇相关帖子看一下,谢谢!

源码:
import random
import urllib.request
import re
uapools = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60',
           'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:34.0) Gecko/20100101 Firefox/34.0',
           'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36']
def ua(uapools):
    thisua = random.choice(uapools)
    print(thisua)
    headers = ('User-Agent',thisua)
    opener = urllib.request.build_opener()
    opener.addheaders = [headers]
    urllib.request.install_opener(opener)
   
for i in range(0,10):
    ua(uapools)
    thisurl  =  'https://www.'+ str(i+1)+'/'
    thispage = urllib.request.urlopen(thisurl).read().decode('utf-8','ignore')
    pat = '<div class="content">.*?<span>(.*?)</span>.*?</div>'
    rst = (pat,re.S).findall(thispage)
    for j in range(0,len(rst)):
        print(rst[j])
        print('-------------------------------')
输入结果: 有一部分爬取内容结果,运行过程中报错:
Traceback (most recent call last):
  File "D:/python/ex/ex_uapools.py", line 22, in <module>
    print(rst[j])
  File "D:\python\lib\idlelib\PyShell.py", line 1344, in write
    return self.shell.write(s, self.tags)
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 53-53: Non-BMP character not supported in Tk
搜索更多相关主题的帖子: python 过程 import request print 
2019-07-02 23:01
快速回复:python爬虫,输出过程中遇到问题,UnicodeEncodeError:
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.044410 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved