萌新遇到难题，求大佬帮解，实在不知道哪里越界了 - Python论坛

楼主

已结贴√ 问题点数：20 回复次数：5

萌新遇到难题，求大佬帮解，实在不知道哪里越界了

图片附件: 游客没有浏览图片的权限，请登录或注册

就这个，我主要是想用爬虫urllib去试手将QQ视频的评论全爬下来
结果

图片附件: 游客没有浏览图片的权限，请登录或注册

萌新想知道到底是越界了还是别的原因，是不是因为这个评论超长已经超出限度了
不知道有没有大佬愿意给我点解决方案

下面是我要爬的第一个页面的网页源代码

图片附件: 游客没有浏览图片的权限，请登录或注册

请问大佬是不是这代码真长的离谱

搜索更多相关主题的帖子: 源代码　越界　难题　页面　网页　

第 2 楼

得分:0

这是代码

import urllib.request
import re

vid="vbb35hm6m6da1wc"
cid=""

headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36",
         "Content-Type":"application/javascript",
         }
opener=urllib.request.build_opener()
headall=[]
for key,value in headers.items():
    item=(key,value)
    headall.append(item)
opener.addheaders=headall
urllib.request.install_opener(opener)
for j in range(0,100):
    #爬去当前页面
    print("第"+str(j)+"页")
    thisurl='https://video.coral.'
    data=urllib.request.urlopen(thisurl).read().decode("utf-8")
    titlepat='"title":"(.*?)","abstract":"(.*?)"'
    commentpat='"content":"(.*?)"'
    titleall=(titlepat,re.S).findall(data)
    commentall=(commentpat,re.S).findall(data)
    lastpat='"last":"(.*?)"'
    cid=(lastpat,re.S).findall(data)[0]
    for i in range(0,len(titleall)):
        try:
            print("评论标题是："+eval('u"'+titleall[i]+'"'))
            print("评论标题是："+eval('u"'+commentall[i]+'"'))
            print("------")
        except Exception as err:
            print(err)

[此贴子已经被作者于2019-9-14 20:29编辑过]