注册 登录
编程论坛 Python论坛

如何爬取对应信息?

likepy 发布于 2018-11-13 21:19, 1440 次点击
                            <dl>
                    <dt>
                        <a href="http://college. target="_blank"><img src="http://college. onerror="this.src='http://college.'" width="63" height="63" alt="上海市广播电视大学" /></a><strong title="上海市广播电视大学" class="blue"><a href="http://college. target="_blank">上海市广播电</a></strong>                    </dt>
                    <dd>
                        <div class="right">
                            <p><a class="org" href="javascript:void(0);" onclick="javascript:setpk('617','上海市广播电视大学');">+高校对比</a></p>
                            <p class="topMargin20"><a class="btn_gary" href="http://college. target="_blank">进入主页</a></p>
                        </div>
                        <ul>
                            <li>高校所在地:上海</li>
                            <li>院校特色:——</li>
                            <li>高校类型:语言</li>
                            <li>高校隶属:——</li>
                            <li>高校性质:其它</li>
                            <li>学校网址:——</li>
                        </ul>
                    </dd>
                </dl>


问:如何爬取对应的‘上海市广播电视大学’,这个名词?
names = soup.find_all('p',class_ = "onclick")
for name in names:
    print (name.get_text())
这个为什么爬取不了?
1 回复
#2
likepy2018-11-14 21:17
使用Xpath
具体可以搜索知乎相关的
爬虫入门到精通-网页的解析(xpath),推荐
1