| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 3502 人关注过本帖
标题:爬虫问题,无法获取audio 的 src
只看楼主 加入收藏
user_ppthon
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2018-3-10
收藏
 问题点数:0 回复次数:1 
爬虫问题,无法获取audio 的 src
我用python 3.6.4 抓取酷狗音乐的时候遇到无法解析的问题。代码如下:

import requests
from bs4 import BeautifulSoup
import bs4

def getHTMText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text        
    except:
        return ""   
            
def get_song_url(url):
    song_url = ""
    html = getHTMText(url)
    if(html):
       soup = BeautifulSoup(html,"html.parser")# 我换了解析器也不行
       song_url = soup.find(id="myAudio")
       if isinstance(song_url,bs4.element.Tag):
           print(type(song_url))
           print(song_url)
    else:
       return(song_url)

def main():
    url = "http://www.
   get_song_url(url)   
   
main()

'''
运行结果:
<class 'bs4.element.Tag'>
<audio class="music" id="myAudio" src="">
<!-- <p class="myAudiohide">你的浏览器不支持<code>audio</code>标签.</p> -->
</audio>

用开发者工具抓取audio tag的内容如下:
<audio class="music" id="myAudio" src="http://fs.w. preload="auto">
            <!-- <p class="myAudiohide">你的浏览器不支持<code>audio</code>标签.</p> -->
        </audio>

我想获取audio的src
'''
谢啦!
搜索更多相关主题的帖子: 获取 audio url html class 
2018-03-10 19:55
coolinglive
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2019-6-20
收藏
得分:0 
我是小白,在学习中,我现在也苦脑这个问题,百度无果,请问您这问题有解决吗?
2019-06-20 11:01
快速回复:爬虫问题,无法获取audio 的 src
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.025589 second(s), 9 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved