问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python如何读取网页中的数据

发布网友 发布时间:2022-04-22 04:06

我来回答

4个回答

热心网友 时间:2022-04-06 15:26

用Beautiful Soup这类解析模块:

Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree);

它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作;

用urllib或者urllib2(推荐)将页面的html代码下载后,用beautifulsoup解析该html;

然后用beautifulsoup的查找模块或者正则匹配将你想获得的内容找出来,就可以进行相关处理了,例如:

from BeautifulSoup import BeautifulSoup
html = '<html><head><title>test</title></head><body><p>test body</p></body></html>'
soup = BeautifulSoup(html)
soup.contents[0].name
# u'html'
soup.comtents[0].contents[0].name
# u'head'
head = soup.comtents[0].contents[0]
head.parent.name
# u'html'
head.next
# u'<title>test</title>

热心网友 时间:2022-04-06 16:44

不知道你说的网页是指的什么,如果你说的是我保存了一网页在你的电脑上,那就直接用open函数打开,read函数读就行了。

如果你说的是某个URL指向的网页内容,那就要用urllib2模块来抓取网页咯。

热心网友 时间:2022-04-06 18:18

就是属于网页抓取,可参考:
如何用Python,C#等语言去实现抓取静态网页 模拟登陆网站

里面有逻辑解释和代码。

(此处不能贴地址,可以通过google搜标题,即可找到帖子地址)

热心网友 时间:2022-04-06 20:10

用Beautiful Soup这类解析模块

Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作。

用urllib或者urllib2(推荐)将页面的html代码下载后,用beautifulsoup解析该html

然后用beautifulsoup的查找模块或者正则匹配将你想获得的内容找出来,就可以进行相关处理了

例子:

from BeautifulSoup import BeautifulSoup

html = '<html><head><title>test</title></head><body><p>test body</p></body></html>'

soup = BeautifulSoup(html)

soup.contents[0].name
# u'html'

soup.comtents[0].contents[0].name
# u'head'

head = soup.comtents[0].contents[0]

head.parent.name
# u'html'

head.next
# u'<title>test</title>

剩下的自己看文档吧

参考资料:http://wenku.baidu.com/view/c4ad3afa770bf78a6529548f.html

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
中国福利彩票龟兔赛跑出现两个箭头算不算中奖 ...都没有笑了感觉活得好麻木完全没有意义我该怎么办?? 我的情感很麻木,可以改变或改善吗? 我觉得我麻木不仁,如何改变? 我高二时候突然变得很麻木 应该怎样解脱出来? 曹颖代言的CC换颜祛斑的精油重庆哪里有卖? 第三套人民币蕴含的巨大增值潜力 租赁合同≠租赁凭证!深圳租房家长不要再搞错了!否则申请不了公办学位... 仓埠街道革命传统 ...当归 黄芪 三七一起吃了,有什么功效,吃了会长胖吗?拜托了各位... python读取文本内每行指定内容 python发送数据包获取返回数据(其他的语言能实现... python信息提取问题? python获取指定标签中的内容 python获取到的内容,如何获取此内容的坐标 python将微信聊天内容复制到word文档? python怎么获取某个人的微信朋友圈的信息? python 正则表达式 匹配多行聊天记录的问题。 微信聊天记录使用python爬虫到底能采集吗 求python收集微信聊天记录代码 每天收集同事们通过... python 能抓去微信的聊天记录吗 python可以爬微信聊天记录吗 可以用python爬我的微信聊天记录吗 请问友令发红包需要下什么软件? 手机收不到10086的短信怎么办?是什么原因啊? 关于冬雨诗词 有哪些形容冬雨的好词好句好段? 描写冬雨的句子大全 齐秦的《冬雨》 歌词 关于冬雨的诗句有哪些 如何通过python获取应用程序里列表的值? python执行adb命令,怎么在文本中记录获得输出信息... 为什么百度上的文字复制到word变大了 百度上面复制的文档到自己word上字体为什么会变得好大 我将一段内容粘贴到一份word文档中,结果粘贴进去... 甘肃农信怎么查看卡号 怎么在手机上查四川农信卡号 干的葱姜蒜粉与新鲜的葱姜蒜有什么区别? 鲜银耳能吃吗 贵州农信卡号怎么查看 经常吃葱、姜、蒜对身体好吗? 葱姜蒜粉可以代替葱姜蒜吗 关注山西农信银行可以查看卡号吗 新鲜的银耳有毒吗 葱姜蒜粉什么时候用 食用鲜银耳可能导致中毒吗? 葱姜蒜对人体有什么好处 新鲜银耳可以吃吗? 姜,蒜,辣椒,大葱对人体有什么好处? 多吃葱姜蒜好么?