问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python 正则表达式 匹配多行聊天记录的问题。

发布网友 发布时间:2022-04-22 04:06

我来回答

3个回答

热心网友 时间:2022-04-18 15:55

如果你所指得[任意文字]的意思是1个或1个以上文字得话
你可以试试下面得语句
p = re.compile(u'.*想知道.+\n.+也想知道.+')

否则你只需要将里面得"+"改为"*"就可以匹配0得情况
也就是下面得语句
p = re.compile(u'.*想知道.*\n.*也想知道.*')

测试代码如下:
>>>a = u"""我想知道。
..... 我也想知道。"""
>>>p.search(a)
>>><_sre.SRE_Match object at 0x1014d5100>

看了你的问题补充,如果你想要查找出字符串中最后匹配的子字符串的话,我目前没想到比较好的办法。
如果一定要用正则的话你可以考虑采用遍历的方式,也就是匹配所有不含abc的情况。
比如说^a, ^b, ^c, ab^c, a^bc....等等等等。不过这样以来正则表达式会显得过于复杂,而且扩展行几乎为0。
如果可以不用正则,那python本身的库就能够实现(可能你嫌处理语句过多或考虑到时间问题而不想用),而且逻辑也较为简单(我觉得是这样)。python的string类中自带有find()和rfind()方法再加上split()方法,合理使用的话应该能找出所有的匹配子字符串。追问好,谢谢大大了。如果没有别的更好的答案了的话,我月考完回来就给您采纳。

热心网友 时间:2022-04-18 17:13


如果你是要处理网页的话,不用费力使用正则表达式
PYTHON有专门处理HTML和XML的库(虽然用的就是正则表达式RE模块)
用sgmllib就可以处理HTML

如果是要提取连接地址的话,用urllister
例 8.7. 使用 urllister.py
>>> import urllib, urllister
>>> usock = urllib.urlopen("")
>>> parser = urllister.URLLister()
>>> parser.feed(usock.read())
>>> usock.close()
>>> parser.close()
>>> for url in parser.urls: print url
toc/index.html
#download
#languages
toc/index.html
appendix/history.html
download/diveintopython-html-5.0.zip
download/diveintopython-pdf-5.0.zip
download/diveintopython-word-5.0.zip
download/diveintopython-text-5.0.zip
download/diveintopython-html-flat-5.0.zip
download/diveintopython-xml-5.0.zip
download/diveintopython-common-5.0.zip

推荐你看看《PYTHON入门到精通》的HTML处理这一章

PYTHON的入门教材一般都是先看《PYTHON简明教程》再看《PYTHON入门到精通》然后基本就登堂入室了,看看新闻组就好了追问我是搞人工智能的啊大哥。。哪儿都不挨哪儿啊……

首先:如何界定最后一个“name:”出现的位置?
或者,这么说吧:[^(a)]+能够匹配一个不含单个字母a的子串,那么如果是”一个不含单词abc的字串“,要如何匹配呢?

热心网友 时间:2022-04-18 18:48

>>> text='''我想知道。
... 我也想知道。
... '''
>>> obj_re = re.compile(r"(.*?)想知道(.*?)\r?\n(.*?)也想知道([\s\S]*?)$")
>>> print obj_re.search(text).group()
我想知道。
我也想知道。
>>> text2 = '''
... asdfasdf
... tes239*#*&*&
... 他想知道地球为什么是圆的,
... 他也想知道房价为什么这么高。
... '''
>>> print obj_re.search(text2).group()
他想知道地球为什么是圆的,
他也想知道房价为什么这么高。

试试这个吧
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
在RLC电路中,谐振频率为___同期为___谐振条件为___? 电磁振荡并联 RLC振荡回路的谐振频率与振荡特性 佛手柑水培还是干放 中山市美派电器有限公司怎么样? 成都美派电器有限公司怎么样? 两条不同品牌的DDR3内存条可以一起用吗 驾驶证的牡丹卡多长时间能办下来 新衣服必须用洗衣液洗才能去甲醛吗? 梦见逛街被偷抢 2024年买什么品牌的运动男鞋比较好? 微信聊天记录使用python爬虫到底能采集吗 求python收集微信聊天记录代码 每天收集同事们通过... python 能抓去微信的聊天记录吗 python可以爬微信聊天记录吗 可以用python爬我的微信聊天记录吗 请问友令发红包需要下什么软件? 手机收不到10086的短信怎么办?是什么原因啊? 关于冬雨诗词 有哪些形容冬雨的好词好句好段? 描写冬雨的句子大全 齐秦的《冬雨》 歌词 关于冬雨的诗句有哪些 冬雨的拟人句 冬雨的诗句唯美 形容冬雨的诗句 描写冬雨的句子 冬雨最大的好处是什么? 24座宫殿,私藏几十吨黄金,萨达姆的这些资产都去... A2驾照能驾驶24座客车吗? 描写冬雨的句子唯美短句 python怎么获取某个人的微信朋友圈的信息? python将微信聊天内容复制到word文档? python获取到的内容,如何获取此内容的坐标 python获取指定标签中的内容 python信息提取问题? python发送数据包获取返回数据(其他的语言能实现... python读取文本内每行指定内容 python如何读取网页中的数据 如何通过python获取应用程序里列表的值? python执行adb命令,怎么在文本中记录获得输出信息... 为什么百度上的文字复制到word变大了 百度上面复制的文档到自己word上字体为什么会变得好大 我将一段内容粘贴到一份word文档中,结果粘贴进去... 甘肃农信怎么查看卡号 怎么在手机上查四川农信卡号 干的葱姜蒜粉与新鲜的葱姜蒜有什么区别? 鲜银耳能吃吗 贵州农信卡号怎么查看 经常吃葱、姜、蒜对身体好吗? 葱姜蒜粉可以代替葱姜蒜吗