大牛们好,我问题是用python读取一个文件,文件里有很多行字符串.需要把所有连续的字母提取出来
发布网友
发布时间:2022-04-18 18:38
我来回答
共3个回答
热心网友
时间:2022-04-18 20:08
手写方法:
a=file("t.txt","r").read()
b=""
#非字母替换成空格
for i in range(len(a)):
if not a[i].isalpha():
b+=' '
else:
b+=a[i]
#分词
c = b.split()
#唯一化,统计出现次数
for i in list(set(c)):
print i, c.count(i)
热心网友
时间:2022-04-18 21:26
import re
a=re.findall("\w+",t)
d={}
for k in a:
d[k]=d.get(k,0)+1
感觉这样子比较好理解
热心网友
时间:2022-04-18 23:00
t='''Now
is the time
time^%$# is time-is
%?"time'''
import re
a=re.findall("\w+",t);
d={k:a.count(k) for k in dict(zip(a,[0]*len(a))).keys()}
print(list(d.keys()))
print(d)
=============
['is', 'Now', 'the', 'time']
{'is': 3, 'Now': 1, 'the': 1, 'time': 4}追问能稍微结实一下不,完全看不太明白
追答哦,先用正则分词,然后用字典统计。