用Python的BeautifulSoup解析网页时,里面的中文显示乱码,要怎样才能正常显示中文?
发布网友
发布时间:2022-04-06 07:32
我来回答
共2个回答
热心网友
时间:2022-04-06 09:01
转码啊,先把你的爬过来的内容转成utf8或者gbk(这样要结合你网站使用的编码),这种解决方案网上还是很多的,就不一一列举了。如果你都试过了,可以把网站贴出来看看。
热心网友
时间:2022-04-06 10:19
具体要看一下你的源代码才好说。下面是一个显示中文的例子:
Python 2.7.13 (default, Aug 26 2017, 01:08:45)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-11)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> d = {'a': '你要去哪里?', 'b': 'talk me to your heart'}
>>> print(d)
{'a': '\xe4\xbd\xa0\xe8\xa6\x81\xe5\x8e\xbb\xe5\x93\xaa\xe9\x87\x8c\xef\xbc\x9f', 'b': 'talk me to your heart'}
>>> for k, v in d.items():
... print k, ':', v
...
a : 你要去哪里?
b : talk me to your heart
>>>