问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

我想怎样才能写出那种吸引人的文案,或者说相亲启

发布网友 发布时间:2022-05-04 23:57

我来回答

2个回答

好二三四 时间:2022-05-22 04:24

前言:

前不久,我刷到这样一条短视频,“1.7亿的90后仅有约1000万对结婚,结婚率不到10%”,当然我们也无法查实当中数据的来源以及真实性,不过小编倒是总能听说身边的朋友在抱怨脱单难、找不到合适的对象。

今天我通过Python写了一个简单的脚本在抓取公开的相亲文案,看看在相亲的都是些什么样的人?他们的择偶标准又是什么样子的?什么样子的人更加容易脱单?

1.代码的编写过程

我们引入需要用到的库,这里用到Python当中的requests库来发送和接受请求,通过正则表达式re这个库来解析数据

import requests
from tenacity import *
import re
import time


很多时候对遇到请求超时的情况,因此当出现一次错的时候,我们会多尝试几次,因此这里使用retry装饰器来多次尝试

@retry(stop=stop_after_attempt(5))
def do_requests(url):
    response = requests.get(url, headers=headers, proxies=proxies, timeout=10)
    return response.text


我们抓取的数据包括出生年份、身高/体重、学历、收入、职业、自我介绍、择偶标准、车房情况等等,都是通过正则表达式re库来实现的,

date_of_birth = re.compile("<br/>①出生年月/星座(.*?)<br/>", re.M | re.S)
sex = re.compile("<br/>【基本资料】(.*?)<br/>")
height = re.compile("<br/>②身高/体重(.*?)<br/>")
education = re.compile("<br/>⑤学历(.*?)<br/>")
jobs_1 = re.compile("<br/>⑥职业(.*?)<br/>")
income = re.compile("<br/>⑦月均收入(.*?)<br/>")
married = re.compile("<br/>⑨有无婚史(.*?)<br/>")
house_cars = re.compile("<br/>⑧车房情况(.*?)<br/>")
self_intro = re.compile("<br/>? 自我介绍(.*?)<br/>")
requirements = re.compile("<br/>【择偶标准】<br/>(.*?)</a>")
family_member = re.compile("<br/>⑩家庭成员(.*?)<br/>")


2.结果的可视化展示

我们先来看一下性别比例,从分布来看,女生前来相亲的比例更高,主要也是因为数据源是来自北京、上海、杭州等大城市的相亲介绍,大城市中似乎女生脱单更加困难一些,

我们再来看一下单身的女性的特征,首先她们的年龄主要集中在94、93以及95年左右,正好都是处在适婚的年龄

而她们的学历,本科占到了绝大多数,基本上都有本科的学历,而大专的占比排在第二,硕士和博士处于少数

另外小编也对单身女性的星座做了一个统计,发现处女座、天秤座以及射手座、白羊座的女性单身率略高一些

最后,我们来看一下她们的择偶标准吧,小编将她们的择偶标准单独提取出来,然后绘制成了词云图

review_list = []
reviews = get_cut_words("".join(df_girls["requirements"].astype(str).tolist()))
reviews_counter = Counter(reviews).most_common(200)
print(reviews_counter)

for review in reviews_counter:
    review_list.append((" " + review[0] + " ") * review[1])

stylecloud.gen_stylecloud(text=" ".join(review_list), max_words=500, collocations=False,
                          font_path="KAITI.ttf", icon_name="fab fa-apple", size=653,
                          output_name="4.png")


最后呈现出来的样子如下图所示:

3.结论

可见相亲市场上的女生,她们首先是希望男方是要有房有车的,其次要是男方之前存在婚史,女生会比较介意,然后要是有稳定的工作、有能力有责任心,通常都会给女生留下比较好的印象,而至于外在条件上,大多数女生的回答则是身高在175-180左右,年龄在90-97年之间。

到此这篇关于Python爬取几千条相亲文案的文章就介绍到这了,更多相关Python爬取相亲文案内容请搜索好二三四以前的文章或继续浏览下面的相关文章希望大家以后多多支持好二三四!

<link rel="stylesheet" href="https://js.how234.com/jslib/syntaxhighlighter/styles/shCore.css" type="text/css" /><link rel="stylesheet" href="https://js.how234.com/jslib/syntaxhighlighter/styles/shThemeDefault.css" type="text/css" /><script type="text/javascript" src="https://js.how234.com/third-party/SyntaxHighlighter/shCore.js"></script><style>pre{overflow-x: auto}</style>

热心网友 时间:2022-05-22 01:32

标题要长,要吊人胃口的,你学来的修辞手法可以派上大用场了
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
帮帮忙写个英语作文80字的 谢谢 80年山东高考总分 总胆红素25.44(正常3.4-22),直接胆红素7.13(正常0-6.8... ...参考值 总胆红素 19.4 0-23.0 umol/L 直接胆红素 6.4 0-8.0 umol/... 蟹爪兰冬天多久浇水 冬季蟹爪兰浇水间隔需长达多久 蟹爪兰冬天什么时候浇水好 蟹爪兰冬天多久浇一次水 端午节一家人吃饭的说说 端午节跟谁一起过 端午节一家人聚在一起吃饭的说说 端午节是家人团聚吗 什么软件可以联网不需要密码 快手 上架商品有营业执照 身份证照片 行业资质 请问行业资质是什么... 深水井泥石太重是怎么回事 ps填充图层为什么按ctrl+del是背景色白色或者黑色 ,教程上填充的为透明 哪位兄台能提供一些日本NGK火花塞的资料,网上能搜索到的就免了。 苯环上带一个乙炔分子这个物质叫什么? 苯乙炔的制备 苯乙炔系统命名 1,3,5-三(苯基乙炔)苯的合成路线有哪些? 烃基有哪些? 微信我把对方删了,他没删我,我再加回来对方会有提醒吗? 乙炔基和苯基哪个优先? 二苯乙炔二脲的化学结构式 摩尔庄园里除了红色浆果可以在浆果丛林找之外,还有什么浆果?分别在哪里找?急~ 有机物系统命名法是什么 春秋五霸谁第一个称霸 如何用化学方法鉴别苯妥英钠和硫喷妥钠、苯妥英钠和异戊巴比妥、地西泮和奥沙西泮? 求二苯乙炔与2,3,4,5-四苯基环戊二烯酮的diels-alder反应机理!diels-alder 4-苯基乙炔基邻苯二甲酸酐的合成路线有哪些? “春秋五霸”第一个称霸的是谁 世界上有什么软件可以不用密码直接联网 有没有什么什么软件可以让电脑不用输入wifi密码就可以上网 思科5505 防火墙,公司网络配置请教 有没有进口的视频会议系统推荐呢。 我要出盗墓笔记里的霍秀秀,可是不知道穿啥衣服啊 cisco路由器当作交换机使用 Cisco路由器;下一条地址;配置路由器命令; 07年有一部旗袍的电视剧 和闺蜜们拍的旗袍写真,给姐妹们秀秀,怎么样 Cisco Linksys SRW2024高级网管型交换机ACL的问题 带着媳妇儿看美景,造访古蜀道,记录和宋Pro穿越千年的相遇 这个旗袍能出霍秀秀么?、有照片。要是不行的话~~求具体的什么样的行?? 羽泉的《感觉不到你》MTV 女主角是谁? 求盗墓笔记霍秀秀人设.... 盗墓笔记点天灯原著情节 低马尾配灰色长衫的陈数,给人什么感觉? 电影旗袍演员表 谁可以告诉我《人鱼的旋律》里的人物资料? 顿号长什么样?? 语文顿号是什么样子