如何提取公司名称单位名称中关键字
发布网友
发布时间:2022-05-21 14:02
我来回答
共1个回答
热心网友
时间:2023-10-27 00:27
经常碰到这种情况:
一家企业的三个业务人员,在填表格的时候会这样写他们的公司名称:
深圳腾讯有限责任公司
深圳市腾讯有限责任公司
广东省深圳市腾讯有限责任公司
虽然是指同一家公司,但是名称不是完全一致,录入到数据库中,电脑可能会以为他们是不同的公司。
日积月累,当有一天,老大给你一张Excel表格时,说:"怀疑这些企业有以上问题,查一下。"
当那张表格有上百家企业,你要一个一个判断,复制出关键字,然后填入
select * from company where company_name like '% %'
显然效率太低了
鉴于目前没有找到比较智能的方法,暂且试用以下做法:
经过观察,虽然是上百家企业,但是名称出现不一样的原因大部分是相同的:广东 广东省 深圳 深圳市
有限责任公司 有限公司 公司。我们可以提取这些导致不一样的词,然后删除,那剩下的就是就是那些具有区别特征的关键字了。
用Excel的编辑--替换功能,"查找内容"为你要删除的东西,"替换为"保持空,点击全部替换,则查找的内容全部删除掉了
附:如果要提取关键字进入Oracle查询,可以把“替换为”的内容设为%号,好处如下:
例如:海尔集团深圳分公司
滤掉深圳后变为,海尔集团分公司,前后加%,得%海尔集团分公司%在Oracle中是查不出来的。