问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python怎么实现数据的异常值的处理

发布网友 发布时间:2022-04-23 03:09

我来回答

2个回答

热心网友 时间:2022-04-24 13:42

异常值也称离群值,具体地说,判断标准依据实际情况,根据业务知识及实际需要而定.
要是一般地说,可以用公式计算:
upper adjacent value = 75th percentile + (75th percentile – 25th percentile) * 1.5
lower adjacent value = 25th percentile – (75th percentile – 25th percentile) * 1.5
翻译过来:
上界=75%分位数+(75%分位数-25%分位数)*1.5
下界=25%分位数- (75%分位数-25%分位数)*1.5
比上界大的,和比下界小的都是异常值.

热心网友 时间:2022-04-24 15:00

# coding=utf-8

import re
import requests
from lxml import etree
import pymongo
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

def getpages(url, total):
nowpage = int(re.search('(\d+)', url, re.S).group(1))
urls = []

for i in range(nowpage, total + 1):
link = re.sub('(\d+)', '%s' % i, url, re.S)
urls.append(link)

return urls

def spider(url):
html = requests.get(url)

selector = etree.HTML(html.text)

book_name = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/a/text()')
book_author = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/div/a/text()')

saveinfo(book_name, book_author)

def saveinfo(book_name, book_author):
connection = pymongo.MongoClient()
BookDB = connection.BookDB
BookTable = BookDB.books

length = len(book_name)

for i in range(0, length):
books = {}
books['name'] = str(book_name[i]).replace('\n','')
books['author'] = str(book_author[i]).replace('\n','')
BookTable.insert_one(books)

if __name__ == '__main__':
url = 'http://readfree.me/shuffle/?page=1'
urls = getpages(url,3)

for each in urls:
spider(each)
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
康复者的血清中含有什么免疫分子 血清里面有什么 走读的定义在哪些教育阶段适用? PostgreSQL修改数据库表的列属性操作 Ubuntu调整postgresql默认路径 ubuntu – Postgresql:更改默认数据路径 刘邦几个老婆刘邦老婆吕雉和戚夫人的不同结局 刘邦几个老婆?. 如何防止父母在微信群里抢红包? 有哪些适合夏天选择的长裙款式值得推荐? python捕获异常错误内容 同屏器怎么用啊? python中的异常处理 无线同屏器如何使用? 无线同屏器怎么使用?投影仪怎么连接手机? 手机QQ收不到公众号? 无线同频器怎么使用? 蒸黄瓜怎么做? 同屏器怎么使用?手机 手机QQ的公众号和服务号是真的很烦人,请教大神教一下取消的方法!_百度... 黄瓜蒸完还脆吗? 手机QQ关注的公众号可以关注吗,怎么取消 鲍鱼蒸黄瓜的家常做法 黄瓜的做法大全 黄瓜怎么做好吃 为何取消不了手机qq公众号,它总说你的网络有问题 蒸黄瓜时间要多久最好 黄瓜除了拍黄瓜之外,还有哪些好吃的做法? 苹果手机微信公众号不能获取位置 手机qq天气公众号无法获取星座信息,请稍后重试 黄瓜怎样做才好吃?除了凉半 请教:python如何处理异常 同屏器是什么? Python中异常重试的解决方案详解 Python中程序异常都能被处理吗? 用无线同屏器可以把一台电视机同屏到另一台电视机吗? Python异常 手机如何通过无线与电视同屏? python对Dataframe中异常值检测求助 【Python基础】Python异常处理语句有哪些? 手机同屏器怎么用? python,如图,自定义异常,不如定义一个函数判断一下不就行了吗?自定义... python异常乱码如何解决 python Traceback (most recent call last)是怎么回事?要怎么解决... python 出现这个错误是什么原因 在使用python(2.6.1)在输出如下代码时,出现了异常现象(输出显示的数据不正确),经多次测试都不得其原因 python3.6如何把异常次数统计起来 成都地铁16号线全程有多少个站? 成都地铁16号线经过哪些站点 成都16号线地铁保利社区站点具体位置? 成都地铁16号线的总体走向