搜索
您的当前位置:首页正文

实用回归分析在python中的实现——学习笔记2(异常值的检测)

来源:赴品旅游

 首先导入相关模块,以及要分析的数据,对数据进行最小二乘拟合,对应的代码如下:

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn import *
import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor
data=pd.read_csv(r'C:\Users\dell\Desktop\SYHG\csv\P120.csv')
y=data['Y']
x=sm.add_constant(data.iloc[:,1:7])
model=sm.OLS(y,x)
result=model.fit()
result.summary()

 运行程序后得到OLS拟合结果

 

 之后计算集中测定异常值的指标值:残差值ri、cook距离ci、DFITS、Hadi值

yhat=result.fittedvalues
index=np.arange(1,41)
n=len(y)
p=6
SSE=0
i=0
ei=np.random.rand(n)
while i<len(y):
    SSE+=(y[i]-yhat[i])**2
    ei[i]=y[i]-yhat[i]
    i&#

因篇幅问题不能全部显示,请点此查看更多更全内容

Top