首先导入相关模块,以及要分析的数据,对数据进行最小二乘拟合,对应的代码如下:
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn import *
import statsmodels.api as sm
from statsmodels.stats.outliers_influence import variance_inflation_factor
data=pd.read_csv(r'C:\Users\dell\Desktop\SYHG\csv\P120.csv')
y=data['Y']
x=sm.add_constant(data.iloc[:,1:7])
model=sm.OLS(y,x)
result=model.fit()
result.summary()
运行程序后得到OLS拟合结果
之后计算集中测定异常值的指标值:残差值ri、cook距离ci、DFITS、Hadi值
yhat=result.fittedvalues
index=np.arange(1,41)
n=len(y)
p=6
SSE=0
i=0
ei=np.random.rand(n)
while i<len(y):
SSE+=(y[i]-yhat[i])**2
ei[i]=y[i]-yhat[i]
i&#
因篇幅问题不能全部显示,请点此查看更多更全内容