线性回归** (属于回归算法,解决回归问题,即目标值为连续性的数据)

应用场景:房价预测,销售额度预测,贷款额度预测

定义:线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。

线性关系:

通用公式(线性模型): h(w) = w1x1 + w2x2 + w3x3 + … + b —自变量一次

x1,x2,x3代表特征值,h(w)为目标值(或者用y来表示),w1,w2,w3为权重值(也叫回归系数),b为偏置。

其中w,x可以理解为矩阵:

即可以这样表示 h(w) = w^Tx + b(w的转置乘x加b)

线性表示:y = wx +b 线性表示:y = w1x1 + w2x2 + b

image image

注:单特征与目标值的关系是直线关系,两个特征与目标值呈平面关系。

非线性关系:

公式(线性模型):y = w1x1 + w2x1^2 + w3x1^3 + w4x1^3 + … + b —参数一次

image

线性回归的原理:假定特征值和目标值满足线性回归公式(即上面的函数关系),然后通过一些方法找到最合适的一组权重和偏置,使得预测结果(目标值)更加的准确。

特点:只有一个自变量的情况称为 单变量回归 ,多于一个自变量的情况叫做 多元回归

损失函数(也叫最小二乘法,最小:想要使得损失最小,二乘法:平方): image

hw(x1)即把x1特征代入一个假定形成的具有权重和偏置的函数中求出的预测目标值,y1,y2…ym为真实目标值,然后相减、平方(两值相减可能为负,为了不让距离相互之间抵消,所以平方)

损失函数的原理:即假设已经有个预测函数,和一个真实函数,求出预测函数到真实函数的总距离(总损失)

如何使得损失更小(算出一个最佳的线性模型,即求出最佳参数w,b)?

优化损失(即缩小损失的过程):缩小预测函数到真实函数的总距离即为优化损失

优化算法:

如何去求模型当中的W,使得损失最小?(目的是找到最小损失对应的W值)

算法一:正规方程(用的较少):天才——直接求解w

公式: image

理解:X为特征值矩阵

y为目标值矩阵

image : 把m×n矩阵X的行换成同序数的列得到一个n×m矩阵,此矩阵叫做X的转置矩阵

image

image :矩阵 image 的逆矩阵, 比如 一个数a乘以一个数b,让他的结果为1,即 a * b = 1,那么 b = 1 / a = a ^ -1,同理,一个矩阵A乘以一个矩阵B,让他的结果为单位矩阵E (主对角线上的元素都为1,其余元素全为0的n阶矩阵称为n阶单位矩阵,比如 image ),即A * B = E,那么B = A ^ -1,其实就是A的逆

缺点:当特征过多过复杂时,求解速度太慢并且得不到结果

应用场景:适合用于数据量比较小的场景

算法二:梯度下降(用于线性回归、逻辑回归、深度学习):勤奋努力的普通人——一开始随便给出权重和偏置,然后不断尝试(试错、改进)求出最佳权重和偏置

公式: image

理解: α为学习速率,也可以称为步长,需要手动指定, image 为方向,沿着这个函数下降的方向找,最后就能找到最低点,然后更新W值

image

沿着切线向下的方向,一步步的计算出权重使得损失值最小。

如何在sklearn中使用线性回归算法?

API:sklearn.linear_model.LinearRegression(fit_intercept=True)

优化方法:正规方程

fit_intercept:是否计算偏置

LinearRegression.coef_:查看回归系数(即权重w)

LinearRegression.intercept_:查看偏置(即偏置b)

API:sklearn.linear_model . SGDRegress or(loss=“squared_loss”, fit_intercept=True, learning_rate=“invscaling”, eta0=0.01)

优化方法:梯度下降

fit_intercept:是否计算偏置

SGDRegression.coef_:查看回归系数(即权重w)

SGDRegression.intercept_:查看偏置(即偏置b)

loss:损失类型,默认为sqaured_loss,即最小二乘法

learning_rate:string,optional,学习速率,即步长,学习率默认为invscaling算法(invscaling算法公式:eta=eta0/pow(t, power_t) eta0需要自己指定初始学习率,power_t默认为0.25),还有optimal算法(optimal算法公式:eta=1.0/(alpha * (t+t0))[default]),constant算法(constant算法公式:eta=eta0,如果想要学习率保持在一个水平,可以使用此算法,即设置learning_rate=“constant”)

eta0:指定学习率,默认为0.01

示例:波士顿房价预测

数据集:

image

image

流程:

1)获取数据

2)数据集划分

3)特征工程: 无量纲化——>标准化

4)预估器流程:fit() —>模型

5)模型评估

如何去评估模型的效果?(即回归性能评估)

方法:均方误差(Mean Sqaured Error,即MSE)评价机制

均方误差公式: image

理解:每一个样本的预测值减去真实值,然后求出平方和的平均, image 为预测值, image 为真实值。

只需要求一下模型的均方误差,哪一个模型的均方误差比较小,就说明哪个模型效果更好一些。

如何在sklearn中使用均方误差?

API:sklearn.metrics.mean_squared_error(y_true, y_pred)

metrics:(数学中)测量的意思

mean_squared_error:平均的平方误差

y_ture:真实的目标值

y_pred:预测的目标值

返回值:均方误差的结果,结果越大,损失越大

代码:

from sklearn.datasets import load_boston 
from sklearn.model_selection import train_test_split 
from sklearn.preprocessing import StandardScaler 
from sklearn.linear_model import LinearRegression, SGDRegressor 
from sklearn.metrics import mean_squared_error def linear1(): ''' 正规方程的优化方法对波士顿房价进行预测 :return: ''' # 1、获取数据 boston = load_boston() print("特征名称:", boston.feature_names) print("样本和特征的数量:", boston.data.shape) # 2、数据集划分 x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22) # 3、特征工程:标准化 transfer = StandardScaler() x_train_new = transfer.fit_transform(x_train) x_test_new = transfer.transform(x_test) # 4、预估器流程 estimator = LinearRegression() estimator.fit(x_train_new, y_train) # 5、得出模型 print("正规方程-权重系数为:", estimator.coef_) print("正规方程-偏置为:", estimator.intercept_) # 6、模型评估 y_predict = estimator.predict(x_test_new) error = mean_squared_error(y_test, y_predict) print("预测房价:\n", y_predict) print("正规方程-均方误差为:", error) return None def linear2(): ''' 梯度下降的优化方法对波士顿房价进行预测 :return: ''' # 1、获取数据 boston = load_boston() # 2、数据集划分 x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22) # 3、特征工程:标准化 transfer = StandardScaler() x_train_new = transfer.fit_transform(x_train) x_test_new = transfer.transform(x_test) # 4、预估器流程 estimator = SGDRegressor(learning_rate='constant') estimator.fit(x_train_new, y_train) # 5、得出模型 print("梯度下降-权重系数为:", estimator.coef_) print("梯度下降-偏置为:", estimator.intercept_) # 6、模型评估 y_predict = estimator.predict(x_test_new) error = mean_squared_error(y_test, y_predict) print("预测房价:\n", y_predict) print("梯度下降-均方误差为:", error) if __name__ == '__main__': # 代码1:正规方程的优化方法对波士顿房价进行预测 linear1() # 代码2:梯度下降的优化方法对波士顿房价进行预测 linear2() 

结果(部分截图):可以看出在小数据集上,正规方程比梯度下降的均方误差要小一些,损失就小一些,当然也可以对梯度下降进行调参使得损失减小(即尝试改变预估器SGDRegressor()里的参数值,比如eta0-学习率,max_iter-最大迭代次数,learning_rate-学习算法…)。 image image

进行调参,替换掉上面实例化梯度下降算法预估器代码:

estimator = SGDRegressor(learning_rate='constant', max_iter=10000)

结果:通过对梯度下降算法预估器进行调参,均方误差明显减小了,即损失减少。 image

总结:

梯度下降 正规方程
需要选择学习率(即设置参数eta0和learning_rate) 不需要
需要迭代求解(即需要不断的试错,改进) 一次运算得出结果
特征数量较大也可以使用 需要计算方程、时间复杂度高(需要计算转置、求逆,遇到特征数量较多的情况就不太适合)

如果数据集样本数量小于10万个,不建议用梯度下降(SGDRegressor),要么用Lasso ElasticNet—样本数量少的情况下适合特征数量少的,要么用岭回归(RidgeRegression)—样本数量少的情况下适合特征数量多的。

image

(sklearn官网给出的图,图中没有提LinearRegression—正规方程算法)

LinearRegression虽然适合小规模数据,但是不能够解决 拟合问题 ,所以不常用,常用岭回归

SGDRegressor适合大规模数据

拓展:梯度下降优化器

优化方法:GD、SGD、SAG(基于梯度下降对优化器的改进)

GD(Gradient—梯度 Descent—下降):最普通最原始的梯度下降,需要计算每一个样本的值进行一个个的迭代,每一次迭代权重和偏置时都要把所有样本的值算一遍,然后再进行一次迭代,导致计算量非常大效率低,所以后面才有一系列的改进。

改进:SGD,SAG

SGD(Stochastic gradient descend):称为随机梯度下降,是一个优化方法。它在一次迭代时只考虑一个训练样本。而不是像传统的最原始的GD,算所有样本才更新一次权重和偏置。

优点:高效、容易实现

缺点:SGD需要许多超参数,比如正则项参数、迭代数

SGD对于特征标准化是敏感的

效果没有GD好

SAG(Stochastic Average Gradient):称为随机平均梯度法,由于传统的GD收敛的速度太慢,SGD也有一些缺点,于是有人提出SAG等基于梯度下降的算法。

岭回归和逻辑回归等当中都会有SAG优化

欠拟合和过拟合

问题:训练数据训练的很好,误差也不大,为什么在测试集上面有问题呢?

当算法在某个数据集中出现这种情况,可能就出现了 过拟合现象

欠拟合:学习到的特征太少了

image

图片理解:机器学习天鹅的特征,由于学到的特征比较少,所以第一个,第二个根据有翅膀、嘴巴长预测的结果为天鹅(错误),最后一个正确。

过拟合:学习到的特征太多了

image

图片理解 : 这次让机器学习较多特征,第一个根据脖子短(不符合),体型小(不符合)预测的结果不是天鹅(正确),第二个由于机器学习到的特征中有”白色的“,所以判断第二个不是天鹅(错误)

过拟合:

定义:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在测试数据上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)

原因:原始特征过多,存在一些嘈杂特征,模型过于复杂是因为模型尝试去兼顾各个测试数据点。

图1 如果用一条直线去拟合各个数据点,属于欠拟合,图3 由于有很多高次项去拟合数据,在训练集上非常吻合,但是这个模型泛化能力比较差,如果新的数据拿来测试很可能不准,图2 为 理想模型。

image

如何解决过拟合问题?

image

正则化方法:

类别:L1正则化,L2正则化

L2正则化(常用):

作用:使得模型当中的权重系数W尽可能地接近于0,从而削弱某些特征的影响。

加入L2正则化后的损失函数: image

理解: image 为损失函数,预测值减去真实值,求一个平方和,不过前面变为1/2m,这样更容易求导。 image 为λ * 惩罚项,λ为惩罚系数(惩罚的步长,超参数,可以调节),每一个权重的平方乘以λ然后再加和。这个方法在尽可能的让损失函数值变小的同时,后面还加上惩罚项,可以使得权重系数尽可能的减小(不仅能够让模型更加的准确,还消除了一些高次项的影响)

加入L2正则化后的损失函数称为 Ridge — 岭回归

L1正则化:

同L2正则化,也是在损失函数 image 后面加上λ * 惩罚项,不过惩罚项为权重w的绝对值和(L2正则化为权重w的平方和)

作用:可以使得其中一些w的值直接为0,删除这个特征的影响

加入L1正则化后的损失函数称为 LASSO

欠拟合:

定义:一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)

原因:学习到数据的特征过少

解决方法:增加数据的特征数量

过拟合和欠拟合的理解:

image

岭回归 :(属于回归算法)即带L2正则化的线性回归,是线性回归的一个改进(也是一种线性回归,加入L2正则化的限制,从而能够解决过拟合问题)

API:sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True, solver=“auto”, normalize=False)

alpha:正则化力度(即惩罚项系数),也叫λ,取值在 0-1 1-10

fit_intercept:是否添加偏执,默认添加,使得模型更加准确

solver:默认为"auto",会根据数据自动选择优化方法,如果数据集、特征都比较大,选择随机平均梯度法优化,将自动选择参数"sag"(Stochastic Average Gradient)。

normalize:默认为False,如果选True,可以在预估器流程fit()之前调用preprocessing.StandardScaler,相当于省去了在特征工程中进行标准化的步骤,直接在实例化预估器流程中选择参数normalize=True即可实现特征工程标准化。

因生成的模型也是线性模型,如果想看权重和偏置,也可以调用相关属性,如下

Ridge.coef_:回归权重

Ridge.intercept_:回归偏执

理解:Ridge方法相当于SGDRegressor(penalty=“l2”, loss=“squared_loss”),penalty=“l2”:给线性回归加上了L2惩罚项,实现了L2正则化,loss=“squared_loss”:最小二乘法,只不过SGDRegressor实现了一个普通的随机梯度下降学习,推荐使用Ridge(实现了SAG,即随机平均梯度法)

其他API:sklearn.linear_model.RidgeCV(_BaseRidgeCV, RegressorMixin)

理解:具有L2正则化的线性回归,可以进行交叉验证,即加上了交叉验证的岭回归。

coef_:回归系数

正则化力度(即惩罚项系数)对结果(权重系数)有什么影响?

image

横坐标:正则化力度(alpha);纵坐标:权重系数(weights)

观察上图,可以得出,正则化力度越大,权重系数越接近于0(越小),正则化力度越小,则权重系数越大,把图和公式联系起来,加入L2正则化后的损失函数公式(即岭回归公式):

image

损失函数值 image 要求 越小越好,根据公式也可以看除出,当正则化力度比较大,相对而言,惩罚项会比较小一点,即权重系数会小一点,当正则化力度小的话,权重系数就会大一些。

示例:波士顿房价预测

代码:

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Ridgedef linear3():'''岭回归对波士顿房价进行预测:return:'''# 1、获取数据boston = load_boston()# 2、数据集划分x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, random_state=22)# 3、特征工程:标准化transfer = StandardScaler()x_train_new = transfer.fit_transform(x_train)x_test_new = transfer.transform(x_test)# 4、预估器流程estimator = Ridge(alpha=0.5, max_iter=10000)estimator.fit(x_train_new, y_train)# 5、得出模型print("岭回归-权重系数为:", estimator.coef_)print("岭回归-偏置为:", estimator.intercept_)# 6、模型评估y_predict = estimator.predict(x_test_new)error = mean_squared_error(y_test, y_predict)print("预测房价:\n", y_predict)print("岭回归-均方误差为:", error)if __name__ == '__main__':linear3()

结果: image

逻辑回归 :(属于分类算法)用来解决二分类问题

逻辑回归(Logistic Regression)不属于回归算法,但确实和线性回归有一定的联系

应用场景:广告点击率(是否会被点击)、是否为垃圾邮件、是否患病、金融诈骗(是否为金融诈骗)、虚假账号(是否为虚假账号),上面场景全是二分类问题,即要么是,要么否。

原理:

1 输入

公式: image

理解:线性回归的输出(结果)作为逻辑回归的输入

2 激活函数

sigmoid函数

将逻辑回归的输入(线性回归的输出结果)代入到sigmoid函数中

公式: image

理解:sigmo函数其实是1 / 1 + e^(-x),然后将线性回归的输出代入到x的部分就成了 image 这个结果,只不过公式写的是另一种线性模型的表示方法(即用矩阵的形式来表示)

输出结果:将线性回归的结果代入sigmoid函数得到的值是[0, 1]区间中的一个概率值,默认0.5为阈值,如果输出结果大于0.5,就认为属于某个类别,如果小于0.5.就认为不属于某个类别,这样就可以解决分类问题

image

假设有了一个线性模型,将线性模型的函数 h(w) = w1x1 + w2x2 + w3x3 … + b 代入 simoid函数(即 1 / 1 + e^(-x) )的x部分,可得:

1 / 1 + e^(-(w1x1 + w2x2 + w3x3 … + b)) —— 逻辑回归生成的模型函数其实就是这个

如何得出一组权重和偏执使得模型可以准确进行分类预测?

思路:构建一个损失函数,然后优化损失

线性回归构建的损失函数为最小二乘法或均方误差,即 y_predict - y_true 然后求出平方和或 y_predict - y_true 然后求出平方和除以总数求平均。

逻辑回归损失函数如何构建?

线性回归的真实值:具体的一个数,容易构建损失函数

逻辑回归的真实值:分类,(即是否属于某个类别)

逻辑回归的预测值:概率,然后加一个阈值,大于这个阈值为一个类别,小于这个阈值不为这个类别(即是否属于某个类别)

对数似然损失(逻辑回归的损失计算函数)

公式: image

理解:如果 真实值 y=1(即属于这个类别),损失就是 image ,如果真实值 y=0(即不属于这个类别),损失就是 image

当 y = 1 时:(真实值属于这个类别)

image

理解:线性回归的输出结果映射到sigmoid函数上, 得到区间在[0, 1]的预测的概率值 (即在这里代表横坐标 image ,如果 image 越接近于1,纵坐标损失值越接近于0,说明预测的越准确,如果 image 为越接近于0的概率值,损失值就越大,说明预测的不准确 )

当 y = 0时:(真实值不属于这个类别)

image

理解:线性回归的输出结果映射到sigmoid函数上,得到区间在[0, 1]的预测的概率值,如果预测值接近于0的话,损失也接近于0,说明预测的比较准,如果预测的概率值接近于1的话,真实值是不属于这个类别,而预测的值代表属于这个类别,说明预测的不准,意味着损失比较大。

综合完整损失函数公式:

image

理解:如果某一个样本的 真实值为1 (属于一个类别),则后面部分 image 的yi = 1,抵消了,然后根据 image 计算这个样本的损失值。如果某一个样本的 真实值为0 ,则前面部分 image 的yi = 0,抵消了, 然后根据 image 计算这个样本的损失值。最后把所有样本的损失值进行加和,求出总的损失。

image

关于对数函数log:

image

当 a > 1 时,函数单调递增,-log a §,P值越大,结果(即单个样本损失值)越小

知道了逻辑回归损失的计算方法,如何去优化损失?

即逻辑回归预测的结果更加准确,更加接近于真实结果

方法:梯度下降

如何在sklearn中使用逻辑回归?

API:sklearn.Linear_model.LogisticRegression(solver=“liblinear”, penalty=“l2”, C=1.0)

solver:优化求解方式,默认为开源的"liblinear"库实现,内部使用了坐标轴下降法来迭代优化损失函数,如果设为"sag",则为随机平均梯度下降

pernalty:正则化的种类,这里加入L2正则化,防止过拟合。(逻辑回归虽然是用来分类的,但是其内部还是有线性回归)

C:正则化力度

LogisticRegression.coef_:查看回归(权重)系数

LogisticRegression.intercept_:查看偏置

LogisticRegression方法相当于SGDClassfier(loss=“log”, penalty=""),SGDClassfier实现了一个普通的随机梯度下降学习,也支持平均随机梯度下降法(SAG),可以通过设置average=True。而使用LogisticRegression(实现了SAG)。

示例: 逻辑回归对癌症分类预测 — 良 / 恶性乳腺癌肿瘤预测

数据集:(来自UCI)

下载地址: https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

下载页面:

image

.data为数据集,.names为数据描述

直接下载附件:

breast-cancer-wisconsin.data

breast-cancer-wisconsin.data内容:(部分)

共有699个样本,每个样本10个特征值和1个目标值

image

breast-cancer-wisconsin.names内容:(部分)

10个特征对应的名称,最后一个为类别(目标),2代表良性,4代表恶性

image image

存在16个 用"?"表示的 缺失值,意味着要进行缺失值处理

image image

流程:

1)获取数据

读取的时候加上names

2)数据处理

处理缺失值

3)数据集划分

4)特征工程

无量纲化处理:标准化

5)逻辑回归预估器流程

6)模型评估

jupyter notebook代码:

import pandas as pd
# 1、获取数据
# 注意,源文件没有列索引
# 方法一:要么在源文件第一行加上特征名
# 方法二:要么设置一个数组存放特征名,然后通过pd.read_csv的names参数传进去
column_name = ['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class']
data = pd.read_csv('.\\breast-cancer-wisconsin.data', names=column_name)# 2、数据处理,缺失值处理,总共16个用"?"表示的缺失值
import numpy as np
# 1)将带有"?"的缺失值替换为 np.nan,
# to_replace —> 想要替换的缺失值,value —> 把缺失值替换为 np.nan即(NaN)
data = data.replace(to_replace="?", value=np.nan)
# 2)删除缺失样本
# dropna()默认按行删除所有含有NaN数值的样本
# inplace=True:不创建新的对象,直接对原始对象进行修改;inplace=False:对数据进行修改,创建并返回新的对象承载其修改结果。
data.dropna(inplace=True)
# 检验是否删除含有缺失值的样本
data.isnull()    # False代表不为空数据

部分截图: image

data.isnull().any()    # 每一列都不存在空数据,即已删除含有缺失值的样本

image

# 3、数据集划分
from sklearn.model_selection import train_test_split
# 筛选特征值和目标值
x = data.iloc[:, 1:-1]    # 选择所有行,选择第二列(不包括id列的第二列)到倒数第二列
y = data['Class']
x_train, x_test, y_train, y_test = train_test_split(x, y)# 4、特征工程:标准化
from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
x_train_new = transfer.fit_transform(x_train)
x_test_new = transfer.transform(x_test)# 5、逻辑回归预估器流程
from sklearn.linear_model import LogisticRegression
estimator = LogisticRegression()
estimator.fit(x_train_new, y_train)
# 查看逻辑回归模型的参数
# coef_ —> 回归(权重)系数
estimator.coef_    # 有几个特征就有几个回归(权重)系数,即有9个特征(回归系数)

image

# intercept_ —> 偏置
estimator.intercept_

image

# 6、模型评估
# 方法一:直接比对预测值和真实值
y_predict = estimator.predict(x_test_new)
print("直接比对预测值和真实值:\n", y_predict == y_test)

image

# 方法二:计算准确率
score = estimator.score(x_test_new, y_test)
print("准确率为:\n", score)

image

总结:比对真实值和以这种方式来计算准确率显然不够专业,不能够很好的分析出,在预测的结果中,患有恶(良)性肿瘤中真正患有恶(良)性肿瘤的人,以及,在真实的结果中,所有患有恶(良)性肿瘤的人中被查出来了多少人,为了更好的进行模型评估,引入以下概念。

精确率和召回率:

混淆矩阵

定义:在分类任务下,预测结果(predict Condition)于正确标记(True Condition)之间存在四种不同的组合,构成混淆矩阵(适用于多分类)

image

TP:True Possitive FN:False Negative

精确率:在预测结果为正例样本中证实为正例的比例,如下图表示

image

即 TP / TP + FP

召回率:真实为正例的样本中预测结果为正例的比例(即反应查的全不全)

image

即 TP / TP + FN

比如说,恶性肿瘤的为正例,良性肿瘤为假例,预测的患有恶性肿瘤的患者中真正为恶性肿瘤患者的人即为 准确率 ,在所有真正患有恶性肿瘤的患者中预测患有恶性肿瘤的比例即为 召回率

除了准确率和召回率来对模型预测的结果进行评估之外,还有 F1-score ,反应模型的稳健型。

公式: image

理解:精确率 加 准确率 分之 2倍的 精确率 乘 召回率,F1-score值越大,精确率、召回率就越高,稳健性就更强。

如何在sklearn中使用精确率、召回率、F1-score进行模型评估?

API:sklearn.metrics.classification_report(y_true, y_pred, lables=[], target_names=None)

metrics — 测量

classification_report — 分类结果报告

y_true:真实目标值

y_pred:估计器预测的目标值

labels:指定类别对应的数字

target_names:目标类别名称

return:每个类别精确率与召回率,返回值为字符串类型

示例:对上述癌症预测进行模型评估

jupyter notebook代码:

# 6、模型评估
from sklearn.metrics import classification_report
# 查看精确率、召回率、F1-score
report = classification_report(y_true=y_test, y_pred=y_predict, labels=[2, 4], target_names=['良性', '恶性'])
print(report)    # support为样本量

结果: image

假设总共100个人,99个患有癌症,1个无癌症 —— 样本不均衡(正例太多,反例太少)

不管怎样, 全部 预测为癌症

准确率:99%

召回率:100%

精确率:99%

F1-score:2 & 99% * 100% / 199% = 99.497%

可以看出,这样得出的结果都很高(即不管怎么样,全部预测为癌症,是一个很不负责任的模型,这就是样本不均衡下的评估问题)

如何衡量样本不均衡下的评估?(即从样本均不均衡的角度去评估生成模型的预测结果)

ROC曲线与AUC指标:

image

蓝线为ROC曲线, 曲线和X轴、Y轴包成的区域的面积为AOC指标(衡量分类器的好坏就看这个指标,如果AOC指标也接近于1,说明分类器越好,越接近于0.5,说明分类器越不好),横坐标为FPR,纵坐标为TPR

ROC曲线:

TPR = TP / (TP + FN) —— 召回率

理解:在所有真实类别为1的样本中,预测类别为1的比例

FPR = FP / (FP + TN)

理解:在所有真实类别为0的样本中,预测类别为1的比例

有了TPR和FPR就可以确定ROC曲线了。

如果TPR = FPR,意味着全部预测为1(意味着不管正例还是反例,统统预测为正例,就是在瞎猜乱蒙,对应着上图中的红色虚线(random guess)),此时面积为0.5(即AUC=0.5)

如果TPR > FPR,极限为TPR接近于1, FPR接近于0,即上图左上角perfect classification,此时面积就为1(AUC=1),完美分类器

如果TPR < FPR,即在红色虚线之下的部分,这部分的AUC < 0.5,即很糟糕,那么反过来预测,即 用 1 减去糟糕小于0.5的AUC值,可得到不错的AUC值

AUC指标:

AUC的最小值为0.5,最大值为1,取值越高越好

如何在sklearn中使用AUC计算?

API:sklearn.metrics.roc_auc_score(y_true, y_score)

计算ROC曲线面积,即AUC值

y_true:每个样本的真实类别, 必须为0(反例),1(正例)标记

y_score:预测值(y_predict),可以是正类的估计概率,置信值或者分类器方法的返回值(classification)

示例:对上述 癌症分类预测 进行AUC评估

jupyter notebook代码:

# 6、从样本不均衡的角度去衡量模型的好坏
from sklearn.metrics import roc_auc_score
# 样本中4代表恶性,即正例,转换为1标记,2代表良性,即反例,转换为0标记
y_true = np.where(y_test > 3, 1, 0)

![image](https://upload-images.jianshu.io/upload_images/23178900-
d7f5338d487fd1af.png!thumbnail?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

# y_true:每个样本的真实类别,必须为0(反例),1(正例)标记
roc_auc_score(y_true,y_predict)

image

AUC指标的结果接近于1,从样本不均衡的角度看,说明这个模型还可以。

总结:AUC只能用来评价二分类,非常适合用来评价当样本出现不均衡的情况下,分类器的性能。比如前面的这种不均衡的情况,正例为患有癌症

image

求AUC

TPR = 100%(在 所有真实类别为1(正例)的样本中,预测类别为1的比例 )

FPR = 100%(在 所有真实类别为0的样本中,预测类别为1的比例)

因为 TPR = FPR 所以AUC=0.5 即最差的模型

所以通过AUC指标就可以知道样本不均衡的情况下模型到底好不好。

模型的保存和加载

API:from sklearn.externals import joblib

保存:joblib.dump(value, ‘test.pkl’)

value:传入预估器 ’ ':路径,会在指定的本地路径生成后缀名为.pkl模型文件

加载:estimator = joblib.load(‘test.pkl’)

K-means算法 :(属于一个无监督学习的聚类算法)

image

图一为原始的无聚类数据,经过K-means聚类算法得到聚类数据。

K-means聚类步骤:(K为超参数)

1、随机设置K个特征空间内的点作为初始的聚类中心

2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别

3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)

4、如果计算机得出的新中心点与原中心点一致,那么结束,否则重新进行第二步过程。

image

如何在sklearn中使用K-means算法?

API:sklearn.cluster.KMeans(n_clusters=B, init=‘k-means++’)

n_clusters:开始的聚类中心数量(即K值)

init:初始化方法,默认为’k-means++’(其实是对K-means的一种优化方法)

labels_:默认标记的类型,可以和真实值比较(labels为属性,即调用之后可以查看标记的类型)

示例:k-means对 Instacart Market用户聚类(对用户进行划分,从而针对不同类别的人推荐不同的商品)

如果k=3,即把用户分为3类

流程:

降维后的数据

1)预估器流程

2)看结果

3)模型评估

jupyter notebook代码:

import pandas as pd
# 1.获取数据
order_products_prior = pd.read_csv("instacart/order_products__prior.csv")
products = pd.read_csv("instacart/products.csv")
orders = pd.read_csv("instacart/orders.csv")
aisles = pd.read_csv("instacart/aisles.csv")# 2.合并表
# 合并aisles和products,aisle和product_id就关联了
tab1 = pd.merge(aisles, products, on=["aisle_id", "aisle_id"])
# 合并tab1和order_products_prior,aisle和order_id就关联了
tab2 = pd.merge(tab1, order_products_prior, on=["product_id", "product_id"])
# 合并tab2和orders,aisle和user_id就关联了
tab3 = pd.merge(tab2, orders, on=["order_id", "order_id"])# 3.找到user_id和aisle之间的关系
table = pd.crosstab(tab3["user_id"], tab3["aisle"])
data = table[:10000]# 4.PCA降维
from sklearn.decomposition import PCA
# 1)实例化一个转换器类
transfer = PCA(n_components=0.95)
# 2)调用fit_transorm
data_new = transfer.fit_transform(data)# 5、预估器流程
from sklearn.cluster import KMeans
estimator = KMeans(n_clusters=3)
estimator.fit(data_new)
# 看结果
y_predict = estimator.predict(data_n

image

可以看到用户被分成了3个类别(0,1,2),但是并不知道生成的模型的好坏。

如何对K-means算法生成的模型进行评估?

轮廓系数

公式: image

公式理解:

bi — 每一个样本到其他族群所有样本的距离的最小值(外部距离)

ai — 每一个样本到本族群中所有距离的平均值(内部距离)

轮廓系数数值分析:

image

如何根据轮廓系数判断聚类的好坏?

如果 image >> image ,即外部距离很大,内部距离很小,聚类效果最好,则轮廓系数 imageimage / image = 1

如果 image << image ,即外部距离很小,内部距离很大,聚类效果最差,则轮廓系数 image ≈ - image / image = -1

如何在sklearn中使用轮廓系数?

API:sklearn.metrics.silhoutte_score(X, labels)

计算所有样本的平均轮廓系数

X:特征值

labels:被聚类标记的目标值

返回值:轮廓系数

jupyter notebook代码:(接上面的代码)

# 6、模型评估 — 轮廓系数
from sklearn.metrics import silhouette_score
silhouette_score(data_new, y_predict)

轮廓系数:(仅对10000个样本训练得到的模型,这个结果还可以) image

K-means总结:

优点:采用迭代式算法

image

缺点:容易收敛到局部最优解

最开始在取初始K个聚类中心点的时候是随机选取的,如果选取的K个点恰好挨得比较近,那么容易导致结果陷入到局部最优,怎么避免?多次聚类(多次随机取聚类中心)

应用场景:如果一开始没有目标值,根据聚类生成类别,有了类别,后期就可以进行分类。

学习大纲:

image

查看全文
如若内容造成侵权/违法违规/事实不符,请联系编程学习网邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

相关文章

  1. JAVA- Jersey使用示例

    0 概述 本文档主要讲述JAVA-Jersey的使用说明,并给出了示例。 1 前提条件java安装并配置好相应的路径安装java的IDE Eclipse或者IDEA 进入各自的官网安装即可: Eclipse: https://www.eclipse.org/ IDEA: https://www.jetbrains.com/安装Postman (便于调试) 进入官网 https://…...

    2024/3/15 10:53:50
  2. ffmpeg笔记记录

    (转载https://www.cnblogs.com/lsqandzy/p/5663482.html)1.分离视频音频流ffmpeg -i input_file -vcodec copy -an output_file_video  //分离视频流 ffmpeg -i input_file -acodec copy -vn output_file_audio  //分离音频流2.视频解复用ffmpeg –i test.mp4 –vcodec c…...

    2024/3/15 10:53:48
  3. centos7.X安装redis

    1、环境 系统: [root@redis ~]# cat /etc/redhat-release CentOS Linux release 7.6.1810 (Core)redis版本:redis-6.0.0.tar.gz 2、安装gcc依赖 由于 redis 是用 C 语言开发,安装之前必先确认是否安装 gcc 环境 [root@redis ~]# gcc -v如果没有安装,执行以下命令进行安装 …...

    2024/3/27 15:41:02
  4. 华为模拟器eNSP下载与安装教程

    华为模拟器eNSP下载与安装教程简单介绍一下 eNSP:eNSP的安装步骤:备注: 简单介绍一下 eNSP: eNSP是一款由华为提供的免费的图形化网络仿真工具平台,它将完美呈现真实设备实景(包括华为最新的ARG3路由器和X7系列的交换机),支持大型网络模拟,让你有机会在没有真实设备的…...

    2024/3/27 1:23:01
  5. CMU-DATABASE-01-INTRODUCTION

    数据库为什么我们需要构建数据库关系模型主外键DML关系代数自然连接内连接左外连接右外连接全外连接数据库可以理解为以某种方式去进行关联的数据集合,这就可以试着对现实世界的某些方面进行建模,它是大部分计算机应用程序的核心。...

    2024/3/15 10:53:44
  6. 机器学习入门

    人工智能小案例: 请使用科学上网工具打开链接 案例一:https://quickdraw.withgoogle.com/ 案例二:https://pjreddie.com/darknet/yolo/ 案例三:https://deepdreamgenerator.com/ 人工智能的发展历程: 图灵测试: 测试者与被测试者(一个人和一台机器)隔开的情况下,通过一…...

    2024/3/21 14:52:06
  7. 浅谈可视化设计-数据时代的美味“烹饪师”(上篇)

    目录: 1. 什么是大屏数据可视化 2. 设计流程介绍 3. 结合情感打造二维设计美感 4. 构建空间感&二维与三位的融合 5. 小结还记得大学学设计的时候学院里流传了一句话:“有百分之八十的设计师都幻想着成为一名厨师。” 我之前从未细品过这句话的缘由,只觉得是同学们之间的…...

    2024/3/15 10:53:43
  8. 有用的一些网站

    1、统计之都https://cosx.org/2、漫谈机器学习算法http://database.51cto.com/art/201407/444810.htm3、nuclear normhttps://math.stackexchange.com/questions/701062/derivative-of-the-nuclear-norm-with-respect-to-its-argumenthttps://math.stackexchange.com/questions…...

    2024/3/15 10:53:41
  9. MySQL主从复制(Linux)

    一、准备工作 1、准备两台Linux系统主机(实验系统CentOS7 * 2) 1.1、直接使用虚拟机克隆已创建好的CentOS7虚拟机(对应虚拟机软件:VMware Workstation Pro 15) 2、在虚拟机上安装MySQL(对应版本MySQL5.7 for Linux ) 2.1、安装MySQL5.7教程:前往安装 注意:两台虚拟机M…...

    2024/3/15 10:54:08
  10. 机器学习之分类算法

    如果目标值为 类别, 则属于分类问题,使用分类算法 1、sklearn转换器和预估器(估计器) 转换器 —特征工程的父类 1)实例化(实例化的是一个转换器类(Transformer)) 2)调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) fit_transform(X) 方法是由 fit() 方…...

    2024/3/15 10:54:09
  11. 如何为游戏插上人工智能的翅膀?

    导读:AI技术已经成为提升游戏整体体验的利器,如何让中小游戏企业也能获得这个利器?2018年的电影《头号玩家》满足了很多玩家对游戏的完美想象。电影中的游戏用到了很多AI黑科技,让人们每天沉浸在精彩的虚拟世界中不能自拔。现实生活中的游戏虽然没有那么炫酷和沉浸,但AI技…...

    2024/3/15 10:54:05
  12. hw小技巧

    小弟也第一次参加hw,经过5天hw,确实也学到了许多的东西,但就本次分享而言,我分享一些我认为在hw里面值得注意的东西以及一些小技巧 一.信息收集 信息收集这个多西当然都是老生常谈了,你收集的东西越多,能打的方向也就越多,当然,hw给你打的资源的格式一般为单位名称,系统…...

    2024/3/15 10:54:07
  13. 八.SpringCloud源码剖析-Eureka Server初始化流程

    系列文章目录 一.SpringCloud源码剖析-Eureka核心API 二.SpringCloud源码剖析-Eureka Client 初始化过程 三.SpringCloud源码剖析-Eureka服务注册 四.SpringCloud源码剖析-Eureka服务发现 五.SpringCloud源码剖析-Eureka Client服务续约 六.SpringCloud源码剖析-Eureka Client取…...

    2024/3/20 5:28:43
  14. div水平垂直居中的六种方法

    div水平垂直居中的六种方法在平时,我们经常会碰到让一个div框针对某个模块上下左右都居中(水平垂直居中),其实针对这种情况,我们有多种方法实现。方法一:绝对定位方法:不确定当前div的宽度和高度,采用 transform: translate(-50%,-50%); 当前div的父级添加相对定位(pos…...

    2024/3/15 10:54:03
  15. 关于搜索建议词的分析以及相应的优化方案

    1. 背景 不管是全文搜索引擎,还是垂直搜索系统中,当用户在搜索🔍输入框中输入几个字的时候,会自动下来一些词去自动补全用户可能要搜的词语,这部分的功能,我们称作搜索建议器的功能(英文叫做"suggest")。本文将介绍下目前主流的搜索建议器的做法,并且给出了…...

    2024/3/15 10:54:01
  16. AOP使用

    @Aspect @Component public class ServiceLogAspect {public static final Logger log =LoggerFactory.getLogger(ServiceLogAspect.class);/*** AOP 通知:* 1. 前置通知: 在方法调用之前进行执行* 2. 后置通知: 在方法正常调用之后执行* 3. 环绕通知: 在方法调用前后进行通…...

    2024/3/15 10:54:01
  17. 九月事务总结

    自从疫情之后,在家其实啥也没学,在农村也就觉得自己的生活也就这样了,想着大学上完找个人嫁了就行了,但是在家玩游戏总是有一种罪恶感,总是觉得自己少了点什么东西,好像是没有灵魂的躯壳,我家里学习的环境其实特别不好,根本没地方学习,妈妈老是叫我帮她忙,作饭,扫地…...

    2024/3/15 10:54:00
  18. 1. Java及JVM简介

    文章目录Java及JVM简介1. Java-跨平台的语言2. JVM-跨语言的平台3. 字节码4. 多语言混合编程5. Java发展的重大事件6. 虚拟机与Java虚拟机6.1 虚拟机6.2 Java虚拟机6.3 JVM的位置☆ Java及JVM简介如果我们把Java核心类库的 API 比做数学公式的话,那么Java虚拟机的知识就好比公…...

    2024/3/15 10:54:02
  19. Seata解析-TC处理全局事务和分支事务原理详解之分支状态报告请求和全局事务报告请求

    本文基于seata 1.3.0版本本文接文章《Seata解析-TC处理全局事务和分支事务原理详解之全局事务开启和分支事务注册》继续介绍TC对请求的处理。本文将介绍分支状态报告请求和全局事务报告请求。 文章目录一、分支状态报告请求二、全局事务报告请求1、提交全局事务2、回滚全局事务…...

    2024/3/15 10:53:59
  20. 整合thymeleaf+spring-security

    整合thymeleaf+spring-security 学习记录 thymeleaf+spring-security整合`thymeleaf+spring-security` 学习记录动态登陆状态跟据权限动态显示:我的`SecurityConfig` :报错:我的 `UserController`登陆页面(`login.html`)相关源码(`HttpSecurity.java`)的注释: <!--在pom.xml…...

    2024/3/15 10:53:56

最新文章

  1. 【前端Vue】社交信息头条项目完整笔记第2篇:二、登录注册,准备【附代码文档】

    社交媒体-信息头条项目完整开发笔记完整教程&#xff08;附代码资料&#xff09;主要内容讲述&#xff1a;一、项目初始化使用 Vue CLI 创建项目,加入 Git 版本管理,调整初始目录结构,导入图标素材,引入 Vant 组件库,移动端 REM 适配,关于 , 配置文件,封装请求模块。十、用户关…...

    2024/3/29 1:36:42
  2. 梯度消失和梯度爆炸的一些处理方法

    在这里是记录一下梯度消失或梯度爆炸的一些处理技巧。全当学习总结了如有错误还请留言&#xff0c;在此感激不尽。 权重和梯度的更新公式如下&#xff1a; w w − η ⋅ ∇ w w w - \eta \cdot \nabla w ww−η⋅∇w 个人通俗的理解梯度消失就是网络模型在反向求导的时候出…...

    2024/3/20 10:50:27
  3. Git 的 cherry-pick

    Git 的 cherry-pick 是一种将指定的提交&#xff08;commit&#xff09;应用到当前分支的操作。它可以帮助我们将某个分支上的某次提交复制到另一个分支上&#xff0c;而无需将整个分支合并过来。 通常&#xff0c;我们在使用 Git 进行版本控制时&#xff0c;会在不同的分支上…...

    2024/3/28 17:59:50
  4. day31|leetcode|C++|贪心|455.分发饼干|376. 摆动序列|53. 最大子数组和

    局部最优解&#xff0c;是一种感觉 455.分发饼干 链接&#xff1a;455. 分发饼干 thought&#xff1a; 如何让更多的孩子吃到合适的饼干呢&#xff0c;重排来实现局部最优&#xff0c;每次我们都挑出当前胃口最小的孩子&#xff0c;从小到大找饼干&#xff0c;只要满足就res…...

    2024/3/29 0:46:29
  5. 416. 分割等和子集问题(动态规划)

    题目 题解 class Solution:def canPartition(self, nums: List[int]) -> bool:# badcaseif not nums:return True# 不能被2整除if sum(nums) % 2 ! 0:return False# 状态定义&#xff1a;dp[i][j]表示当背包容量为j&#xff0c;用前i个物品是否正好可以将背包填满&#xff…...

    2024/3/28 16:59:55
  6. 【Java】ExcelWriter自适应宽度工具类(支持中文)

    工具类 import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.CellType; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet;/*** Excel工具类** author xiaoming* date 2023/11/17 10:40*/ public class ExcelUti…...

    2024/3/28 4:39:34
  7. Spring cloud负载均衡@LoadBalanced LoadBalancerClient

    LoadBalance vs Ribbon 由于Spring cloud2020之后移除了Ribbon&#xff0c;直接使用Spring Cloud LoadBalancer作为客户端负载均衡组件&#xff0c;我们讨论Spring负载均衡以Spring Cloud2020之后版本为主&#xff0c;学习Spring Cloud LoadBalance&#xff0c;暂不讨论Ribbon…...

    2024/3/28 5:03:31
  8. TSINGSEE青犀AI智能分析+视频监控工业园区周界安全防范方案

    一、背景需求分析 在工业产业园、化工园或生产制造园区中&#xff0c;周界防范意义重大&#xff0c;对园区的安全起到重要的作用。常规的安防方式是采用人员巡查&#xff0c;人力投入成本大而且效率低。周界一旦被破坏或入侵&#xff0c;会影响园区人员和资产安全&#xff0c;…...

    2024/3/28 19:59:46
  9. VB.net WebBrowser网页元素抓取分析方法

    在用WebBrowser编程实现网页操作自动化时&#xff0c;常要分析网页Html&#xff0c;例如网页在加载数据时&#xff0c;常会显示“系统处理中&#xff0c;请稍候..”&#xff0c;我们需要在数据加载完成后才能继续下一步操作&#xff0c;如何抓取这个信息的网页html元素变化&…...

    2024/3/28 21:57:52
  10. 【Objective-C】Objective-C汇总

    方法定义 参考&#xff1a;https://www.yiibai.com/objective_c/objective_c_functions.html Objective-C编程语言中方法定义的一般形式如下 - (return_type) method_name:( argumentType1 )argumentName1 joiningArgument2:( argumentType2 )argumentName2 ... joiningArgu…...

    2024/3/28 9:07:44
  11. 【洛谷算法题】P5713-洛谷团队系统【入门2分支结构】

    &#x1f468;‍&#x1f4bb;博客主页&#xff1a;花无缺 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! 本文由 花无缺 原创 收录于专栏 【洛谷算法题】 文章目录 【洛谷算法题】P5713-洛谷团队系统【入门2分支结构】&#x1f30f;题目描述&#x1f30f;输入格…...

    2024/3/28 18:09:48
  12. 【ES6.0】- 扩展运算符(...)

    【ES6.0】- 扩展运算符... 文章目录 【ES6.0】- 扩展运算符...一、概述二、拷贝数组对象三、合并操作四、参数传递五、数组去重六、字符串转字符数组七、NodeList转数组八、解构变量九、打印日志十、总结 一、概述 **扩展运算符(...)**允许一个表达式在期望多个参数&#xff0…...

    2024/3/28 21:57:50
  13. 摩根看好的前智能硬件头部品牌双11交易数据极度异常!——是模式创新还是饮鸩止渴?

    文 | 螳螂观察 作者 | 李燃 双11狂欢已落下帷幕&#xff0c;各大品牌纷纷晒出优异的成绩单&#xff0c;摩根士丹利投资的智能硬件头部品牌凯迪仕也不例外。然而有爆料称&#xff0c;在自媒体平台发布霸榜各大榜单喜讯的凯迪仕智能锁&#xff0c;多个平台数据都表现出极度异常…...

    2024/3/28 9:58:22
  14. Go语言常用命令详解(二)

    文章目录 前言常用命令go bug示例参数说明 go doc示例参数说明 go env示例 go fix示例 go fmt示例 go generate示例 总结写在最后 前言 接着上一篇继续介绍Go语言的常用命令 常用命令 以下是一些常用的Go命令&#xff0c;这些命令可以帮助您在Go开发中进行编译、测试、运行和…...

    2024/3/28 10:24:59
  15. 用欧拉路径判断图同构推出reverse合法性:1116T4

    http://cplusoj.com/d/senior/p/SS231116D 假设我们要把 a a a 变成 b b b&#xff0c;我们在 a i a_i ai​ 和 a i 1 a_{i1} ai1​ 之间连边&#xff0c; b b b 同理&#xff0c;则 a a a 能变成 b b b 的充要条件是两图 A , B A,B A,B 同构。 必要性显然&#xff0…...

    2024/3/28 19:51:36
  16. 【NGINX--1】基础知识

    1、在 Debian/Ubuntu 上安装 NGINX 在 Debian 或 Ubuntu 机器上安装 NGINX 开源版。 更新已配置源的软件包信息&#xff0c;并安装一些有助于配置官方 NGINX 软件包仓库的软件包&#xff1a; apt-get update apt install -y curl gnupg2 ca-certificates lsb-release debian-…...

    2024/3/28 19:36:32
  17. Hive默认分割符、存储格式与数据压缩

    目录 1、Hive默认分割符2、Hive存储格式3、Hive数据压缩 1、Hive默认分割符 Hive创建表时指定的行受限&#xff08;ROW FORMAT&#xff09;配置标准HQL为&#xff1a; ... ROW FORMAT DELIMITED FIELDS TERMINATED BY \u0001 COLLECTION ITEMS TERMINATED BY , MAP KEYS TERMI…...

    2024/3/28 17:15:47
  18. 【论文阅读】MAG:一种用于航天器遥测数据中有效异常检测的新方法

    文章目录 摘要1 引言2 问题描述3 拟议框架4 所提出方法的细节A.数据预处理B.变量相关分析C.MAG模型D.异常分数 5 实验A.数据集和性能指标B.实验设置与平台C.结果和比较 6 结论 摘要 异常检测是保证航天器稳定性的关键。在航天器运行过程中&#xff0c;传感器和控制器产生大量周…...

    2024/3/28 8:42:54
  19. --max-old-space-size=8192报错

    vue项目运行时&#xff0c;如果经常运行慢&#xff0c;崩溃停止服务&#xff0c;报如下错误 FATAL ERROR: CALL_AND_RETRY_LAST Allocation failed - JavaScript heap out of memory 因为在 Node 中&#xff0c;通过JavaScript使用内存时只能使用部分内存&#xff08;64位系统&…...

    2024/3/28 8:14:39
  20. 基于深度学习的恶意软件检测

    恶意软件是指恶意软件犯罪者用来感染个人计算机或整个组织的网络的软件。 它利用目标系统漏洞&#xff0c;例如可以被劫持的合法软件&#xff08;例如浏览器或 Web 应用程序插件&#xff09;中的错误。 恶意软件渗透可能会造成灾难性的后果&#xff0c;包括数据被盗、勒索或网…...

    2024/3/28 19:58:12
  21. JS原型对象prototype

    让我简单的为大家介绍一下原型对象prototype吧&#xff01; 使用原型实现方法共享 1.构造函数通过原型分配的函数是所有对象所 共享的。 2.JavaScript 规定&#xff0c;每一个构造函数都有一个 prototype 属性&#xff0c;指向另一个对象&#xff0c;所以我们也称为原型对象…...

    2024/3/28 21:57:45
  22. C++中只能有一个实例的单例类

    C中只能有一个实例的单例类 前面讨论的 President 类很不错&#xff0c;但存在一个缺陷&#xff1a;无法禁止通过实例化多个对象来创建多名总统&#xff1a; President One, Two, Three; 由于复制构造函数是私有的&#xff0c;其中每个对象都是不可复制的&#xff0c;但您的目…...

    2024/3/28 8:24:01
  23. python django 小程序图书借阅源码

    开发工具&#xff1a; PyCharm&#xff0c;mysql5.7&#xff0c;微信开发者工具 技术说明&#xff1a; python django html 小程序 功能介绍&#xff1a; 用户端&#xff1a; 登录注册&#xff08;含授权登录&#xff09; 首页显示搜索图书&#xff0c;轮播图&#xff0…...

    2024/3/28 5:29:22
  24. 电子学会C/C++编程等级考试2022年03月(一级)真题解析

    C/C++等级考试(1~8级)全部真题・点这里 第1题:双精度浮点数的输入输出 输入一个双精度浮点数,保留8位小数,输出这个浮点数。 时间限制:1000 内存限制:65536输入 只有一行,一个双精度浮点数。输出 一行,保留8位小数的浮点数。样例输入 3.1415926535798932样例输出 3.1…...

    2024/3/28 9:26:43
  25. 配置失败还原请勿关闭计算机,电脑开机屏幕上面显示,配置失败还原更改 请勿关闭计算机 开不了机 这个问题怎么办...

    解析如下&#xff1a;1、长按电脑电源键直至关机&#xff0c;然后再按一次电源健重启电脑&#xff0c;按F8健进入安全模式2、安全模式下进入Windows系统桌面后&#xff0c;按住“winR”打开运行窗口&#xff0c;输入“services.msc”打开服务设置3、在服务界面&#xff0c;选中…...

    2022/11/19 21:17:18
  26. 错误使用 reshape要执行 RESHAPE,请勿更改元素数目。

    %读入6幅图像&#xff08;每一幅图像的大小是564*564&#xff09; f1 imread(WashingtonDC_Band1_564.tif); subplot(3,2,1),imshow(f1); f2 imread(WashingtonDC_Band2_564.tif); subplot(3,2,2),imshow(f2); f3 imread(WashingtonDC_Band3_564.tif); subplot(3,2,3),imsho…...

    2022/11/19 21:17:16
  27. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机...

    win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”问题的解决方法在win7系统关机时如果有升级系统的或者其他需要会直接进入一个 等待界面&#xff0c;在等待界面中我们需要等待操作结束才能关机&#xff0c;虽然这比较麻烦&#xff0c;但是对系统进行配置和升级…...

    2022/11/19 21:17:15
  28. 台式电脑显示配置100%请勿关闭计算机,“准备配置windows 请勿关闭计算机”的解决方法...

    有不少用户在重装Win7系统或更新系统后会遇到“准备配置windows&#xff0c;请勿关闭计算机”的提示&#xff0c;要过很久才能进入系统&#xff0c;有的用户甚至几个小时也无法进入&#xff0c;下面就教大家这个问题的解决方法。第一种方法&#xff1a;我们首先在左下角的“开始…...

    2022/11/19 21:17:14
  29. win7 正在配置 请勿关闭计算机,怎么办Win7开机显示正在配置Windows Update请勿关机...

    置信有很多用户都跟小编一样遇到过这样的问题&#xff0c;电脑时发现开机屏幕显现“正在配置Windows Update&#xff0c;请勿关机”(如下图所示)&#xff0c;而且还需求等大约5分钟才干进入系统。这是怎样回事呢&#xff1f;一切都是正常操作的&#xff0c;为什么开时机呈现“正…...

    2022/11/19 21:17:13
  30. 准备配置windows 请勿关闭计算机 蓝屏,Win7开机总是出现提示“配置Windows请勿关机”...

    Win7系统开机启动时总是出现“配置Windows请勿关机”的提示&#xff0c;没过几秒后电脑自动重启&#xff0c;每次开机都这样无法进入系统&#xff0c;此时碰到这种现象的用户就可以使用以下5种方法解决问题。方法一&#xff1a;开机按下F8&#xff0c;在出现的Windows高级启动选…...

    2022/11/19 21:17:12
  31. 准备windows请勿关闭计算机要多久,windows10系统提示正在准备windows请勿关闭计算机怎么办...

    有不少windows10系统用户反映说碰到这样一个情况&#xff0c;就是电脑提示正在准备windows请勿关闭计算机&#xff0c;碰到这样的问题该怎么解决呢&#xff0c;现在小编就给大家分享一下windows10系统提示正在准备windows请勿关闭计算机的具体第一种方法&#xff1a;1、2、依次…...

    2022/11/19 21:17:11
  32. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”的解决方法...

    今天和大家分享一下win7系统重装了Win7旗舰版系统后&#xff0c;每次关机的时候桌面上都会显示一个“配置Windows Update的界面&#xff0c;提示请勿关闭计算机”&#xff0c;每次停留好几分钟才能正常关机&#xff0c;导致什么情况引起的呢&#xff1f;出现配置Windows Update…...

    2022/11/19 21:17:10
  33. 电脑桌面一直是清理请关闭计算机,windows7一直卡在清理 请勿关闭计算机-win7清理请勿关机,win7配置更新35%不动...

    只能是等着&#xff0c;别无他法。说是卡着如果你看硬盘灯应该在读写。如果从 Win 10 无法正常回滚&#xff0c;只能是考虑备份数据后重装系统了。解决来方案一&#xff1a;管理员运行cmd&#xff1a;net stop WuAuServcd %windir%ren SoftwareDistribution SDoldnet start WuA…...

    2022/11/19 21:17:09
  34. 计算机配置更新不起,电脑提示“配置Windows Update请勿关闭计算机”怎么办?

    原标题&#xff1a;电脑提示“配置Windows Update请勿关闭计算机”怎么办&#xff1f;win7系统中在开机与关闭的时候总是显示“配置windows update请勿关闭计算机”相信有不少朋友都曾遇到过一次两次还能忍但经常遇到就叫人感到心烦了遇到这种问题怎么办呢&#xff1f;一般的方…...

    2022/11/19 21:17:08
  35. 计算机正在配置无法关机,关机提示 windows7 正在配置windows 请勿关闭计算机 ,然后等了一晚上也没有关掉。现在电脑无法正常关机...

    关机提示 windows7 正在配置windows 请勿关闭计算机 &#xff0c;然后等了一晚上也没有关掉。现在电脑无法正常关机以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;关机提示 windows7 正在配…...

    2022/11/19 21:17:05
  36. 钉钉提示请勿通过开发者调试模式_钉钉请勿通过开发者调试模式是真的吗好不好用...

    钉钉请勿通过开发者调试模式是真的吗好不好用 更新时间:2020-04-20 22:24:19 浏览次数:729次 区域: 南阳 > 卧龙 列举网提醒您:为保障您的权益,请不要提前支付任何费用! 虚拟位置外设器!!轨迹模拟&虚拟位置外设神器 专业用于:钉钉,外勤365,红圈通,企业微信和…...

    2022/11/19 21:17:05
  37. 配置失败还原请勿关闭计算机怎么办,win7系统出现“配置windows update失败 还原更改 请勿关闭计算机”,长时间没反应,无法进入系统的解决方案...

    前几天班里有位学生电脑(windows 7系统)出问题了&#xff0c;具体表现是开机时一直停留在“配置windows update失败 还原更改 请勿关闭计算机”这个界面&#xff0c;长时间没反应&#xff0c;无法进入系统。这个问题原来帮其他同学也解决过&#xff0c;网上搜了不少资料&#x…...

    2022/11/19 21:17:04
  38. 一个电脑无法关闭计算机你应该怎么办,电脑显示“清理请勿关闭计算机”怎么办?...

    本文为你提供了3个有效解决电脑显示“清理请勿关闭计算机”问题的方法&#xff0c;并在最后教给你1种保护系统安全的好方法&#xff0c;一起来看看&#xff01;电脑出现“清理请勿关闭计算机”在Windows 7(SP1)和Windows Server 2008 R2 SP1中&#xff0c;添加了1个新功能在“磁…...

    2022/11/19 21:17:03
  39. 请勿关闭计算机还原更改要多久,电脑显示:配置windows更新失败,正在还原更改,请勿关闭计算机怎么办...

    许多用户在长期不使用电脑的时候&#xff0c;开启电脑发现电脑显示&#xff1a;配置windows更新失败&#xff0c;正在还原更改&#xff0c;请勿关闭计算机。。.这要怎么办呢&#xff1f;下面小编就带着大家一起看看吧&#xff01;如果能够正常进入系统&#xff0c;建议您暂时移…...

    2022/11/19 21:17:02
  40. 还原更改请勿关闭计算机 要多久,配置windows update失败 还原更改 请勿关闭计算机,电脑开机后一直显示以...

    配置windows update失败 还原更改 请勿关闭计算机&#xff0c;电脑开机后一直显示以以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;配置windows update失败 还原更改 请勿关闭计算机&#x…...

    2022/11/19 21:17:01
  41. 电脑配置中请勿关闭计算机怎么办,准备配置windows请勿关闭计算机一直显示怎么办【图解】...

    不知道大家有没有遇到过这样的一个问题&#xff0c;就是我们的win7系统在关机的时候&#xff0c;总是喜欢显示“准备配置windows&#xff0c;请勿关机”这样的一个页面&#xff0c;没有什么大碍&#xff0c;但是如果一直等着的话就要两个小时甚至更久都关不了机&#xff0c;非常…...

    2022/11/19 21:17:00
  42. 正在准备配置请勿关闭计算机,正在准备配置windows请勿关闭计算机时间长了解决教程...

    当电脑出现正在准备配置windows请勿关闭计算机时&#xff0c;一般是您正对windows进行升级&#xff0c;但是这个要是长时间没有反应&#xff0c;我们不能再傻等下去了。可能是电脑出了别的问题了&#xff0c;来看看教程的说法。正在准备配置windows请勿关闭计算机时间长了方法一…...

    2022/11/19 21:16:59
  43. 配置失败还原请勿关闭计算机,配置Windows Update失败,还原更改请勿关闭计算机...

    我们使用电脑的过程中有时会遇到这种情况&#xff0c;当我们打开电脑之后&#xff0c;发现一直停留在一个界面&#xff1a;“配置Windows Update失败&#xff0c;还原更改请勿关闭计算机”&#xff0c;等了许久还是无法进入系统。如果我们遇到此类问题应该如何解决呢&#xff0…...

    2022/11/19 21:16:58
  44. 如何在iPhone上关闭“请勿打扰”

    Apple’s “Do Not Disturb While Driving” is a potentially lifesaving iPhone feature, but it doesn’t always turn on automatically at the appropriate time. For example, you might be a passenger in a moving car, but your iPhone may think you’re the one dri…...

    2022/11/19 21:16:57