文章目录

    • Log
  • 一、确定执行的优先级(Prioritizing what to work on: Spam classification example)
    • 1. 垃圾邮件分类器的建立
    • 2. 可能会遇到的问题以及解决方案
  • 二、误差分析(Error analysis)
    • 1. 推荐的方法
    • 2. 误差分析
    • 3. 数值估计(numerical evaluation)
  • 三、不对称性分类的误差评估(Error metrics for skewed class)
    • 1. 癌症分类问题(偏斜类)
    • 2. 查准率和召回率
  • 四、查准率和召回率的权衡(Trading off precision and recall)
    • 1. 查准率和召回率与临界值的关系
    • 2. 查准率和召回率的结合方式
      • ①平均值
      • ②F 值
  • 五、机器学习数据(Data for machine learning)
    • 1. 一项过去的研究
    • 2. 假设的解释(庞大的训练集和含有很多参数的算法)
  • 总结


Log

2022.01.29继续学习第十一章,稍微提提速
2022.01.30今天效率不大行,明天争取弄完
2022.02.04结束第十一章


一、确定执行的优先级(Prioritizing what to work on: Spam classification example)

  • 本篇文章将会介绍机器学习系统设计时所面临的主要问题,以及在如何制定一个复杂的机器学习系统方面给出的一些建议(以免在下一章内容的学习过程中产生脱节,因为会涉及到设计复杂学习系统时可能遇到的一系列不同的问题),这些知识在构建大型机器学习系统时,会让我们节约大量的时间。
  • 首先要讲的是在实际工作过程中应该优先处理哪些事情,将以一个垃圾邮件分类的例子来开始本节内容。

1. 垃圾邮件分类器的建立

  • 假如想要建立一个垃圾邮件分类器,下面是一对垃圾和非垃圾邮件的例子:
    在这里插入图片描述

  • 垃圾邮件(上图左)会想向你推销东西,发邮件的人会故意拼错一些单词,比如 Med1cine 和 M0rtages;正常的邮件则如右图所示。

  • 假设垃圾邮件的训练集已经有了用数字表示的分类标签,对于垃圾邮件或非垃圾邮件,用 y=1 或 y=0 来表示。

  • 那么如何通过监督学习的方法来构造一个分类器,来区分垃圾邮件和非垃圾邮件?

  • 为了应用监督学习,首先要想的是如何来表示邮件的特征向量 x,通过特征向量 x 和分类标签 y 就能训练一个分类器,比如使用逻辑回归的方法。

  • 下面是一个选择邮件的特征向量的方法:

  • 可以提出一个可能含100个单词的列表,通过这些单词来区分垃圾邮件或非垃圾邮件。例如,如果一封邮件的片段包含单词 deal、buy、discount,那么它就很有可能是一封垃圾邮件;如果包含接收者的姓名(意味着写邮件的人知道对方是谁)或者单词 now (经常在一些紧急邮件中出现),那么这份邮件就很可能不是垃圾邮件。
    在这里插入图片描述

  • 假如有一封邮件(上图),可以将这封邮件的各个片段编码成如下的一个特征变量,列出之前找到的100个单词,然后按照字典序排序,得到了一张单词表,定义一个特征变量x 来表示,单词表中的单词是否在该邮件中出现。
    x=[0(andrew)1(buy)1(deal)0(discount)...1(now)...]x∈R100\begin{aligned} x=\left[\begin{matrix} \quad0&(andrew)\\ \quad1&(buy)\\ \quad1&(deal)\\ \quad0&(discount)\\ \quad...\\ \quad1&(now)\\ \quad... \end{matrix}\right]\qquad x\in\R^{100} \end{aligned} x=0110...1...(andrew)(buy)(deal)(discount)(now)xR100

  • 注意单词是否出现用0和1来表示,单词出现多次也用一表示(只统计单词是否出现,而不统计出现的次数)。
    xj={1ifwordjappearsinemail0otherwise\begin{aligned} x_j=\begin{cases} 1 \qquad if\ \ word\ \ j\ \ appears\ \ in\ \ email\\ 0\qquad otherwise \end{cases} \end{aligned} xj={1if  word  j  appears  in  email0otherwise

  • 虽然选取了 100 个单词来描述刚才的过程,但实际工作中普遍的做法是,在训练集中挑选出出现频率最多的 n 个单词(n 一般在 10000 到 50000 之间),然后将它们作为特征向量,并且用他们来表示邮件,对其进行分类。

2. 可能会遇到的问题以及解决方案

  • 在建立一个垃圾邮件分类器的过程中,会遇到的一个问题就是如何在有限的时间下让垃圾邮件分类器具有高精准度和低错误率。
    Howtospendyourtimetomakeithavelowerror?−CollectlotsofdataE.g.“honeypot”project.−Developsophisticatedfeaturesbasedonemailroutinginformation(fromemailheader).−Developsophisticatedfeaturesformessagebodye.g.should“discount”and“discounts”betreatedasthesameword?Howabout“deal”and“Dealer”?Featuresaboutpunctuation?−Developsophisticatedalgorithmtodetectmisspellingse.g.m0rtgage,med1cine,w4tches.\begin{aligned} &\textbf{How\ \ to\ \ spend\ \ your\ \ time\ \ to\ \ make\ \ it\ \ have\ \ low\ \ error?}\\ &\qquad-\textbf{Collect\ \ lots\ \ of\ \ data}\\ &\qquad\quad E.g.\ \ “honeypot”\ \ project.\\ &\qquad-\textbf{Develop\ \ sophisticated\ \ features\ \ based\ \ on\ \ email\ \ routing information}\ \ ( from\ \ email\ \ header).\\ &\qquad-\textbf{Develop\ \ sophisticated\ \ features\ \ for\ \ message\ \ body}\\ &\qquad\quad e.g.\ \ should\ \ “discount”\ \ and\ \ “discounts”\ \ be\ \ treated\ \ as\ \ the\ \ same\ \ word?\ \ \\ &\qquad\ \ \ \ \qquad How\ \ about\ \ “deal”\ \ and\ \ “Dealer”?\ \ Features\ \ about\ \ punctuation?\ \ \\ &\qquad-\textbf{Develop\ \ sophisticated\ \ algorithm\ \ to\ \ detect\ \ misspellings}\\ &\qquad\quad e.g.\ \ m0rtgage,\ \ med1cine,\ \ w4tches. \end{aligned} How  to  spend  your  time  to  make  it  have  low  error?Collect  lots  of  dataE.g.  honeypot  project.Develop   sophisticated   features   based   on   email   routing information  (from  email  header).Develop   sophisticated   features   for   message   bodye.g.  should  discount  and  discounts  be  treated  as  the  same  word?      How  about  deal  and  Dealer?  Features  about  punctuation?  Develop   sophisticated   algorithm   to   detect   misspellingse.g.  m0rtgage,  med1cine,  w4tches.
  1. 收集大量的数据:
    确实有一种倾向,认为数据收集的越多,算法就会越准确。事实上在垃圾邮件领域就有一个很严肃的项目叫做honey pot项目,这个项目通过创建虚假的邮箱地址,然后故意将这些地址暴露给垃圾邮件的发送者,以此来收集大量的垃圾邮件,然后得到大量的垃圾邮件数据来训练分类算法。根据之前学到的内容,可以知道大量的数据可能会有帮助,但绝大多数时候不管用。

  2. 用更复杂的特征变量:
    比如将发件人的信息包括其中,这种信息通常会出现在邮件的标题中,所以发送者发送垃圾邮件时,他们通常会去掩盖这封邮件的来源,还可能使用虚假的邮件标题,或者通过很奇怪的计算机服务器或者很奇怪的途径来向你发送垃圾邮件,而通过邮件的标题可以反馈出这种信息,所以可以通过邮件的标题来构造一个更加复杂的特征来捕捉到这封邮件的来源信息,并以此判断邮件是否是垃圾邮件。

  3. 关注邮件的主体部分:
    例如单词 discount 和 discounts 应该被视作同一个单词,或者把 deal 和 dealer 视作同一个单词,甚至还可以关注首字母的大小写或者,通过标点符号来构建复杂的特征,因为垃圾邮件一般会使用很多感叹号(但是也不一定)。

  4. 设计更复杂的算法检测拼写错误:
    通过设计更复杂的算法来检测单词中的拼写错误,例如:m0rtgage、 med1cine、 w4tch。因为垃圾邮件发送者的确会这么做来躲避检测,这样可以导致前面提到的简单的方法,无法把看作是一个单词,所以就很难识别出垃圾邮件中故意拼错的单词(对于中文的话我发现存在一些用谐音字来替换原有字句的现象,所以这种方法还是具有一定的使用价值的)。

二、误差分析(Error analysis)

  • 主要内容: 介绍误差分析的概念,帮助我们更系统的在众多方法中作出选择。误差分析以及设定误差度量值的重要性(设定某个实数来评估学习算法并衡量它的表现)

1. 推荐的方法

  1. 通过一个简单的算法来快速的实现目标
    在研发机器学习产品或者开发机器学习应用时,通常来说,最好的办法不是建立一个很复杂的,有许多复杂特征的系统,而是通过一个简单的算法来快速的实现它(即使这个速成的东西并不是很完美),然后通过交叉验证来测试数据
  2. 画出相应的学习曲线来帮助我们进行之后的判断
    通过画出学习曲线以及检验误差来找出算法是否存在高偏差或者高方差的问题,或者一些其他问题,在做出这些分析之后,再来决定是否使用更多的数据或特征等等。
    这种方法在刚开始解决一个机器学习问题时,能起到很好的作用,因为你并不能预知是需要更多的特征,还是需要更多的数据,或是别的东西,在缺乏各种证据的情况下,很难提前知道应该把时间花在哪些地方。所以很多时候应当先进行一次简单快速的实现,然后画出学习曲线来帮助我们进行之后的判断,避免在编程过程中出现过早优化(premature optimization) 的问题,这种思想告诉我们应当用实际的证据来指导我们的决策,而不是仅凭直觉
  3. 误差分析
    当实现比如一个垃圾邮件分类器的时候,应当经常观察交叉验证集的情况,然后看一看那些被算法错误分类的文件。通过查看这些被错误分类的垃圾邮件和非垃圾邮件分析经常被错误分类的邮件有什么共同的特征和规律。这样做多了以后,这个过程就会启发你应该怎样设计新的特征,或者告诉你现在的系统有什么优点和缺点,然后指导你想出办法来改进它,下面将会举出一个具体的例子来进行说明。

2. 误差分析

  • 主要内容: 通过手动去检查算法所出现的失误,来引导我们走上最有成效的道路。

  • 假设在做一个垃圾邮件分类器,在交叉验证集中有 500 个样本。

  • 假如该算法有很高的错误率,错误分类了 100 个交叉验证样本,接下来要做的就是手动核查这 100 个错误,然后手工为它们分类。

  • 同时要考虑这些邮件是什么类型的邮件:有什么线索或者特征,能够帮助算法正确的进行分类。

  • 得到如下的分类及数量:
    Pharma(卖药):12Replica/fake(卖假货):4Stealpasswords(钓鱼邮件):53Other:31\begin{aligned} &Pharma\ (卖药):&12\\ &Replica/fake\ (卖假货):&4\\ &Steal\ \ passwords\ (钓鱼邮件):&53\\ &Other:&31 \end{aligned} Pharma ():Replica/fake ():Steal  passwords ():Other:1245331

  • 发现算法在判断钓鱼邮件的时候表现的很差,说明应该花更多的时间仔细研究这类邮件,看看是否可以想到更好的特征来为他们正确分类,同时看看有什么线索或者额外的特征能帮助算法识别这种邮件。

  • 假设能帮助我们能更好地进行分类的一些方法或者特征是检查故意的拼写错误奇怪的邮件来源以及垃圾邮件特有的标点方式

  • 从交叉验证集中手工分类后得到的结果如下:
    Deliberatemisspellings:5Unusualemailrouting:16Unusual(spamming)punctuation:32\begin{aligned} &Deliberate\ \ misspellings:&5\\ &Unusual\ \ email\ \ routing:&16\\ &Unusual\ (spamming)\ \ punctuation:&32 \end{aligned} Deliberate  misspellings:Unusual  email  routing:Unusual (spamming)  punctuation:51632

  • 上面的结果说明故意拼写错误的现象在错误样本中很少出现,所以不值得花时间去编写算法来识别它;很多垃圾邮件都有奇怪的标点方式,是一个很明显的信号,说明值得花时间去构造一些更加复杂的、基于标点符号的特征。

  • 总结: 真正要做的事是找出这种算法最难以分类的样本,对于不同的算法,不同的学习算法而言,对他们造成的困难的样本总是相似的。通过一个简单粗暴的算法的实现,可以很快地找到算法的不足所在和难以处理的样本类型,然后集中精力放在他们身上。

3. 数值估计(numerical evaluation)

  • 在改进学习算法时,另一个技巧是保证自己对学习算法有一种数值估计的方法,也就是说,当改进学习算法的时候,如果算法能够返回一个数值评价指标来估计算法执行的效果,将会很有帮助。

  • 假如正在决定是否应该将以下几个单词视作同一个单词,这样做的一种方法就是只看一个单词中的前几个英文字母,发现这些单词大体上有着相似的意思:
    discount‾discount‾sdiscount‾eddiscount‾ing\begin{aligned} &\underline{discount}\\ &\underline{discount}s\\ &\underline{discount}ed\\ &\underline{discount}ing\\ \end{aligned} discountdiscountsdiscounteddiscounting

  • 在一自然语言处理中,这种方法是通过一种词干提取软件实现的,可以参考 Porter Stemmer 、fasttext 。

  • 但是这种词干提取软件只会简单的检查单词的前几个字母,这样的方式也有坏的一面,例如这个软件可能把 universe 和 university 看成是一个单词,因为这两个单词的开头字母都非常相似。

  • 因此,在决定要不要使用这样的软件来进行垃圾邮件分类,就很难做出抉择,即使是进行误差分析,可能也无法帮助我们去决定进行词干提取到底是不是一个好主意。而如果要判断此类提取软件是否对我们的分类器有益,最好的方法是用最快的方式来尝试使用一下他,然后看他能否起到效果。
    Withoutstemming:5.0%errorWithstemming:3.0%errorDistinguishupper/lowercase:3.2%error\begin{aligned} &Without\ \ stemming:&5.0\%\ \ error\\ &With\ \ stemming:&3.0\%\ \ error\\ &Distinguish\ \ upper/lower\ \ case:&3.2\%\ \ error\\ \end{aligned} Without  stemming:With  stemming:Distinguish  upper/lower  case:5.0%  error3.0%  error3.2%  error

  • 如果通过数值方法的评估算法的效果将会非常有用。也许最容易想到的方法是通过交叉验证在使用和不使用词干提取时各自的错误率来估计算法的效果。
    如果没有使用词干提取,最后得到的结果有 5% 的分类错误率,再使用词干提取并重新运行,算法得到了比如 3% 的错误率,错误率的减少能让你很快的判断出使用词干提取其实是一个好主意。
    对这个特定的问题,这个很自然的单一规则的数值评价指标.(single rule number evaluation metric),就叫做交叉验证错误率(the cross validation error)

  • 在之后,这种带有数值评价指标的例子还需要进行一些其他的处理,将会在之后的内容中介绍到。

  • 再说一个例子,决定是否应该区分单词的大小写,比如 Mom 和 mom,应该把他们看成一个单词,还是不同的单词(他们应该被视作相同的特征,还是不同的特征)。如果不区分大小写,最后得到 3.2% 的错误率,要比之前的错误率更高,于是我们就能很快地决定不应该区分大小写。

  • 当改进学习算法时,总是要去尝试很多新主意和新版本的算法,如果你每次都手动地去检测这些例子,看表现的好不好,会让你很难决定到底应不应该使用词干提取、该不该区分大小写。
    但是通过一个单一规则的数值评价,可以观察误差率是变大了还是变小了,通过它更快地实践新想法,它能直接表明我们的想法能提高还是降低学习算法的表现,这会大大加速我们的进程。

  • 所以强烈推荐在交叉验证集上来做误差分析,而不是在测试集上(从数学的角度用测试集来做是有问题的)。

  • 总结: 刚开始研究一个新的机器学习问题时,应该先实现一个简单粗暴(尽管效果不一定好)的学习算法。一旦有了一个初始的算法实现,我们就能使用一个强有力的工具来决定下一步应该如何做。
    第一步,看看它所造成的错误,通过误差分析来看看它出现了什么失误,然后以此决定之后的优化方法;
    第二步,在已经有了一个简单粗暴的算法实现,又有一个素质评价指标的基础上,可以进一步利用这些来试验新的想法,快速发现这些想法是否能够提高算法的表现,从而更快地决定我们的算法应该放弃什么,应该包含什么。

三、不对称性分类的误差评估(Error metrics for skewed class)

  • 有了算法的评估和误差度量值,还需要注意使用一个合适的误差度量值,这会对学习算法产生非常微妙的影响,也就是偏斜类(skewed class) 的问题。

1. 癌症分类问题(偏斜类)

  • 我们拥有内科病人的特征变量,希望知道他们是否有癌症(就像恶性与良性肿瘤的分类问题一样)
    Trainlogisticregressionmodehθ(x)y={1ifcancer0otherwiseFindthatyougot1%errorontestset.(99%correctdiagnoses)\begin{aligned} &Train\ \ logistic\ \ regression\ \ mode\ \ h_\theta(x)\\ &y=\begin{cases} &1\qquad if\ \ cancer\\ &0\qquad otherwise\\ \end{cases}\\ &Find\ \ that\ \ you\ \ got\ \ 1\%\ \ error\ \ on\ \ test\ \ set.\\ &\qquad\qquad\qquad\qquad(99\%\ \ correct\ \ diagnoses)\ \ \end{aligned} Train  logistic  regression  mode  hθ(x)y={1if  cancer0otherwiseFind  that  you  got  1%  error  on  test  set.(99%  correct  diagnoses)  
  • 训练逻辑回归模型,用测试集检验模型,发现只有 1% 的错误(99% 会做出正确诊断)。这个结果看起来不错,但是假如在测试集中只有 0.5% 的患者得了癌症, 1% 的错误率就显得没有那么好了。
  • 下面的一个非机器学习算法让预测值恒为 0,将会得到 0.5% 的错误率,甚至比 1% 的错误率都要好:
function y = predictCancer(x) y = 0; %ignore x! 
return
  • 这种情况发生在正例和负例的比率非常接近于一个极端情况,正样本的数量相比于负样本的数量非常非常少,这种情况被叫做偏斜类(skewed class)
  • 因此使用分类误差或者分类精确度来作为评估可能会产生如下问题:
  • 算法精确度的提升不一定能正确反应分类模型的质量是否提升,当我们遇到这样一个偏斜类时,我们希望有一个不同的误差度量值或者不同的评估度量值,其中一种评估度量值叫做查准率和召回率(precision and recall)

2. 查准率和召回率

  • 假设有一个二分(二元分类)问题,用测试集来评估一个分类模型,对于测试集中的样本,每个样本的实际值都会等于 0 或 1,学习算法会为测试集中的每一个实例做出预测,预测值也是等于 0 或 1。
    y=1inpresenceofrareclassthatwewanttodetect\begin{aligned} y=1\ \ in\ \ presence\ \ of\ \ rare\ \ class\ \ that\ \ we\ \ want\ \ to\ \ detect\ \ \end{aligned} y=1  in  presence  of  rare  class  that  we  want  to  detect  

在这里插入图片描述

  • 实际类与预测类的值均为 1 ,把这个样本叫做真阳性(true positive)

  • 实际类与预测类的值均为 0 ,把这个样本叫做真阴性(true negative)

  • 学习算法预测为 1 ,但实际上等于 0 ,叫做假阳性(false positive)

  • 学习算法预测为 0 ,但实际上等于 1 ,叫做假阴性(false negative)

  • 现在就有了另一种方式来评估算法的表现,需要计算两个数字:

  1. 查准率(precision)
    所有预测的患有癌症的病人有多大比例的病人是真正患有癌症的。
    一个分类模型的查准率,等于真阳性除以所有预测为阳性的数量:
    Precision=Truepositives#predictedpositive=TruepositivesTruepos+Falsepos\begin{aligned} Precision=\frac{True\ \ positives}{\#predicted\ \ positive}=\frac{True\ \ positives}{True\ \ pos\ +\ \red{False\ \ pos}} \end{aligned} Precision=#predicted  positiveTrue  positives=True  pos + False  posTrue  positives
    查准率越高越好。
  2. 召回率(recall)
    确实患有癌症中有多少可以正确预测为患有癌症。
    一个分类模型的召回率,等于真阳性除以所有实际为阳性的数量:
    Recall=Truepositives#actualpositive=TruepositivesTruepos+Falseneg\begin{aligned} Recall=\frac{True\ \ positives}{\#actual\ \ positive}=\frac{True\ \ positives}{True\ \ pos\ +\ \red{False\ \ neg}} \end{aligned} Recall=#actual  positiveTrue  positives=True  pos + False  negTrue  positives
    同样地,召回率也是越高越好。
  • 通过计算查准率和召回率可以更好地判断分类模型到底好不好。如果一个算法总是预测 y=0(病人无病),那么它的召回率就为 0 ,因为他不会有真阳性,因此不是一个好的模型。对于偏斜类问题,算法也不能够欺骗我们,仅仅通过测试 y 总是等于 0(或者 y 总是等于一),他没有办法得到高的查准率和高的召回率。因此,能够更肯定拥有高查准率和高召回率的模型是一个好的分类模型,这也给了我们更好直接更直接的方法来评估模型的好坏。
  • 在核查准率和召回率的定义中,总是习惯性地用 y=1 作为某种希望检测的出现较少的类。

四、查准率和召回率的权衡(Trading off precision and recall)

  • 主要内容: 如何保持查准率和召回率的相对平衡,以及二者作为算法评估度量值的更有效的方式。

1. 查准率和召回率与临界值的关系

  • 仍然以癌症预测为例:
    Logisticregression:0≤hθ(x)≤1Predict1ifhθ(x)≥0.5Predict0ifhθ(x)<0.5\begin{aligned} &Logistic\ \ regression:\ \ 0\le h_\theta(x)\le 1\\ &Predict\ \ 1\ \ if\ \ h_\theta(x)\ge 0.5\\ &Predict\ \ 0\ \ if\ \ h_\theta(x)< 0.5\\ \end{aligned} Logistic  regression:  0hθ(x)1Predict  1  if  hθ(x)0.5Predict  0  if  hθ(x)<0.5
  • 如果想要在十分肯定的情况下才预测 y=1(患有癌症),避免误诊导致病人承受治疗的痛苦,那么就应该提高临界值(threshold)(比如 0.7、0.9),此时查准率会提高,召回率会降低
  • 如果想要避免没能预测出患有癌症的病人(避免负阴性),就应该降低临界值,后续对预测出的病人进行进一步的检查,此时召回率会提高,查准率会降低
  • 对于大多数的回归模型,需要权衡查准率和召回率,当改变临界值时,可以得到如下的曲线(注:曲线图像不唯一,取决于回归模型的具体算法):
    在这里插入图片描述

2. 查准率和召回率的结合方式

  • 那么能否自动选取临界值呢?或者说有不同的想法或算法,如何比较不同的查准率和召回率呢?

  • 假设有三个临界值不同的算法:
    在这里插入图片描述

  • 希望可以通过一个评估度量值来决定算法的好坏。

①平均值

  • 很容易可以想到通过计算召回率和查准率二者的平均值来对模型进行评估,通过数据不难看出算法 3 的平均值最高,但是查准率很低召回率为 1 代表它是恒预测 y=1 的,显然不是一个好的算法,因此这一标准不可行。

②F 值

  • 下面是一个结合查准率和召回率的另一种方式叫做 F 值(F Score),公式如下:
    F1Score=2PRP+R\begin{aligned} F_1Score=2\frac{PR}{P+R} \end{aligned} F1Score=2P+RPR
  • 通过表格中 F 值的数据最终选择算法 1。
  • F 值也叫 F1 值,一般都叫 F 值,但是写的时候写 F1 值。它结合了查准率合召回率,同时给较低值更高的权重。这个称呼实际上没有什么也别的含义,计算的内容实际上就是调和平均数。
  • 对于不同的取值,计算结果如下:
    P=0orR=0⟹F1Score=0P=1andR=1⟹F1Score=1\begin{aligned} &P=0\ \quad or\ \ &R=0\ \ &\Longrightarrow\ \ &F_1\ Score = 0\\ &P=1\ \quad and\ \ &R=1\ \ &\Longrightarrow\ \ &F_1\ Score = 1\\ \end{aligned} P=0 or  P=1 and  R=0  R=1      F1 Score=0F1 Score=1

五、机器学习数据(Data for machine learning)

  • 之前讲过不要盲目地开始花大量的时间来收集大量的数据,因为大量的数据只在一些情况下起作用。在一定条件下,得到大量数据并在某种类型的学习算法中进行训练可以是一种有效的方法来获得一个具有良好性能的学习算法(需要条件成立且有大量数据),下面将会介绍到。

1. 一项过去的研究

  • 两位研究人员 Michele Banko 和 Eric Brill 在研究·使用不同的学习算法的效果·与·将这些效果使用到不同训练数据集上·两者的比较时,考虑这样一个问题,如何在易混淆的词之间进行分类(2001)。于是他们把诸如这样的机器学习问题当做一类监督学习问题并尝试将其分类(什么样的词在一个英文句子的特定位置才是合适的)。他们使用了如下的方法:
    Algorithms−Perceptron(Logisticregression)−Winnow−Memory−based−Naı¨veBayes\begin{aligned} &Algorithms\\ &\qquad-Perceptron\ \ (Logistic\ \ regression)\\ &\qquad-Winnow\\ &\qquad-Memory-based\\ &\qquad-Naïve\ \ Bayes\\ \end{aligned} AlgorithmsPerceptron  (Logistic  regression)WinnowMemorybasedNaı¨ve  Bayes
  1. 感知器(Perceptron)
    一个用于逻辑回归上的方差
  2. Winnow 算法
    一个很厉害但是现在用的比较少的算法,类似于回归问题,但是在方法上又有一些不同
  3. 基于内存的算法(Memory-based)
    也是现在用的比较少了,后面也会介绍到
  4. 朴素贝叶斯算法(Naïve Bayes)
    同样也是后面会学到
  • 具体算法并不重要,他们做的就是改变了训练数据集的大小,并尝试将这些学习算法用于不同大小的训练数据集中,下图为他们得到的结果。
    在这里插入图片描述

  • 趋势非常明显:

    • 首先,大部分外部空间都具有相似的性能
    • 其次,随着训练数据集的增大(在横轴上代表数以百万计大小的训练集从成百上千到成千上万),这些算法的性能也都对应增强了
  • 事实上,如果选择任意一个算法,可能是选择了一个劣质的算法,如果给这个劣质算法更多的数据,那么从这些例子中看起来的话,他很有可能会比其他算法(甚至是优质算法)更好。

  • 由于这些原始的研究非常具有影响力,因此已经有一系列许多不同的研究显示了类似的结果,表明许多不同的学习算法有时倾向于依赖一些细节,并表现出相当相似的性能。但是真正提高性能的是能够给予一个算法大量的训练数据。

  • 像这样的一种结果引起了在机器学习中一种常见的说法:
    “It’snotwhohasthebestalgorithmthatwins.It’swhohasthemostdata.”\begin{aligned} &\textbf{“It’s\ \ not\ \ who\ \ has\ \ the\ \ best\ \ algorithm\ \ that\ \ wins.}\\ &\qquad\qquad \textbf{It’s\ \ who\ \ has\ \ the\ \ most\ \ data.”}\ \ \end{aligned} “It’s  not  who  has  the  best  algorithm  that  wins.It’s  who  has  the  most  data.”  

  • “并不是拥有最好算法的人能成功,而是拥有最多数据的人能成功”。

  • 那么这种情况何时为真,何时为假?因为有一个算法,这种算法在这种情况下是真的,那么得到的大量数据通常保证我们具有一个高性能算法的最佳方式,而不是去争辩使用什么样的算法。

2. 假设的解释(庞大的训练集和含有很多参数的算法)

  • 假如我们有一些含有大量我们认为有用的训练集的假设,特征值 x 包含了足够的信息用来准确地预测 y。
  • 例如前面的容易混淆的问题,句子中包含了足够的信息来帮助我们预测结果是 two 而不是 to 或 too;反例就是预测房价时只给出房子大小,而不给出房子所处的地段或是房间数量装修情况等其他特征,那么就无法预测出正确的房价。
    Assumefeaturex∈Rn+1hassufficientinformationtopredictyaccurately.Example:ForbreakfastIatetwo‾eggs.Counterexample:Predicthousingpricefromonlysize(feet2)andnootherfeatures.\begin{aligned} &Assume\ \ feature\ \ x \in \R^{n+1}\ \ has\ \ sufficient\ \ information\ \ to\\ &predict\ \ y\ \ accurately.\\\ \\ &\textbf{Example:}\ \ For\ \ breakfast\ \ I\ \ ate\ \ \underline{two}\ \ eggs.\\ &\textbf{Counterexample:}\ \ Predict\ \ housing\ \ price\ \ from\ \ only\ \ size\\ &(feet^2)\ \ and\ \ no\ \ other\ \ features.\\ \end{aligned}  Assume  feature  xRn+1  has  sufficient  information  topredict  y  accurately.Example:  For  breakfast  I  ate  two  eggs.Counterexample:  Predict  housing  price  from  only  size(feet2)  and  no  other  features.
  • 一个有用的方法:给定一个输入特征向量 x ,也给定了相同的可用的信息和学习算法,如果去人类专家这个领域,一个人类专家能够准确或自信地预测出 y 治值吗?
  • 例如上面的第一个例子,如果找一个说英语的人类专家,那么他就可能预测债这种情况下会说什么;与此相反,如果找一个价格上的专家(可能是一个房地产经纪人专家),如果只告诉他们一个房子的大小并告诉他们房子的价格,那么即使是房价评估或售房方面的专家他也不能告诉我们房子预测的价格。

Usefultest:Giventheinput,canahumanexpertconfidentlypredict?\begin{aligned} &\textbf{Useful\ \ test:}\ \ Given\ \ the\ \ input,\ \ can\ \ a\ \ human\ \ expert\\ &confidently\ \ predict\ \ ?\\ \end{aligned} Useful  test:  Given  the  input,  can  a  human  expertconfidently  predict  ?

  • 如果上面的假设是成立的,那么当有大量的数据时是有帮助的。
  • 假设特征值有足够的信息来预测 y 值,假设使用一种需要大量参数的学习算法(也许是有很多特征值的逻辑回归或线性回归,或是经常使用的利用许多隐藏单元的神经网络),这些参数可以拟合非常复杂的函数。
  • 把这些算法当成低偏差算法(low-bias algorithm),因为能够拟合非常复杂的函数,可以很好地拟合训练集,训练误差就会很低
    Usealearningalgorithmwithmanyparameterse.g.logisticregression/linearregressionwithmanyfeatures;neuralnetworkwithmanyhiddenunits.⟹Jtrain(θ)willbesmall.\begin{aligned} &\textbf{Use\ \ a\ \ learning\ \ algorithm\ \ with\ \ many\ \ parameters}\\ &e.g.\ \ logistic\ \ regression/linear\ \ regression\ \ with\ \ many\ \ features;\\ &neural\ \ network\ \ with\ \ many\ \ hidden\ \ units.\\\ \\ &\Longrightarrow J_{train}(\theta)\ \ will\ \ be\ \ small. \end{aligned}  Use  a  learning  algorithm  with  many  parameterse.g.  logistic  regression/linear  regression  with  many  features;neural  network  with  many  hidden  units.Jtrain(θ)  will  be  small.
  • 假设使用了非常大的训练集,尽管希望有很多参数,但是如果训练集比参数的数量更多,那么这些算法就不大容易出现过拟合,也就是说训练误差可能接近测试误差
    Useaverylargetrainingset(unlikelytooverfit)⟹Jtrain(θ)≈Jtest(θ)\begin{aligned} &\textbf{Use\ \ a\ \ very\ \ large\ \ training\ \ set}\ \ (unlikely\ \ to\ \ overfit)\\\ \\ &\Longrightarrow J_{train}(\theta)\approx J_{test}(\theta) \end{aligned}  Use  a  very  large  training  set  (unlikely  to  overfit)Jtrain(θ)Jtest(θ)
  • 最后由训练误差很低,且训练误差接近测试误差,可以推出测试集的误差也很小。
    ⟹Jtest(θ)willbesmall.\begin{aligned} &\Longrightarrow J_{test}(\theta)\ \ will\ \ be\ \ small. \end{aligned} Jtest(θ)  will  be  small.
  • 从另一个角度来说,这样做是为了有一个高性能的学习算法,并且希望不要有高的偏差和方差。因此,偏差问题通过确保有一个具有很多参数的学习算法来保证(以便我们能够得到一个低偏差的算法),通过非常大的训练集来保证没有方差问题。通过将这两个放在一起最终可以得到低误差和低方差的学习算法,使得我们可以很好地测试测试数据集。

总结

  • 本文主要介绍了机器学习系统设计的相关问题。首先通过垃圾邮件分类的例子来展示操作过程,随后介绍了提高精准度降低错误率的一些方法。
  • 为了选出应该使用哪些方法,引入了误差分析的概念,其中也介绍了一些在机器学习开发或应用时的推荐的方法:先通过一个简单的算法来快速的实现目标,随后画出相应的学习曲线便于后续的判断,最后进行误差分析。
  • 随后介绍了评估度量值的重要性:通过一个具体的数字来反应回归模型到底如何。
  • 为了解决偏斜类问题(即正负样本比例失调),引入了查准率召回率的概念,对于如何在查准率和召回率之间抉择的问题,应当采用调和平均数对两者进行结合,通过 F 值这一指标来挑选临界值
  • 除此之外,当有偏斜类问题时使用查准率和召回率来评价学习算法要比用分类误差或者分类准确率好得多。
  • 最后,在特定的情况下,如果可以得到庞大的训练集以及含有很多参数(特征值)的学习算法,那么往往可以得到一个性能很好地学习算法。
查看全文
如若内容造成侵权/违法违规/事实不符,请联系编程学习网邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

相关文章

  1. 云炬创业政策学习笔记20210109

    郑州 为加大创业扶持力度&#xff0c;后郑州市小额担保贷款更名为创业担保贷款&#xff0c;同时调高对创业者创业贷款的上限额度。 退役军人、返乡创业农民工及持“就业创业证”或“就业失业登记证”的各类人员自主创业&#xff0c;贷款上限额度调高至20万元&#xff0c;财政贴…...

    2024/4/26 18:13:41
  2. 使用LoggerFactory.getLogger(xxx.class)方法在控制台打印日志信息

    使用System.out.println()来调试.但是用这种方式开发项目部署到生产环境,会因为众多的控制台输出降低应用的性能.这时候Log4J就成为可平衡开发和部署应用的利器了. 使用指定的类XXX初始化日志对象&#xff0c;方便在日志输出的时候&#xff0c;可以打印出日志信息所属的类。 …...

    2024/4/28 14:03:03
  3. python基础 常见的异常类型

    python中常见的异常类型 1、ZeroDivisionError 除&#xff08;或取模&#xff09;零&#xff08;所有数据类型&#xff09; 2、IndexError #序列中没有此索引 3、KeyError #映射中没有这个键 4、NameError #未声明/初始化对象&#xff08;没有属性&#xf…...

    2024/5/7 6:29:56
  4. 云炬创业政策学习笔记20210107

    太原 太原市登记失业的高校毕业生&#xff0c;想自主创业的&#xff0c;可申请大学生个人创业贷款不超过5万元的小额担保贷款。 福建——根据当地大学生自主创业贷款政策&#xff0c;高校毕业生可享受小额担保贷款和其他形式小额贷款贴息政策&#xff0c;贴息贷款额度最高5万元…...

    2024/4/13 16:04:15
  5. 关于spring的bean的创建过程

    ...

    2024/4/20 7:29:11
  6. 微网两阶段鲁棒优化matlab版 采用CCG和kkt条件编制两阶段鲁棒优化程序

    微网两阶段鲁棒优化matlab版 采用CCG和kkt条件编制两阶段鲁棒优化程序&#xff0c;以储能、发电、风电和光伏容量作为第一阶段变量&#xff0c;以主体出力作为第二阶段变量&#xff0c;以负荷、风电和光伏出力作为不确定性变量&#xff0c;实现微网两阶段优化模型编号:58906416…...

    2024/4/16 0:32:59
  7. C语言 按姓氏排序并搜索字符串数组

    其实实现起来并不困难&#xff0c;只需要利用stdlib.h中的qsort()以及bsearch()函数即可。但是需要注意有关二级指针的一些问题&#xff0c;否则就会卡上好久还不知道为什么出错(比如我-_-) #include <stdio.h> #include <string.h> #include <stdlib.h>int …...

    2024/5/7 9:32:14
  8. qt学习笔记 来自B站【最新QT从入门到实战完整版|传智教育】

    最新QT从入门到实战完整版|传智教育 目录在这里2022.2.4 day106 QPushButton创建07 对象树08 Qt的坐标系09 信号和槽-点击按钮关闭窗口10 自定义信号和槽2022.2.4 day1 06 QPushButton创建 LearningQt::LearningQt(QWidget *parent): QMainWindow(parent), ui(new Ui::Learnin…...

    2024/5/7 10:04:48
  9. cv2.drawContours()讲解

    cv2.drawContours(image, contours, contourIdx, color, thicknessNone, lineTypeNone, hierarchyNone, maxLevelNone, offsetNone) 第一个参数是指明在哪幅图像上绘制轮廓&#xff1b;image为三通道才能显示轮廓第二个参数是轮廓本身&#xff0c;在Python中是一个list;thickn…...

    2024/4/13 16:04:15
  10. MATLAB/Simulink汽车电动助力转向模型EPS模型

    MATLAB/Simulink汽车电动助力转向模型EPS模型 模型包括整车二自由度模型&#xff0c;魔术公式轮胎模型&#xff0c;eps模型&#xff0c;上下转向柱模型&#xff0c;包括公式&#xff0c;整车参数&#xff0c;匹配计算&#xff0c;word文档&#xff0c;模型&#xff0c;使用说明…...

    2024/4/13 16:04:10
  11. 公司管理使用的文档[1]-软件技术服务合同模板

    今天分享一个公司管理的常用文档&#xff0c;软件技术服务合同模板。该模板严格按照行业标准制定&#xff0c;适合中小型软件公司进行技术服务等相关合同的签订。 下面是简单说明&#xff1a; 1. 资源内容&#xff1a;标准化软件技术服务合同模板 2. 使用目标&#xff1a;签订…...

    2024/5/6 20:13:14
  12. 云炬创业政策学习笔记20210105

    西 江西省将实施创业引领计划&#xff0c;计划每年引领万名大学生进行创业。 据了解&#xff0c;为引领大学生为主的青年创新创业&#xff0c;江西去年不断扩大大学生求职创业补贴对象范围&#xff0c;并提高一次性求职补贴标准&#xff0c;共为2.2万名度高校毕业生发放了一次性…...

    2024/4/7 20:48:56
  13. 从电池中管理使用电动车(EVS)和电力注射构成控制EV的充电和排放作为有吸引力的研究领域的问题

    v2G技术优化配电系统负荷曲线 关键词:电动汽车&#xff0c;负荷方差&#xff0c;蒙特卡洛&#xff0c;JAYA算法 算法:PSO&#xff0c;MC&#xff0c;JAYA 从电池中管理使用电动车&#xff08;EVS&#xff09;和电力注射构成控制EV的充电和排放作为有吸引力的研究领域的问题。…...

    2024/4/28 19:13:59
  14. Github绑定腾讯云申请的域名

    前言&#xff1a;首先做好腾讯云域名申请&#xff08;第一年便宜&#xff09;和github静态网页搭建例如xxx.github.io。 剩下的工作&#xff1a; 腾讯云域名指向https://xxx.github.io &#xff1a; 找到域名注册-我的域名&#xff0c;在操作中点击解析-快速添加解析-域名映射…...

    2024/4/14 17:01:56
  15. windows 11 搭建 TensorFlow GPU 开发环境【RTX 3060】:3 -- 基于WSL2 本地方式的jupyter notebook使用

    文章大纲 基本环境构建CUDA 本地环境构建conda jupyter notebook tensorflow-gpu 环境构建参考文献接上文, 我们发现WSL2 中其实也是可以使用CUDA 的。只不过使用docker 的方式。在加载资源的过程中有点卡。 我们在使用windows 炼丹的过程中,经常会遭遇到,Linux系统下生成的…...

    2024/4/7 20:48:51
  16. C++中的.和->

    C中的.和-> 1. C中的点&#xff08;.&#xff09;的应用 如果是一个对象或者引用去调用成员变量或者成员函数函数的话&#xff0c;会使用到点 #include <iostream> using namespace std; class Base { public:Base(int a) {val a;}void fun() {cout << &quo…...

    2024/5/7 4:51:11
  17. 07 Linux操作系统相关知识

    Linux一、安装虚拟机与Centos 6.71、安装VMware2、安装Centos 6.7二、Linux命令1、主流远程工具SecureCRTPortable使用2、Linux简介3、常用命令4、有关目录&#xff08;文件夹&#xff09;常用操作命令5、有关文件的常用操作命令6、Linux文本剪辑 vi7、修改网络配置文件8、设置…...

    2024/5/7 4:12:01
  18. CS架构快速源代码C#权限管理源码 C#源代码,二次开发

    CS架构快速源代码C#权限管理源码 C#源代码&#xff0c;二次开发 编号:8712641496190999正府街忠心的青蒿...

    2024/4/13 16:05:26
  19. 多层感知机的简洁实现

    1、导入相应的包 import torch from torch import nn from d2l import torch as d2l 2、设置net和权重w #nn.Flatten()之后&#xff0c;通过nn.Linear设置输入层、隐藏层的输入和输出个数 #这里定义了一层隐藏层 第一层有256个神经元 #这里跟矩阵的乘法不要弄混 #输入层输出…...

    2024/5/7 11:33:31
  20. spring boot 参数校验国际化异常信息

    场景 validator 校验参数不通时&#xff0c;将错误信息保存到 BindingResult&#xff0c;最后使用 i18n 根据不同国家和地区展示对应的异常信息。要求配置好后不需要再在应用程序中添加额外代码&#xff0c;就能实现上述功能。 在 springboot 大行其道的今天&#xff0c;使用…...

    2024/5/6 19:27:34

最新文章

  1. C++ 智能指针使用

    智能指针是C中用于自动管理动态分配内存的机制&#xff0c;它们通过确保在适当的时候删除对象来避免内存泄漏。 在C11及以后的版本中&#xff0c;有三种主要的智能指针&#xff1a;std::unique_ptr、std::shared_ptr和std::weak_ptr。 以下是这些智能指针之间的区别、优缺点以…...

    2024/5/9 0:31:10
  2. 梯度消失和梯度爆炸的一些处理方法

    在这里是记录一下梯度消失或梯度爆炸的一些处理技巧。全当学习总结了如有错误还请留言&#xff0c;在此感激不尽。 权重和梯度的更新公式如下&#xff1a; w w − η ⋅ ∇ w w w - \eta \cdot \nabla w ww−η⋅∇w 个人通俗的理解梯度消失就是网络模型在反向求导的时候出…...

    2024/5/7 10:36:02
  3. Python读取文件里内容

    如果要读取一个文件里的内容是 # 文件名&#xff1a;db.txt 1 2 3 4代码如下 import requests f open("db.txt", mode"rb") content f.read() f.close()data content.decode(utf-8)# 存到 list 里 data_list data.split(\r\n) print(data_list)# 结果…...

    2024/5/5 8:37:34
  4. 【单调队列】滑动窗口与子矩阵

    一、滑动窗口 给定一个大小为 n≤1e6 的数组。 有一个大小为 k 的滑动窗口&#xff0c;它从数组的最左边移动到最右边。 你只能在窗口中看到 k 个数字。 每次滑动窗口向右移动一个位置。 以下是一个例子&#xff1a; 该数组为 [1 3 -1 -3 5 3 6 7]&#xff0c;k 为 3。 …...

    2024/5/7 8:22:12
  5. 【外汇早评】美通胀数据走低,美元调整

    原标题:【外汇早评】美通胀数据走低,美元调整昨日美国方面公布了新一期的核心PCE物价指数数据,同比增长1.6%,低于前值和预期值的1.7%,距离美联储的通胀目标2%继续走低,通胀压力较低,且此前美国一季度GDP初值中的消费部分下滑明显,因此市场对美联储后续更可能降息的政策…...

    2024/5/8 6:01:22
  6. 【原油贵金属周评】原油多头拥挤,价格调整

    原标题:【原油贵金属周评】原油多头拥挤,价格调整本周国际劳动节,我们喜迎四天假期,但是整个金融市场确实流动性充沛,大事频发,各个商品波动剧烈。美国方面,在本周四凌晨公布5月份的利率决议和新闻发布会,维持联邦基金利率在2.25%-2.50%不变,符合市场预期。同时美联储…...

    2024/5/7 9:45:25
  7. 【外汇周评】靓丽非农不及疲软通胀影响

    原标题:【外汇周评】靓丽非农不及疲软通胀影响在刚结束的周五,美国方面公布了新一期的非农就业数据,大幅好于前值和预期,新增就业重新回到20万以上。具体数据: 美国4月非农就业人口变动 26.3万人,预期 19万人,前值 19.6万人。 美国4月失业率 3.6%,预期 3.8%,前值 3…...

    2024/5/4 23:54:56
  8. 【原油贵金属早评】库存继续增加,油价收跌

    原标题:【原油贵金属早评】库存继续增加,油价收跌周三清晨公布美国当周API原油库存数据,上周原油库存增加281万桶至4.692亿桶,增幅超过预期的74.4万桶。且有消息人士称,沙特阿美据悉将于6月向亚洲炼油厂额外出售更多原油,印度炼油商预计将每日获得至多20万桶的额外原油供…...

    2024/5/7 14:25:14
  9. 【外汇早评】日本央行会议纪要不改日元强势

    原标题:【外汇早评】日本央行会议纪要不改日元强势近两日日元大幅走强与近期市场风险情绪上升,避险资金回流日元有关,也与前一段时间的美日贸易谈判给日本缓冲期,日本方面对汇率问题也避免继续贬值有关。虽然今日早间日本央行公布的利率会议纪要仍然是支持宽松政策,但这符…...

    2024/5/4 23:54:56
  10. 【原油贵金属早评】欧佩克稳定市场,填补伊朗问题的影响

    原标题:【原油贵金属早评】欧佩克稳定市场,填补伊朗问题的影响近日伊朗局势升温,导致市场担忧影响原油供给,油价试图反弹。此时OPEC表态稳定市场。据消息人士透露,沙特6月石油出口料将低于700万桶/日,沙特已经收到石油消费国提出的6月份扩大出口的“适度要求”,沙特将满…...

    2024/5/4 23:55:05
  11. 【外汇早评】美欲与伊朗重谈协议

    原标题:【外汇早评】美欲与伊朗重谈协议美国对伊朗的制裁遭到伊朗的抗议,昨日伊朗方面提出将部分退出伊核协议。而此行为又遭到欧洲方面对伊朗的谴责和警告,伊朗外长昨日回应称,欧洲国家履行它们的义务,伊核协议就能保证存续。据传闻伊朗的导弹已经对准了以色列和美国的航…...

    2024/5/4 23:54:56
  12. 【原油贵金属早评】波动率飙升,市场情绪动荡

    原标题:【原油贵金属早评】波动率飙升,市场情绪动荡因中美贸易谈判不安情绪影响,金融市场各资产品种出现明显的波动。随着美国与中方开启第十一轮谈判之际,美国按照既定计划向中国2000亿商品征收25%的关税,市场情绪有所平复,已经开始接受这一事实。虽然波动率-恐慌指数VI…...

    2024/5/7 11:36:39
  13. 【原油贵金属周评】伊朗局势升温,黄金多头跃跃欲试

    原标题:【原油贵金属周评】伊朗局势升温,黄金多头跃跃欲试美国和伊朗的局势继续升温,市场风险情绪上升,避险黄金有向上突破阻力的迹象。原油方面稍显平稳,近期美国和OPEC加大供给及市场需求回落的影响,伊朗局势并未推升油价走强。近期中美贸易谈判摩擦再度升级,美国对中…...

    2024/5/4 23:54:56
  14. 【原油贵金属早评】市场情绪继续恶化,黄金上破

    原标题:【原油贵金属早评】市场情绪继续恶化,黄金上破周初中国针对于美国加征关税的进行的反制措施引发市场情绪的大幅波动,人民币汇率出现大幅的贬值动能,金融市场受到非常明显的冲击。尤其是波动率起来之后,对于股市的表现尤其不安。隔夜美国股市出现明显的下行走势,这…...

    2024/5/6 1:40:42
  15. 【外汇早评】美伊僵持,风险情绪继续升温

    原标题:【外汇早评】美伊僵持,风险情绪继续升温昨日沙特两艘油轮再次发生爆炸事件,导致波斯湾局势进一步恶化,市场担忧美伊可能会出现摩擦生火,避险品种获得支撑,黄金和日元大幅走强。美指受中美贸易问题影响而在低位震荡。继5月12日,四艘商船在阿联酋领海附近的阿曼湾、…...

    2024/5/4 23:54:56
  16. 【原油贵金属早评】贸易冲突导致需求低迷,油价弱势

    原标题:【原油贵金属早评】贸易冲突导致需求低迷,油价弱势近日虽然伊朗局势升温,中东地区几起油船被袭击事件影响,但油价并未走高,而是出于调整结构中。由于市场预期局势失控的可能性较低,而中美贸易问题导致的全球经济衰退风险更大,需求会持续低迷,因此油价调整压力较…...

    2024/5/8 20:48:49
  17. 氧生福地 玩美北湖(上)——为时光守候两千年

    原标题:氧生福地 玩美北湖(上)——为时光守候两千年一次说走就走的旅行,只有一张高铁票的距离~ 所以,湖南郴州,我来了~ 从广州南站出发,一个半小时就到达郴州西站了。在动车上,同时改票的南风兄和我居然被分到了一个车厢,所以一路非常愉快地聊了过来。 挺好,最起…...

    2024/5/7 9:26:26
  18. 氧生福地 玩美北湖(中)——永春梯田里的美与鲜

    原标题:氧生福地 玩美北湖(中)——永春梯田里的美与鲜一觉醒来,因为大家太爱“美”照,在柳毅山庄去寻找龙女而错过了早餐时间。近十点,向导坏坏还是带着饥肠辘辘的我们去吃郴州最富有盛名的“鱼头粉”。说这是“十二分推荐”,到郴州必吃的美食之一。 哇塞!那个味美香甜…...

    2024/5/4 23:54:56
  19. 氧生福地 玩美北湖(下)——奔跑吧骚年!

    原标题:氧生福地 玩美北湖(下)——奔跑吧骚年!让我们红尘做伴 活得潇潇洒洒 策马奔腾共享人世繁华 对酒当歌唱出心中喜悦 轰轰烈烈把握青春年华 让我们红尘做伴 活得潇潇洒洒 策马奔腾共享人世繁华 对酒当歌唱出心中喜悦 轰轰烈烈把握青春年华 啊……啊……啊 两…...

    2024/5/8 19:33:07
  20. 扒开伪装医用面膜,翻六倍价格宰客,小姐姐注意了!

    原标题:扒开伪装医用面膜,翻六倍价格宰客,小姐姐注意了!扒开伪装医用面膜,翻六倍价格宰客!当行业里的某一品项火爆了,就会有很多商家蹭热度,装逼忽悠,最近火爆朋友圈的医用面膜,被沾上了污点,到底怎么回事呢? “比普通面膜安全、效果好!痘痘、痘印、敏感肌都能用…...

    2024/5/5 8:13:33
  21. 「发现」铁皮石斛仙草之神奇功效用于医用面膜

    原标题:「发现」铁皮石斛仙草之神奇功效用于医用面膜丽彦妆铁皮石斛医用面膜|石斛多糖无菌修护补水贴19大优势: 1、铁皮石斛:自唐宋以来,一直被列为皇室贡品,铁皮石斛生于海拔1600米的悬崖峭壁之上,繁殖力差,产量极低,所以古代仅供皇室、贵族享用 2、铁皮石斛自古民间…...

    2024/5/8 20:38:49
  22. 丽彦妆\医用面膜\冷敷贴轻奢医学护肤引导者

    原标题:丽彦妆\医用面膜\冷敷贴轻奢医学护肤引导者【公司简介】 广州华彬企业隶属香港华彬集团有限公司,专注美业21年,其旗下品牌: 「圣茵美」私密荷尔蒙抗衰,产后修复 「圣仪轩」私密荷尔蒙抗衰,产后修复 「花茵莳」私密荷尔蒙抗衰,产后修复 「丽彦妆」专注医学护…...

    2024/5/4 23:54:58
  23. 广州械字号面膜生产厂家OEM/ODM4项须知!

    原标题:广州械字号面膜生产厂家OEM/ODM4项须知!广州械字号面膜生产厂家OEM/ODM流程及注意事项解读: 械字号医用面膜,其实在我国并没有严格的定义,通常我们说的医美面膜指的应该是一种「医用敷料」,也就是说,医用面膜其实算作「医疗器械」的一种,又称「医用冷敷贴」。 …...

    2024/5/6 21:42:42
  24. 械字号医用眼膜缓解用眼过度到底有无作用?

    原标题:械字号医用眼膜缓解用眼过度到底有无作用?医用眼膜/械字号眼膜/医用冷敷眼贴 凝胶层为亲水高分子材料,含70%以上的水分。体表皮肤温度传导到本产品的凝胶层,热量被凝胶内水分子吸收,通过水分的蒸发带走大量的热量,可迅速地降低体表皮肤局部温度,减轻局部皮肤的灼…...

    2024/5/4 23:54:56
  25. 配置失败还原请勿关闭计算机,电脑开机屏幕上面显示,配置失败还原更改 请勿关闭计算机 开不了机 这个问题怎么办...

    解析如下&#xff1a;1、长按电脑电源键直至关机&#xff0c;然后再按一次电源健重启电脑&#xff0c;按F8健进入安全模式2、安全模式下进入Windows系统桌面后&#xff0c;按住“winR”打开运行窗口&#xff0c;输入“services.msc”打开服务设置3、在服务界面&#xff0c;选中…...

    2022/11/19 21:17:18
  26. 错误使用 reshape要执行 RESHAPE,请勿更改元素数目。

    %读入6幅图像&#xff08;每一幅图像的大小是564*564&#xff09; f1 imread(WashingtonDC_Band1_564.tif); subplot(3,2,1),imshow(f1); f2 imread(WashingtonDC_Band2_564.tif); subplot(3,2,2),imshow(f2); f3 imread(WashingtonDC_Band3_564.tif); subplot(3,2,3),imsho…...

    2022/11/19 21:17:16
  27. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机...

    win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”问题的解决方法在win7系统关机时如果有升级系统的或者其他需要会直接进入一个 等待界面&#xff0c;在等待界面中我们需要等待操作结束才能关机&#xff0c;虽然这比较麻烦&#xff0c;但是对系统进行配置和升级…...

    2022/11/19 21:17:15
  28. 台式电脑显示配置100%请勿关闭计算机,“准备配置windows 请勿关闭计算机”的解决方法...

    有不少用户在重装Win7系统或更新系统后会遇到“准备配置windows&#xff0c;请勿关闭计算机”的提示&#xff0c;要过很久才能进入系统&#xff0c;有的用户甚至几个小时也无法进入&#xff0c;下面就教大家这个问题的解决方法。第一种方法&#xff1a;我们首先在左下角的“开始…...

    2022/11/19 21:17:14
  29. win7 正在配置 请勿关闭计算机,怎么办Win7开机显示正在配置Windows Update请勿关机...

    置信有很多用户都跟小编一样遇到过这样的问题&#xff0c;电脑时发现开机屏幕显现“正在配置Windows Update&#xff0c;请勿关机”(如下图所示)&#xff0c;而且还需求等大约5分钟才干进入系统。这是怎样回事呢&#xff1f;一切都是正常操作的&#xff0c;为什么开时机呈现“正…...

    2022/11/19 21:17:13
  30. 准备配置windows 请勿关闭计算机 蓝屏,Win7开机总是出现提示“配置Windows请勿关机”...

    Win7系统开机启动时总是出现“配置Windows请勿关机”的提示&#xff0c;没过几秒后电脑自动重启&#xff0c;每次开机都这样无法进入系统&#xff0c;此时碰到这种现象的用户就可以使用以下5种方法解决问题。方法一&#xff1a;开机按下F8&#xff0c;在出现的Windows高级启动选…...

    2022/11/19 21:17:12
  31. 准备windows请勿关闭计算机要多久,windows10系统提示正在准备windows请勿关闭计算机怎么办...

    有不少windows10系统用户反映说碰到这样一个情况&#xff0c;就是电脑提示正在准备windows请勿关闭计算机&#xff0c;碰到这样的问题该怎么解决呢&#xff0c;现在小编就给大家分享一下windows10系统提示正在准备windows请勿关闭计算机的具体第一种方法&#xff1a;1、2、依次…...

    2022/11/19 21:17:11
  32. 配置 已完成 请勿关闭计算机,win7系统关机提示“配置Windows Update已完成30%请勿关闭计算机”的解决方法...

    今天和大家分享一下win7系统重装了Win7旗舰版系统后&#xff0c;每次关机的时候桌面上都会显示一个“配置Windows Update的界面&#xff0c;提示请勿关闭计算机”&#xff0c;每次停留好几分钟才能正常关机&#xff0c;导致什么情况引起的呢&#xff1f;出现配置Windows Update…...

    2022/11/19 21:17:10
  33. 电脑桌面一直是清理请关闭计算机,windows7一直卡在清理 请勿关闭计算机-win7清理请勿关机,win7配置更新35%不动...

    只能是等着&#xff0c;别无他法。说是卡着如果你看硬盘灯应该在读写。如果从 Win 10 无法正常回滚&#xff0c;只能是考虑备份数据后重装系统了。解决来方案一&#xff1a;管理员运行cmd&#xff1a;net stop WuAuServcd %windir%ren SoftwareDistribution SDoldnet start WuA…...

    2022/11/19 21:17:09
  34. 计算机配置更新不起,电脑提示“配置Windows Update请勿关闭计算机”怎么办?

    原标题&#xff1a;电脑提示“配置Windows Update请勿关闭计算机”怎么办&#xff1f;win7系统中在开机与关闭的时候总是显示“配置windows update请勿关闭计算机”相信有不少朋友都曾遇到过一次两次还能忍但经常遇到就叫人感到心烦了遇到这种问题怎么办呢&#xff1f;一般的方…...

    2022/11/19 21:17:08
  35. 计算机正在配置无法关机,关机提示 windows7 正在配置windows 请勿关闭计算机 ,然后等了一晚上也没有关掉。现在电脑无法正常关机...

    关机提示 windows7 正在配置windows 请勿关闭计算机 &#xff0c;然后等了一晚上也没有关掉。现在电脑无法正常关机以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;关机提示 windows7 正在配…...

    2022/11/19 21:17:05
  36. 钉钉提示请勿通过开发者调试模式_钉钉请勿通过开发者调试模式是真的吗好不好用...

    钉钉请勿通过开发者调试模式是真的吗好不好用 更新时间:2020-04-20 22:24:19 浏览次数:729次 区域: 南阳 > 卧龙 列举网提醒您:为保障您的权益,请不要提前支付任何费用! 虚拟位置外设器!!轨迹模拟&虚拟位置外设神器 专业用于:钉钉,外勤365,红圈通,企业微信和…...

    2022/11/19 21:17:05
  37. 配置失败还原请勿关闭计算机怎么办,win7系统出现“配置windows update失败 还原更改 请勿关闭计算机”,长时间没反应,无法进入系统的解决方案...

    前几天班里有位学生电脑(windows 7系统)出问题了&#xff0c;具体表现是开机时一直停留在“配置windows update失败 还原更改 请勿关闭计算机”这个界面&#xff0c;长时间没反应&#xff0c;无法进入系统。这个问题原来帮其他同学也解决过&#xff0c;网上搜了不少资料&#x…...

    2022/11/19 21:17:04
  38. 一个电脑无法关闭计算机你应该怎么办,电脑显示“清理请勿关闭计算机”怎么办?...

    本文为你提供了3个有效解决电脑显示“清理请勿关闭计算机”问题的方法&#xff0c;并在最后教给你1种保护系统安全的好方法&#xff0c;一起来看看&#xff01;电脑出现“清理请勿关闭计算机”在Windows 7(SP1)和Windows Server 2008 R2 SP1中&#xff0c;添加了1个新功能在“磁…...

    2022/11/19 21:17:03
  39. 请勿关闭计算机还原更改要多久,电脑显示:配置windows更新失败,正在还原更改,请勿关闭计算机怎么办...

    许多用户在长期不使用电脑的时候&#xff0c;开启电脑发现电脑显示&#xff1a;配置windows更新失败&#xff0c;正在还原更改&#xff0c;请勿关闭计算机。。.这要怎么办呢&#xff1f;下面小编就带着大家一起看看吧&#xff01;如果能够正常进入系统&#xff0c;建议您暂时移…...

    2022/11/19 21:17:02
  40. 还原更改请勿关闭计算机 要多久,配置windows update失败 还原更改 请勿关闭计算机,电脑开机后一直显示以...

    配置windows update失败 还原更改 请勿关闭计算机&#xff0c;电脑开机后一直显示以以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容&#xff0c;让我们赶快一起来看一下吧&#xff01;配置windows update失败 还原更改 请勿关闭计算机&#x…...

    2022/11/19 21:17:01
  41. 电脑配置中请勿关闭计算机怎么办,准备配置windows请勿关闭计算机一直显示怎么办【图解】...

    不知道大家有没有遇到过这样的一个问题&#xff0c;就是我们的win7系统在关机的时候&#xff0c;总是喜欢显示“准备配置windows&#xff0c;请勿关机”这样的一个页面&#xff0c;没有什么大碍&#xff0c;但是如果一直等着的话就要两个小时甚至更久都关不了机&#xff0c;非常…...

    2022/11/19 21:17:00
  42. 正在准备配置请勿关闭计算机,正在准备配置windows请勿关闭计算机时间长了解决教程...

    当电脑出现正在准备配置windows请勿关闭计算机时&#xff0c;一般是您正对windows进行升级&#xff0c;但是这个要是长时间没有反应&#xff0c;我们不能再傻等下去了。可能是电脑出了别的问题了&#xff0c;来看看教程的说法。正在准备配置windows请勿关闭计算机时间长了方法一…...

    2022/11/19 21:16:59
  43. 配置失败还原请勿关闭计算机,配置Windows Update失败,还原更改请勿关闭计算机...

    我们使用电脑的过程中有时会遇到这种情况&#xff0c;当我们打开电脑之后&#xff0c;发现一直停留在一个界面&#xff1a;“配置Windows Update失败&#xff0c;还原更改请勿关闭计算机”&#xff0c;等了许久还是无法进入系统。如果我们遇到此类问题应该如何解决呢&#xff0…...

    2022/11/19 21:16:58
  44. 如何在iPhone上关闭“请勿打扰”

    Apple’s “Do Not Disturb While Driving” is a potentially lifesaving iPhone feature, but it doesn’t always turn on automatically at the appropriate time. For example, you might be a passenger in a moving car, but your iPhone may think you’re the one dri…...

    2022/11/19 21:16:57