为什么需要机器学习？( 二 ) _机器学习

1.2.2　诊断性分析到目前为止，我们已经处理了输出数据，这是在特定的基础流程生成之后观察到的。系统描述的自然问题与很多因素有关。温度更多取决于气象和地理因素，这些因素既易于观测，又可以完全隐藏。时间序列中的季节性显然受一年中的周期影响，但所出现的异常值又该如何解释呢？
例如我们在一个处于冬季的地区发现了一个温度峰值，我们怎样才能证明它的合理性呢？在简单的方法中，我们可以将其视为可过滤掉的噪声异常值。但是，如果该值已经被观察到并且有存在价值（例如所有各方都认为这不是错误），我们应该假设存在隐藏（或潜在）原因。
这可能是令人惊讶的，但大多数复杂的场景都具有大量难以分析的潜在原因（有时称为因素）。总的来说，这不是一个糟糕的情况，但正如我们将要讨论的那样，将它们包含在模型中并通过数据集了解它们的影响是非常重要的。
另一方面，决定丢弃所有未知元素意味着降低模型的预测能力，并且会成比例地降低准确性。因此，诊断分析的主要目标不一定是找出所有因素，而是列出可观察和可测量的因素（也称为因子），以及所有的潜在因素（通常概括为单个全局因素）。
在某种程度上，因为我们可以轻松监控效果，诊断分析通常类似于逆向工程的过程，但要检测潜在原因与可观察效果之间存在的关系就较为困难。因此这种分析通常是概率性的，并且有助于找出某个确定的原因带来特定影响的概率。这样，排除非影响分量和确定最初排除的关系也更容易。然而，这个过程需要更深入的统计学知识，除了一些例子如高斯混合之外，这类分析将不会在本书中讨论。
1.2.3　预测性分析如果收集了整体描述性知识并且对潜在原因的认识已令人满意，那么我们就可以创建预测模型了。创建预测模型的目的是根据模型本身的历史和结构来推断未来的结果。在许多情况下，我们将这个阶段与下一个阶段一起分析，因为我们很少对系统的自由演变感兴趣（例如温度将在下个月如何变化），而是对我们可以影响输出的方式感兴趣。
也就是说，我们只关注预测，考虑最重要的因素。第一个需要考虑的因素就是流程性质。我们不需要机器学习用于确定性过程，除非这些过程的复杂性太高以至于我们不得不将它们视为黑匣子。在本章将要讨论的大多数例子都是无法消除不确定性的随机过程。例如一天中的温度可以建模为条件概率（例如高斯），具体取决于前面的观测值。因此，预测不是将系统变为确定性系统，而是减少分布的方差，使概率只有在小的温度范围内，才会很高。另外，正如我们所知，许多潜在因素在幕后工作，该选择会对最终的准确定性产生极大的不利影响，因此不能接受基于尖峰分布的模型（例如基于概率为1的单一结果）。
如果模型被参数化，变量受学习过程影响（例如高斯的均值和协方差矩阵），那么我们的目标是在偏差-方差权衡中找出最佳平衡。由于本章只是概述，我们不用数学公式讲解概念，只需要一个定义即可（更多细节可以在

为什么需要机器学习？( 二 )

推荐阅读

长得好看的女生为啥没有对象?

都市星座说TB|但是最撩人的三个星座，虽然冷淡

中国新闻网|湖北一中型水库出现散浸和脱坡转移民众2.8万余人

无锡博报吹空调追剧刷手机……这样的夏天够不够健康？

洗脸帕怎么清洗洗脸帕怎么洗脸

小晴天儿0707|你好！，30岁

&lt|信达地产联合控股股东竞买青岛金泰盛源

教师节|靖边三中隆重举行开学典礼暨教师节庆祝大会

『十大方面』十大方面论证游泳婴幼儿与不游泳婴幼儿的区别

孟川|恭喜！巨兴茂小15岁娇妻晒孕妇照，正式官宣怀孕，肚大如箩仍运动

王者荣耀1v1的话，哪个英雄可以打得过貂蝉？

木爱科技树重磅消息！中国安芯半导体：交付两台国产光刻机

良渚文化展——陶器时代-艺创网

穿搭|钟丽缇大女儿晒泳照！一袭黑色U领bra勾勒性感身材，笑容甜美

全国党媒信息公共平台|鲁西集团：分段包工制促进效率提升

怎样的夫妻能白头偕老?所谓白头偕老并没有什么秘籍只是在相爱时

女性形象管理蒙娟|还是可以打扮的多变又好看，让上班心情不要太厌世！，天天穿白衬衫当制服

美通社头条| 美通社，“5G应用与产业可持续发展论坛”即将举办

高铁|河南又现“猛虎”城市，4627亿357个项目同时开工，未来将通高铁

我美丽的家乡作文450字我美丽的家乡-我的家乡最美丽作文500字-