加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

统计学和机器学习到底有什么区别?

发布时间:2019-04-25 03:10:17 所属栏目:建站 来源:medium 编译:周家乐、狗小白、蒋宝尚 统计学和机器学习
导读:大数据文摘出品 来历:medium 编译:周家乐、狗小白、蒋宝尚 统计学和呆板进修之间的界定一向很恍惚。 无论是业界照旧学界一向以为呆板进修只是统计学批了一层光显的外套。 而呆板进修支撑的人工智能也被称为统计学的外延 譬喻,诺奖得主托马斯萨金特曾经
副问题[/!--empirenews.page--]

统计学和呆板进修到底有什么区别?

大数据文摘出品

来历:medium

编译:周家乐、狗小白、蒋宝尚

统计学和呆板进修之间的界定一向很恍惚。

无论是业界照旧学界一向以为呆板进修只是统计学批了一层光显的外套。

而呆板进修支撑的人工智能也被称为“统计学的外延”

譬喻,诺奖得主托马斯·萨金特曾经说过人工智能着实就是统计学,只不外用了一个很绮丽的辞藻。

萨金特活着界科技创新论坛上暗示,人工智能着实就是统计学

虽然也有一些差异的声音。可是这一概念的正反两边在争吵中充斥着一堆看似高妙实则暗昧的阐述,实在让人摸不着脑子。

一位名叫Matthew Stewart的哈佛大学博士生从统计与呆板进修的差异;统计模子与呆板进修的差异,这两个角度论证了呆板进修和统计学并不是互为代名词。

呆板进修和统计的首要区别在于它们的目标

与大部门人所想的正相反,呆板进修着实已经存在几十年了。当初只是由于当时的计较手段无法满意它对大量计较的需求,而徐徐被人遗弃。然而,连年来,因为信息爆炸所带来的数据和算力上风,呆板进批改快速清醒。

言归正传,假如说呆板进修和统计学是互为代名词,那为什么我们没有看到每所大学的统计学系都关门大吉而转投'呆板进修'系呢?由于它们是纷歧样的!

我常常听到一些关于这个话题的暗昧阐述,最常见的是这样的说法:

"呆板进修和统计的首要区别在于它们的目标。呆板进修模子旨在使最精确的猜测成为也许。统计模子是为揣度变量之间的相关而计划的。

固然技能上来嗣魅这是正确的,但这样的阐述并没有给出出格清楚和令人满足的谜底。呆板进修和统计之间的一个首要区别确实是它们的目标。

然而,说呆板进修是关于精确的猜测,而统计模子是为推理而计划,险些是毫有时义的说法,除非你真的能干这些观念。

起首,我们必需大白,统计和统计建模是纷歧样的。统计是对数据的数学研究。除非稀有据,不然无法举办统计。统计模子是数据的模子,首要用于揣度数据中差异内容的相关,或建设可以或许猜测将来值的模子。凡是环境下,这两者是相辅相成的。

因此,现实上我们必要从两方面来阐述:第一,统计与呆板进修有何差异;第二,统计模子与呆板进修有何差异?

说的更直白些就是,有许多统计模子可以做出猜测,但猜测结果较量差能人意。

而呆板进修凡是会捐躯可表明性以得到强盛的猜测手段。譬喻,从线性回归到神经收集,尽量表明性变差,可是猜测手段却大幅进步。

从宏观角度来看,这是一个很好的谜底。至少对大大都人来说已经足够好。然而,在有些环境下,这种说法轻易让我们对呆板进修和统计建模之间的差别发生误解。让我们看一下线性回归的例子。

统计模子与呆板进修在线性回归上的差别

或者是由于统计建模和呆板进修中行使要领的相似性,使人们以为它们是统一个对象。对这我可以领略,但究竟上不是这样。

最明明的例子是线性回归,这也许是造成这种误解的首要缘故起因。线性回归是一种统计要领,通过这种要领我们既可以实习一个线性回归器,又可以通过最小二乘法拟合一个统计回归模子。

可以看到,在这个案例中,前者做的事儿叫"实习"模子,它只用到了数据的一个子集,而实习获得的模子毕竟示意怎样必要通过数据的另一个子集测试集测试之后才气知道。在这个例子中,呆板进修的最终目标是在测试集上得到最佳机能。

对付后者,我们则事先假设数据是一个具有高斯噪声的线性回归量,然后试图找到一条线,最大限度地镌汰了全部数据的均方偏差。不必要实习或测试集,在很多环境下,出格是在研究中(如下面的传感器示例),建模的目标是描写数据与输出变量之间的相关, 而不是对将来数据举办猜测。我们称此进程为统计揣度,而不是猜测。尽量我们可以行使此模子举办猜测,这也也许是你所想的,但评估模子的要领不再是测试集,而是评估模子参数的明显性和结实性。

呆板进修(这里特指有监视进修)的目标是得到一个可重复猜测的模子。我们凡是不体谅模子是否可以表明。呆板进修只在乎功效。就比如对公司而言,你的代价只用你的示意来权衡。而统计建模更多的是为了探求变量之间的相关和确定相关的明显性,刚巧迎合了猜测。

下面我举一个本身的例子,来声名两者的区别。我是一名情形科学家。事变的首要内容是和传感器数据打交道。假如我试图证明传感器可以或许对某种刺激(如气体浓度)做出回响, 那么我将行使统计模子来确定信号相应是否具有统计明显性。我会实行领略这种相关,并测试其可一再性,以便可以或许精确地描写传感器的相应,并按照这些数据做出揣度。我还也许测试,相应是否是线性的?相应是否归因于气体浓度而不是传感器中的随机噪声?等等。

而同时,我也可以拿着从20个差异传感器获得的数据, 去实行猜测一个可由他们表征的传感器的相应。假如你对传感器相识不多,这也许会显得有些稀疏,但今朝这确实是情形科学的一个重要研究规模。

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读