关于机器学习实战，那些教科书里学不到的12个“民间智慧”

发布时间：2019-05-15 14:27:27 所属栏目：建站来源：towardsml 编译：刘佳玮、王缘缘、Walker 机器

导读：大数据文摘出品来历：towardsml 编译：刘佳玮、王缘缘、Walker 呆板进修算法被以为可以或许通过进修数据来弄清晰怎样执行重要使命。这意味着数据量越大，这些算法就可以办理越发伟大的题目。然而，开拓乐成的呆板进修应用措施必要必然的民间能力，这在教科书

呆板进修论文布满理论担保。我们应该对这些担保做些什么?归纳法传统上与演绎法形成比拟：在演绎法中，你可以担保结论是正确的，在归纳法中就很难说。最近几十年的一个重要盼望是我们熟悉到可以做归纳功效正确性的担保，条件是假如我们乐意接管概率担保。

呆板进修

譬喻，我们可以担保，给定一个足够大的实习集，在很大的概率上，进修器会返回一个乐成泛化的假设或无法找到一个保持正确的假设。

另一种常见的理论担保是给定无限的数据，进修器可以担保输出正确的分类器。在实践中，因为我们之前接头过的偏置-方差的衡量，假如在无限数据环境下，进修器A比进修器B好，那么在有限数据的环境下B凡是比A好。

理论担保在呆板进修中的首要浸染不是作为现实决定的尺度，而是作为领略算法计划的出发点。

10. 简朴并不料味着精确

在呆板进修中，奥卡姆剃刀道理凡是被以为是给定两个具有沟通实习偏差的分类器，两者中较简朴的也许具有较低的测试偏差。

呆板进修

但究竟并非云云，我们之前看到了一个反例：纵然在实习偏差到达零之后，通过添加分类器，一个boosted ensemble的泛化偏差也会继承改进。与直觉相反，模子的参数数目与过拟合之间没有须要的接洽。也就是说在呆板进修中，一个更简朴的假设如故应该是首选，由于简朴自己就是一种上风，而不是由于它意味着精确性。

11. 可暗示不便是可进修

仅仅由于可以暗示函数并不料味着可以进修它。譬喻，尺度决定树进修器无法进修叶子多于实习样例的树木。

给定有限的数据、时刻和内存，尺度进修器只能进修全部也许成果的一小部门，而且这些子集对付差异暗示的进修器是差异的。因此，这里的要害是实行差异的进修器(并也许将它们团结起来)是值得的。

12. 相干性不料味着因果性

我们都传闻过相干性并不料味着因果性，但如故有人经常倾向于以为相干性意味着因果相关。

呆板进修

凡是，进修猜测模子的方针是将它们用作动作指南。假如我们发明用户在超市常常买了啤酒就会买尿不湿，那么大概把啤酒放在尿不湿部门旁边会增进销量。但除非我们举办真实的尝试，不然很难判定这是否属实。相干性符号着一个隐藏的因果相关，我们可以将其作为进一步研究的偏向，而非我们的最终结论。

结论

跟其他学科一样，呆板进修有许多“民间伶俐”，很可贵到但对乐成至关重要。感激Domingos传授本日给我们教授了一些伶俐。但愿这个攻略对你有辅佐。可以在下面评述区留言，说出你的设法哦～

相干报道：

https://towardsml.com/2019/04/09/12-key-lessons-from-ml-researchers-and-practitioners/

【本文是51CTO专栏机构大数据文摘的原创文章，微信公家号“大数据文摘（ id: BigDataDigest）”】

大数据文摘二维码

戳这里，看该作者更多好文

（编辑：河北网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

5/5

首页

6个值得珍藏的搜索引擎	网站优化核心减少SEO污
网站seo优化三个基础知	什么时候宣布文章收录