Uber开源Manifold,用于调试AI模子的可视器材
为了减轻事变量,Uber在内部开拓了Manifold,这是一种与模子无关的视觉器材,它可以表现特性漫衍的差别(即所调查到的征象的可丈量属性)。它已辅佐各类产物团队说明白无数的AI模子。截至到本日,它已在GitHub上以开源情势提供。 Uber呆板进修软件工程师李乐之在博客中写道:“自从本年早些时辰建设Manifold以来,我们已经收到了许多关于其在通用ML模子调试场景中潜力的反馈。在开源独立版本的Manifold时,我们信托该器材将通过为ML事变流提供可表明性和可调试性,同样使ML社区受益。” Manifold操作所谓的聚类算法(k-Means)将猜测数据按照其机能相似性分成多个段。该算法通过其KL散度对特性举办排名,KL散度是两个比拟漫衍之间差此外怀抱。一样平常而言,在歧管中,较高的发散度暗示给定的特性与区分两个片断组的因子相干。 Manifold包罗对多种算法范例的支持,包罗通例的二进制分类和回归模子。在可视化方面,它可以提取数字和分类以及地理空间要素范例。它与Jupyter Notebook集成在一路,Jupyter Notebook是为数据科学家和ML工程师行使最普及的数据科学平台之一,而且具有交互式数据切片和基于每个实例的猜测丧失和其他特性值的机能较量。 Manifold利便的机能较量视图可较量模子和数据子集的猜测机能。成果归因视图通过用户界说的细分汇总了具有各类机能级此外数据子集的成果漫衍。两者都提供了模子机能的概述和地理空间特性的舆图视图,有助于辨认示意不佳的数据子集以举办进一步搜查。 歧管包装为独立安装或打包安装。安装后,有两种向个中输入数据的方法:通过逗号脱离的文件或以编程方法举办的转换。 版本1刊行版中的成果包罗:
集成块的新进级包罗对地理空间特性的可视化支持。
Manifold的Jupyter Notebook集成接管数据输入作为Pandas DataFrame工具,并在Jupyter Notebook UI中泛起可视化结果。
基于每个实例的猜测丧失和特性值的交互式数据切片使Manifold操练者可以更好地领略ML模子机能题目。 (编辑:河北网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |