呆板进修免费跑分神器：集成各大数据集，毗连GitHub就能用

发布时间：2019-10-14 05:18:36 所属栏目：建站来源：栗子鱼羊

导读：本文经AI新媒体量子位（公家号ID:QbitAI）授权转载，转载请接洽出处。搞呆板进修的小搭档们，免不了要在各类数据集上，给AI模子跑分。此刻，Papers with Code(谁人以论文搜代码的神器) 团队，推出了自动跑分处事，名叫sotabench，以跑遍全部开源模子为己

副问题[/!--empirenews.page--]

本文经AI新媒体量子位（公家号ID:QbitAI）授权转载，转载请接洽出处。

搞呆板进修的小搭档们，免不了要在各类数据集上，给AI模子跑分。

此刻，Papers with Code (谁人以论文搜代码的神器) 团队，推出了自动跑分处事，名叫sotabench，以跑遍全部开源模子为己任。

有了它，不消上传代码，只要毗连GitHub项目，就有云端GPU帮你跑分；每次提交了新的commit，体系又会自动更新跑分。尚有天下排行榜，可以调查各路强手的后果。

除了支持各大主流数据集，还支持用户上传本身的数据集。

也可以看看，别人的论文功效，到底靠谱不靠谱。

好比说，fork一下Facebook的FixRes这个项目，设置一下评估文件：

然后一键关联，让Sotabench的GPU跑一下ImageNet的图像分类测试。

就能获得这样的功效：

Top-1精确率，Top-5精确率，跟论文的功效有何差距（见注），运行速率，环球排名，所有一览无余。

注：ε-REPR，功效与论文功效差距在0.3%以内时打勾，差距≥0.3%且比论文功效差表现为红叉，比论文功效好表现为勾+

这个免费的跑分神器，宣布一天，便受到热烈接待：推特点赞600+，Reddit热度270+。

网友纷纷暗示：这对开拓者社区来说太有效了！

那么，先来看一下sotabench的成果和用法吧。

用法简朴，海纳百川

团队说，sotabench就是Papers with Code的双胞胎姐妹：

Papers with Code各人很认识了，它调查的是论文陈诉的跑分。可以用来探求高分模子对应的代码，是个造福人类的器材。

与之互补，sotabench调查的是开源项目，代码现实运行的功效。可以测试本身的模子，也能验证别家的模子，是不是真有论文说的那么强。

它支持跟其他模子的比拟，支持查察速率和精确率的弃取环境。

那么，sotabench怎么用？简朴，只要两步。

第一步，先在当地评估一下模子：

在GitHub项目标根目次里，建设一个sotabench.py文件。内里可以包括：加载、处理赏罚数据集和从中得出猜测所需的逻辑。每提交一个commit，这个文件城市运行。然后，用个开源的基准测试库来跑你的模子。这个库可所以sotabench-eval，这个库不问框架，内里有ImageNet等等数据集；也可所以torchbench，这是个PyTorch库，和PyTorch数据集加载器搭配食用更简朴。