副问题[/!--empirenews.page--]
9月15日技能沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖切磋精准运维!
近期,skymind.ai 宣布了一份很是全面的开源数据集。内容包罗生物辨认、天然图像以及深度进修图像等数据集,现将其清算如下:(内附链接哦~)
最近新增数据集
- 开源生物辨认数据:http://openbiometrics.org/
- Google Audioset:扩展了 632 个音频分类样本,并从 YouTube 视频中提取了 2,084,320 小我私人类标志的 10 秒声音片断。
- 地点:https://research.google.com/audioset/
- Uber 2B trip data:初次展示 2 百万公里的出行数据。
- 地点:https://movement.uber.com/cities
- Yelp Open Dataset:Yelp 数据集是用于 NLP 的 Yelp 营业、评述和用户数据的子集。
- 地点:https://www.yelp.com/dataset
- Core50:用于持续方针识此外新数据集和基准。
- 地点:https://vlomonaco.github.io/core50/
- Kaggle 数据集:https://www.kaggle.com/datasets
- Data Portal:http://dataportals.org/
- Open Data Monitor:https://opendatamonitor.eu/
- Quandl Data Portal:https://www.quandl.com/
- Mut1ny 头部/面部门割数据集:http://www.mut1ny.com/face-headsegmentation-dataset
- Github 上的优越民众数据集:https://www.kdnuggets.com/2015/04/awesome-public-datasets-github.html
- 头部 CT 扫描数据集:491 次扫描的 CQ500 数据集。
- 地点:http://headctstudy.qure.ai/
天然图像数据集
- MNIST:手写数字图像。最常用的可用性搜查。名目 25x25、居中、利害手写数字。这是一项简朴的使命——仅某部门合用于 MNIST,不料味着它有用。
- 地点:http://yann.lecun.com/exdb/mnist/
- CIFAR10 / CIFAR100:32x32 彩色图像,10/100 类。固然仍风趣却不再常用的可用性搜查。
- 地点:http://www.cs.utoronto.ca/~kriz/cifar.html
- Caltech 101:101 类物体的图片。
- 地点:http://www.vision.caltech.edu/Image_Datasets/Caltech101/
- Caltech 256:256 类物体的图片。
- 地点:http://www.vision.caltech.edu/Image_Datasets/Caltech256/
- STL-10 数据集:用于开拓无监视特性进修、深度进修、自进修算法的图像辨认数据集。像修悔改的 CIFAR-10。
- 地点:http://cs.stanford.edu/~acoates/stl10/
- The Street View House Numbers (SVHN):Google 街景中的门牌号码。可以把它想象成复现的户外 MNIST。
- 地点:http://ufldl.stanford.edu/housenumbers/
- NORB:玩具摆件在各类照明和姿势下的双目图像。
- 地点:http://www.cs.nyu.edu/~ylclab/data/norb-v1.0/
- Pascal VOC:通用图像支解/分类——对付构建真实天下图像注释不长短常有效,但对基线很有效。
- 地点:http://pascallin.ecs.soton.ac.uk/challenges/VOC/
- Labelme:带注释图像的大型数据集。
- 地点:http://labelme.csail.mit.edu/Release3.0/browserTools/php/dataset.php
- ImageNet:新算法的客观图像数据集(de-facto image dataset)。很多图像 API 公司都有来自其 REST 接口的标签,这些标签近 1000 类;WordNet; ImageNet 的条理布局。
- 地点:http://image-net.org/
- LSUN:具有许多帮助使命的场景领略(房间机关预计,明显性猜测(saliency prediction)等),有关联比赛。(associated competition)。
- 地点:http://lsun.cs.princeton.edu/2016/
- MS COCO:通用图像领略/声名,有关联比赛。
- 地点:http://mscoco.org/
- COIL 20:差异物体在 360 度旋转中以每个角度成像。
- 地点:http://www.cs.columbia.edu/CAVE/software/softlib/coil-20.php
- COIL100:差异物体在 360 度旋转中以每个角度成像。
- 地点:http://www1.cs.columbia.edu/CAVE/software/softlib/coil-100.php
- Google 开源图像:有 900 万张图像的网址荟萃,这些图像通过常识共享(Creative Commons)被标注成 6000 多个种别。
- 地点:https://research.googleblog.com/2016/09/introducing-open-images-dataset.html
地理空间数据
- OpenStreetMap:免费提供整个星球的矢量数据。它包括(旧版)美国生齿普查局的数据。
- 地点:http://wiki.openstreetmap.org/wiki/Planet.osm
- Landsat8:整个地球外貌的卫星视角图,每隔几周更新一次。
- 地点:https://landsat.usgs.gov/landsat-8
- NEXRAD:美国大气层的多普勒雷达扫描图。
- 地点: https://www.ncdc.noaa.gov/data-access/radar-data/nexrad
————————我是深度进修图像的支解线————————
人工数据集
- Arcade Universe:一小我私人工数据集天生器,图像包括街机游戏 sprite,如 tetris pentomino / tetromino。该天生器基于 O. Breleux 的 bugland 数据集天生器。
- 地点:https://github.com/caglar/Arcade-Universe
- 以 Baby AI School 为灵感的数据集荟萃。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAISchool
- Baby AI Shapes Dataset:区分 3 种简朴外形。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAIShapesDatasets
- Baby AI Image And Question Dataset:一个题目-图像-谜底数据集。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BabyAIImageAndQuestionDatasets
- Deep Vs Shallow Comparison ICML2007:为实证评估深层架构而天生的数据集。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/DeepVsShallowComparisonICML2007
- MnistVariations:在 MNIST 中引入受控变革。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/MnistVariations
- RectanglesData:区分宽矩形和垂直矩形。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/RectanglesData
- ConvexNonConvex:区分凸形和非凸外形。
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/ConvexNonConvex
- BackgroundCorrelation:嘈杂 MNIST 配景下相干度的节制
- 地点:http://www.iro.umontreal.ca/~lisa/twiki/bin/view.cgi/Public/BackgroundCorrelation
(编辑:河北网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|