谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

雷锋网  •  扫码分享

谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

昨日,谷歌开放了其 语音命令数据集 ,开发者可借助它搭建最基础的语音交互应用。

今天,好消息又来了:谷歌再次宣布开放一个全新的绘图数据集,它的来头可不一般:

还记得谷歌 去年底发布 的 AI 涂鸦游戏 Quick, Draw! 吗?

这个游戏会弹出对话框,让玩家在 20 秒内草绘一样物体,然后利用其机器学法算法对该物体进行识别,对玩家画得到底是什么给出猜测。感兴趣的小伙伴可点击 这里 体验。

谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

Quick, Draw! 的本意,是谷歌的教育体验项目,帮助公众认识神经网络——比如它能做什么。设计它的谷歌工程师团队希望让大家意识到,人与机器学习系统交互也可以充满趣味性。而显然,设计者的目的已经完美达成。

自 Quick, Draw! 上线伊始,便吸引了世界各地的人们上手尝试。过去的六个月里,各国玩家在 Quick, Draw! 上进行的涂鸦,逐渐形成了一个相当庞大的数据集:

根据雷锋网 (公众号:雷锋网) 获得的数字, 来自 100 个国家的 2000 万用户,在 Quick, Draw! 上共绘制了 8 亿幅涂鸦。

今天,谷歌宣布把该数据集开放出来,供全世界的数据科学家、设计师进行分析,或许能够从人们最直觉性的涂鸦中获得产品设计思路。

目前,该数据集共包含 5000 万张涂鸦。 谷歌表示,剩下的 7 亿多张会陆续发布。

谷歌表示:

“这不但是海量的数据,还是一面有意思的镜子——能借此透视怎么以众包的形式让公众参与训练机器学习系统,以及如何创建一个能反映不同文化背景与观念的数据集。”

的确,谷歌根据用户的国籍进行分组,在 Quick, Draw! 数据集中发现了不少有趣的现象。比如,不同国家人脑中的“椅子”:

谷歌开放 Quick, Draw! 数据集,8 亿世界各国人民的涂鸦都在这里

韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。

谷歌表示,Quick, Draw! 为研究如何避免人工智能系统对文化、种族、社会群体产生 bias(倾向),提供了非常好的研究素材。对这个话题感兴趣的读者可访问 谷歌博客 。

Quick, Draw! 数据集的 GitHub 地址: 

https://github.com/googlecreativelab/quickdraw-dataset  

雷锋网版权文章,未经授权禁止转载。详情见。

随意打赏

谷歌数据集
提交建议
微信扫一扫,分享给好友吧。