乌合统计学|信息图形化:大饼和油条

【文章摘要】这个过程,就是

数据分析

可视化(信息图形化)的过程。而今天我们聊的“大饼和油条”,就是信息图形化的俩大神器。

本文作者:刘震宇  微信公众号:乌合之众(shehuixinlixue)

通过上篇文章,我们知道统计是一门化繁为简的技术,可以帮助大家从一堆堆令人困惑的数据中找到解决问题的办法发。我们发现了数据的真相后,就是让别人接受分析结果,快速执行解决方案的过程了。这个过程,就是数据分析可视化(信息图形化)的过程。而今天我们聊的“大饼和油条”,就是信息图形化的俩大神器。

呆板的“大饼”

“大饼”就是经常说的饼图,它喜欢咔咔咔将数据划分为互有明显区别的几个组,或者几个类。饼图被分割后的每个扇形代表一个组(类)。扇形块越大,该组(类)的相对频繁程度越大。

看个“大饼”的例子:某网站5个类目的入口点击量

乌合统计学|信息图形化:大饼和油条

由上图可以一眼看出来哪个扇形块大,哪个扇形块小,这样就能知道哪个类目具有较高的频数或比例了。

所以在你想对基本比例进行比较时,就可以互换呆萌的“大饼”啦!

不过“大饼”还是有问题,它的智商很难对扇形快大小相似时,扇形块尺寸上的微小差别进行判别。如下图:

乌合统计学|信息图形化:大饼和油条

“大饼”君哭了,说我尽力了……然后怎么搞……?

条形图更具有精确性

“大饼”不管用了,隆重有请我们的“油条君”:条形图。条形图能让你对相对大小进行比较的同时,还会更加精确的指出哪个类的频数最高,所以很容易发细小的差别。我个人觉“油条”君最牛逼的就是它站着、躺着都能把活儿给干了。

站立的“油条:”垂直条形图(又称柱状图)

乌合统计学|信息图形化:大饼和油条

躺着的“油条”:水平条形图

乌合统计学|信息图形化:大饼和油条

在我们日常工作中更常使用垂直条形图。但是,如果横轴的类名太长,挤成一坨那可就不好了,这时就可以使用水平条形图了,可以写在纵轴左侧的空白处。

细心的小朋友发现了上面垂直条形图体现了频数,水平条形图体现了百分数,那么问题又来了,我们啥时候用频数啥时候用百分数啊?

标度的影响力

引入一个概念:标度。大白话就是横轴上那一堆点与点之间的间隔。

标度可以是个大忽悠,分分钟隐匿与数据有关的重要事实

标度使用百分数百度

乌合统计学|信息图形化:大饼和油条

根据上图的数据,你一定会得出这样的结论:因为房产的满意率最高,所以产房的业务或功能做得很好;同理二手市场满意率最低,所以二手市场的业务或者功能做的不好。

若只有百分数而没有频数,或只有频数而没有百分数,那可千万要小心。

有时候,这是一种来隐藏基础数据真实情况的伎俩,因为仅靠一张图无法判断这种昂图能再多大程度上代表整个数据。正如你看到的,产房类目满意度最高,但受到调查的仅有10个人;或者你发现,有10万人对房产类目满意,但仅通过这个数据无法判断这个10万人在所有参与调查的人数中的比例是高还是低,所以也无法得出你想要的结论。

还是那句话:那怎么搞啊?记住这个黄金法则:

设计指出频数或是将频数标在中间,或是表在图形旁边,均可。(一般人儿我不告诉哦)

标度使用频数标度

乌合统计学|信息图形化:大饼和油条

通常,标度以0位为起点。但小心喽,不是所有都这么做,正如我们上篇文章看到小刘对下半年业绩折线图的评价:“一飞冲天”,但其实却很稳定。下面左右靓图的起点标度不同,所以数据给人留下的印象不同。因此看别人绘制的图时要小心,很容易让你无视某些数据,从而对数据形成错误印象。

乌合统计学|信息图形化:大饼和油条

此时肯定有同学问,是不是说在反应频数和百分数中我只能二选一呢?

处理多批数据

以下是不同类目的满意和不满意人数统计

乌合统计学|信息图形化:大饼和油条

簇状条形图

乌合统计学|信息图形化:大饼和油条

上面的簇状条形图显示了每个类目满意和不满意的人数。当我们相比较频数时,簇状条形图很有用,但通过这种图很难看出比例和百分数,那咋整?

堆积条形图

乌合统计学|信息图形化:大饼和油条

若要同时体现频数和百分数,看看堆积条形图,它按比例把这一整段长方形分割成几小段。可以看到每个类目参与调查的用户总数和占比。

上面两类条形图的横轴都是频数为主。如果你想横轴以百分比为主,同时还能看到每个类目参与调查的用户总数,那怎么搞?百分比堆积条形图,走你~

乌合统计学|信息图形化:大饼和油条

怎么样,是不是啥都知道了。

话说以上的条形图的横轴都是具体的频数,那如果横轴都是一些分组的数据这有怎么搞呢?如下图

乌合统计学|信息图形化:大饼和油条

今日且让我休息休息,欲知这事儿咋搞,需把公众号置顶,再听下次分解……

本节要点

  • 频数是一种统计方法,用于描述一个类别中有多少个项。
  • 饼图能很好的体现基本比例
  • 条形图更灵活、更精确
  • 条形图标度可以是百分数也可以是频数
  • 水平条形图用户展现类别属于,尤其是在类别名称太长的时候
  • 簇状条形图可以让互相关联的长方形并列显示,借此比较频数;
  • 堆积条形图可以把长方形一个一个衔接起来,借此显示比例和总频数;
  • 每张图都变化多端

《乌合统计学》是我个人学习统计学的学习笔记和心得分享。我愿意将它分享给想学习统计学和数据分析的同学,希望用最简单的言语、最快捷的方式和大家一起成长。所有系列的文章内容皆出自于《深入浅出统计学》,大家也可自行学习!

乌合统计学|信息图形化:大饼和油条

 

本文由@刘震宇 原创投稿

转载请联系作者本人

 

产品壹佰非常欢迎产品界的各路大神、人神、女神、男神、土豪、屌丝来稿!

共同分享爱,明天会更好,小编等你来稿:ann@chanpin100.com

随意打赏

乌合之众
提交建议
微信扫一扫,分享给好友吧。