大数据产品经理必备基础知识——认识数据(中)

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
上篇文章给大家讲了数据对象和标称属性类型“ 大数据产品经理必备基础知识——认识数据(上) ”,接下来看看其他的几种属性类型。
大数据产品经理必备基础知识——认识数据(中) 属性类型

(2)二元属性

二元属性是一种标称属性,只是两个类别或状态:0或1,其中0通常表示该属性不出现,二1 表示出现。二元属性又称布尔属性,如果两种状态对应于true和false的话。

(3)序数属性

序数属性其可能的值之间具有有意义的序或秩评定。其值如小、中、大;成绩A+、A、A-、B+;军阶有列兵、一等兵、专业军士、下士、中士等;

序数属性的中心趋势可以用它的众数和中位数(有序序列的中间值)表示,但是不能定义均值。

(4)数值属性

以上介绍的标称、二元和序数属性都是定性的。即,他们描述对象的特征,而不给出实际大小的数量。而数值属性是定量的,即她可度量的量,用整数或实数值表示。数值属性可以是区间标度的或比例标度的。

(5)离散属性与连续属性

机器学习领域开发的分类算法通常把属性分成离散的或是连续的。每种类型都可以用不同的方法处理。离散属性具有优先或无限可数个值,可以用或不用整数表示。如属性hari_color、smoker、medical_test和drink_size都有有限个值,因此是离散的。

如果属性不是离散的,则它是连续的。连续属性一般使用浮点变量表示。

属性类型就介绍到这里了,下篇文章跟大家聊聊数据的基本统计与描述,感兴趣的同学可以去看看。

以上就是“大数据产品经理必备基础知识——认识数据(中)”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。

随意打赏

提交建议
微信扫一扫,分享给好友吧。