本文目录:
1前言
2是什么
3为什么
4怎么做
5总结
一、前言
作为数据分析师工作中经常会接触要标签,指标,字段,维度,属性等,但它们之间有什么区别,怎么定义,相互之间有什么关联呢?这个问题,我无法作出直接的回答,也没想过去整理,归纳与总结,直到有一次领导问我相关问题,把我问蒙了,书到用时方恨少,都怪自己没有做过总结!
所以,经过上次的事件,周末我抽空花了时间查阅资料再结合自己的理解整理了一篇总结性文章。(属于个人总结,有不合理的地方,欢迎大佬到评论区指出,大家共同进步,谢谢!)
大前提:本文只是进行探讨,科普,共同学习,不涉及解决具体问题?
二、是什么
我们先对标签、指标、字段、维度、属性等下个定义,先解决是什么的问题?
2.1 标签
标签的定义:用户标签是构成用户画像的核心因素,是将用户在使用某个产品时所产生的行为数据(注册,访问,浏览,点击,下单,注销等),通过分析提炼后生成具有差异性特征的形容词。
举例说明,最常见的:QQ的个性标签,微信好友的标签等
标签的分类:
(1) 按标签类别
统计类标签,规则类,机器学习类(参考赵宏田老师的《用户画像方法论与工程化解决方案》)
(2) 从维度来划分
用户属性类,用户行为类,用户消费类,风险控制类标签
2.2 指标
指标的定义:指标是指将业务单元细分后量化的度量值,让复杂的业务流程可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。例如:达标率,合格率,成交量,退货率,次品率。
指标的分类:指标常用方法是指标分级方法和OSM模型
2.3 维度
维度的定义:维度主要分为定性维度和定量维度。(1)定性维度,主要是偏文字描述类如省份、性别、活跃度等;(2)定量维度,主要是数值类描述如收入、年龄等,对定量维度需要做数值分组处理。
指标体系和标签体系是由不同的维度组成,而维度是指用户观察、思考与表述某事物的“思维角度”,没有维度,单纯说指标和标签是没有任何意义的。
2.4 属性
属性的定义:事物的性质和关系,统称为事物的属性。
属性的分类:自然属性和社会属性
发表评论