Skip to content

Latest commit

 

History

History
24 lines (14 loc) · 1.8 KB

画像简介.md

File metadata and controls

24 lines (14 loc) · 1.8 KB

如果把一家公司比作一个国家,数仓的角色就是水电煤的管理,目的是让老百姓便捷放心的使用。而用户画像是为了提升数仓的价值,针对用户群的不同做精准服务。比如,在冬天时,北方要使用暖气,就要考虑煤的合理分配。而在南方,天冷只能开空调,尤其是夜晚,所以需要针对电的高峰期做特殊处理。不要问我为什么知道这么多,因为我在杭州已度过了三个冬天。

用户画像可以帮大数据走出数仓,让大数据不仅仅是数据,也能让大数据建设不仅仅局限于报表。

建模

用户画像建模其实就是对用户“打标签”, 从打标签的方式来看,一般分为三种类型:统计类、规则类、挖掘类

统计类

统计类标签又被习惯性叫作定量标签,通过客观数据计算得来。例如,性别、年龄、注册日期、近七天登录频率、近30天充值金额。这些字段都可以从用户的注册数据、登录数据、充值数据中统计得出。

统计类标签在实时性上还可以细分成离线标签和流式标签。这就要根据业务需求来定,如果实时性要求比较高那就必须把流式标签考虑进去。

此类标签构成了用户画像的基础。

规则类

规则类标签基于用户行为及确定的规则产生,也被叫作定性标签。在实际开发过程中,一般由业务人员及开发人员共同协商确定。

例如,对平台上"大R"用户的定义口径为“月登陆次数>10 && 月充值次数>20 && 月充值额度>1000元”。

挖掘类

该类标签通过机器学习挖掘产生,对用户的某些行为进行预测。机器学习开发周期长,成本高。

例如,针对用户最近的登陆频率以及相关行为预测用户流失预警。