《数据分析咖哥十话》

这个Library是数据分析咖哥十话一书的代码库和勘误表，以及一些值得讨论的东西。

本书购买链接：https://item.jd.com/13335199.html

一刷勘误（已经在2022年9月的第二次印刷后改正）

整体

有些地方的RMF均应改为RFM。

P020

瘦狗是指市场占有率低及市场占有率低的业务。应改为：瘦狗是指市场占有率低及销售增长率低的业务。

P040

原输出图中单身的14和有朋友的19应该对调。

正确的图：

P052

userList =["咖哥", "马总", "小冰", "小雪"] #创建元组

改为

userList = ("咖哥", "马总", "小冰", "小雪") #创建元组

中括号改成小括号，才是元组。

P057

Out: 2.29999999999999998

改为

Out:0.72587994

这是为了和P56页的npArray05内容保持一致。

P057

npArray02数组中第四列的前三个元素，

改为

npArray02数组中第二行的前三个元素。

文章和代码都要改。

P149

1/5 = 0.5改为0.2

3/4 + 1/4 = 1 改为 4/5 + 1/5 = 1

下面一行的 1/2 和 1/4应该对调。

P246

也许得了感冒，改为，也许长了痘痘。

二刷勘误（尚未改正）

P133-134

X_train 的结构是 288行 × 4列（列数有误，应为 288行 × 3列） y_train 的结构是 288行 × 1列 X_test 的结构是 73行 × 4列（列数都有误，应为 73行 × 3列） y_test 的结构是 73行 × 1列

讨论

第三章预测用户的LTV

有小伙伴在异步图书的勘误区发表了下面的建议：

这是一个很认真的建议。根据不同的业务需求，的确是可以这样构建数据集的。严格来说，应该从每个用户的第一次购买日期算起，这个建议很好，因为我们希望根据头三个月的信息预测后续的LTV。不过，我们收集前三个月的数据时，并不是很确定每个用户都会持续购物一年。因此，我个人认为不需要选择持续购物一年的用户，即使客户流失，那么模型也应该吸收这些信息，从而具备判断这类用户因为可能流失而产生低LTV的可能性。

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
01 用户画像		01 用户画像
02 聚类分析		02 聚类分析
03 回归分析		03 回归分析
04 归因分析		04 归因分析
05 漏斗模型		05 漏斗模型
06 留存分析		06 留存分析
07 内容分析		07 内容分析
08 推荐系统		08 推荐系统
09 AB测试		09 AB测试
10 增长模型		10 增长模型
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

《数据分析咖哥十话》

一刷勘误（已经在2022年9月的第二次印刷后改正）

整体

P020

P040

P052

P057

P057

P149

P246

二刷勘误（尚未改正）

P133-134

讨论

第三章预测用户的LTV

About

Releases

Packages

Languages

lovebingheji/datalogic

Folders and files

Latest commit

History

Repository files navigation

《数据分析咖哥十话》

一刷勘误（已经在2022年9月的第二次印刷后改正）

整体

P020

P040

P052

P057

P057

P149

P246

二刷勘误（尚未改正）

P133-134

讨论

第三章 预测用户的LTV

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

第三章预测用户的LTV

Packages