-
Notifications
You must be signed in to change notification settings - Fork 0
/
search.xml
443 lines (443 loc) · 199 KB
/
search.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
<?xml version="1.0" encoding="utf-8"?>
<search>
<entry>
<title><![CDATA[2023年的生活与工作]]></title>
<url>%2F2023%2F12%2F28%2F2023%E5%B9%B4%E7%9A%84%E7%94%9F%E6%B4%BB%E4%B8%8E%E5%B7%A5%E4%BD%9C%2F</url>
<content type="text"><![CDATA[2023年的生活与工作好久没有更新博客了,今年好多同仁都有了突飞猛进的成功。有玩Web3财富自由的;有离职去做餐饮创业,一个月斩获100w营收的;有做直播带货流量变现的…我的2023也是成功的! 生活今年是结婚的第三个年头,真真切切体会到三十而立的实际意义,小家庭的经营离不开可观的经济基础,今年一整年我的重心全部在工作上,以至于老婆开玩笑说,除了产检好像陪小宝的时间几乎没有,听完后很愧疚。 从1月份开始,家里就张罗着迎接新生命的到来,我们提前半年把待产包、婴儿玩具和婴儿衣服准备好,做好通风和去甲醛措施,将最好的环境和心情送给即将来到的小生命。这一年老婆非常辛苦,非常感谢你的付出,孕期顶着不适症状依旧上班,依旧按期完成工作任务,为你们团队奉献自己的专业技能,也感谢烽火所有领导对老婆的照顾和呵护;因为您们的一举一动,感觉人间好有爱,很温暖,真诚谢谢你们。新生命的到来,小家庭人口数量由2变成3,男女比例由1:1变成2:1身份转变之后,我打心底感觉那种未来被喊爸爸所包含的责任越发沉重和艰巨,我开始自学一些育儿经验,开始和老婆琢磨着怎么成为一个合格的新手奶爸,过程很有趣,也取得突破性的成功,成功独自哄宝宝睡觉、独自完成宝宝的护理、能静下心来持续做一段时间的早教…在肺炎、流感等流行疾病的攻击下,不知不觉小宝已经4个月了,期望你未来的成长过程中平安健康、喜乐顺遂、无忧无虑。 工作由于2022年公司战略方向调整,稳定的产品线保收,赚当前看得见的钱,以满足整个公司的运营和扩张,让当下经营得更好;新型产品线做精益化管理,小队伍快节奏,赚当前看不见的钱,让未来我们走得更远。会议上我清晰记得老板那句话“每个员工在我眼里,都是一个家庭,我们作为管理层,需要扛起担子,为每个员工背后的家庭带来安全感,这是我们的使命和责任。”我非常佩服这种boss做事的底层逻辑,成功的企业家是推动社会进步的角色之一,他们每一个举动都将影响无数个家庭。当一个人到了一定的高度,或者说有了一些新的身份,思维会发生转变,价值观会出现质变,目标往往是更高更有价值的客观事实。我个人喜欢思考,非常喜欢尝试新的探索,只有这样我才会觉得充实,太安逸的环境,我会觉得自己很渺小,那种僵硬、静止,可以预判的节奏不适合我。于是我成功成为新产品的首要负责人,肩负着公司的重托,两年的探索和调整,终于迎来全员的喝彩和掌声:1.新产品吸引4个资方投资入场2.在9个月的迭代过程中,收到累计近20亿次请求,最高 DAU 3000w3.专职两个人的团队,6个月时间,为公司带来500w收入4.团队获得公司分发新产品收入利润的10%奖金今年团队最大的成长是:更加有凝聚力,目标一致、行动一致、承担结果的信心和魄力一致。我们更加有默契,这也是快速取得不菲成果的原因之一。相比过去两年,今年是比较顺利的,从种子客户成交,到大范围行业推广,每个人都付出了艰辛和汗水,不再是成熟产品线里面的螺丝钉各司其职,而是一个人肩负着更多的职责,从行动上提高效率和收益,因此团队里每个人都换了新车。 这一年,感谢大家的付出,也庆贺大家获得的回报,期望明年百尺竿头,更进一步。]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>生活</tag>
</tags>
</entry>
<entry>
<title><![CDATA[数学的艺术性]]></title>
<url>%2F2022%2F01%2F05%2F%E6%95%B0%E5%AD%A6%E7%9A%84%E8%89%BA%E6%9C%AF%E6%80%A7%2F</url>
<content type="text"><![CDATA[前言前不久和华为安全团队聊到我们产品的加密算法,据华为内部最新安全规范,我们产品加密方式需要小面积做升级优化,我系统性的学习了一遍市场上常见的算法和底层逻辑。由衷的佩服数学的艺术,真的赞叹数学的神奇。也许生活中只有两种学问,一门是哲学,一门是数学。 加密类型加密算法可以分为对称加密和非对称加密,对称加密在以前是非常常见的加密算法,随着应用和发展,后面逐步被非对称加密算法替代。 对称加密我们举个例子说明此类加密的运行过程和逻辑。假设张三(下面简称Z)需要将一个信息A传递给李四(下面简称L),为了防止在传递过程中被截获窃听导致泄露,Z 需要将 A 做一道转化再传递给 L。比如 Z 这样操作 A-1=A’,将 A’传递给 L,L 拿到 A’ 后,再用 A’+1= A。我们看一下过程,即使在传递过程中 A’ 被截取窃听了,其实得到的也不是最原始的信息。我们把上述过程中 A 称之为明文,A’ 称之为密文,中间转化加的1称之为密钥,加1这个方式我们称之为加密算法。A’ 可以公开传递,秘钥部分是我们需要保密的,不能让其他非相关人员知道。 我们可以采用任何合理的方式得到 A’,比如乘以1,或者除以1,或者乘以100000等等,算法可以复杂到变态的程度。无论多么复杂的算法,L 最终得到 A 其实是做了和 Z 完全对称(逆向)的一个动作,你加1,我就在密文基础上减1,你乘以100000,我就开100000次根号。这种算法不管多么复杂,中间经过多少道运算,只要拥有足够多的密文,是可以通过穷举或者观察规律从而得到秘钥。于是就有人想到能不能每发一次密文就把秘钥换一个,做到动态分发秘钥?从上面简图看的出来,每更换一次秘钥,需要将这个秘钥准确安全的告诉 L,这个时候秘钥分发传递又成了一个问题(秘钥动态分发问题感兴趣可以查询资料,已得到解决)。 非对称加密顾名思义,非对称加密就是 L 最终得到 A 不是简单的做了和 Z 完全对称的动作。还是上面的例子,Z 将 A 传递给 L,这个时候,L 会先生成一对公私钥 Q 和 P,在 Z 传递密文之前,L 先把公钥 Q 传递给 Z,Z 拿到 Q 之后,将 A-Q =A’ 传递给 L,L 拿到 A’ 之后不是简单的 A’+Q 而是 A’+P=A。整个过程不对称的地方就在这里,加密时候是减去公钥 Q,解密时候加上私钥 P。Q 和 P 之间的关联关系能够使得L 最终做 A’+P 这个动作得到明文 A。 RSA 算法1977年在麻省理工学院工作的罗纳德•李维斯特(Ron Rivest)、阿迪•萨莫尔(Adi Shamir)和伦纳德•阿德曼(Leonard Adleman)提出了一种非对称加密算法,算法名字就取三位教授的姓氏首字母R、S、A;此算法后面被广泛应用,下面一起看一下 RSA 的工作原理。 还是上面的例子,Z 将 A 传递给 L,为了顺利的进行,L 需要做些准备工作: 1、L 先找到两个质数。假设找到的为 V 和 W 2、做一道运算,得到一个数字X。运算方式为 X=V•W 3、取一个函数 F(X)。令 F(X)=(V-1)(W-1) 4、找出一组公私钥 Q 和 P。使得 Q 满足:1<Q<F(X) 且 Q 和 F(X)是互质关系。使得 P 满足:Q•P除以 F (X)得到的余数为1。找出这样一组数字并不难,比喻Q=3,P=11,F(X)=32 有了上面的准备工作,接下来看看实际的加密过程,Z 加密过程会做: 1、首先将明文 A 做一道运算,计算 A 的 Q 次幂得到 A1 2、再将 A1 除以 X 得到余数 A’,A’ 就是密文 3、Z 将 A’ 传递给 L 加密过程做完之后,L 将就行解密,L 做以下事情: 1、首先对密文 A’ 做一道运算,计算 A’ 的 P 次幂得到 A2 2、再将 A2 除以 X 得到余数(暂定为Y) 经过上面一系列的数学运算,似乎得到的 Y 和 A 没有任何联系,实际能够从数学上证明最终 L 解密得到的 Y 就是最初明文 A。看到这里,除了惊讶数学的神奇,更多的是敬仰数学的艺术性。 安全传递RSA 算法中, 加密过程公开传递的参数:公钥 Q、质数乘积 X 以及密文 A’ 解密过程需要的参数有私钥 P、质数乘积 X 和密文 A’ 假设某一个人窃听了公开传递的参数 Q、X、A’,他想得到 P、X、A’,就必须先求出 P,看一下上面第4步中 Q 和 P 的关系是 Q•P 除以 F(X) 余1,那要想通过 Q 求出 P,先得求出 F(X),而 F(X) = (V-1)(W-1),所以想要求出 F(X) 得先求出 V 和 W,从上面第2步可以得知 X = V•W,问题转化为:已知 X,想要求出 V 和 W。到这里应该已经发现了,这其实就是质因数分解。如果 X 很简单,比如 X =21,那 {Q=3,P=7}就是一组,但是如果 X 是一个1024位数字,这种大数质因数分解,目前人类是无法做到的,用两个足够大的质数相乘得到一个1024位的数字可以做到,但是给你一个1024位的数字,让你分解出两个质数,人类的算力目前无法完成。 最后普通计算机的计算能力某些场合已经超过人类,量子计算机的算力能力是普通计算机的数十倍。每隔一段时间,银行或者身边常见的 App 都会提示你更新密码或者证书,这其实就是在规避被强力破解的风险;生活中没有绝对的安全,所谓的安全无非是中间的信息差暂时不会大面积公众。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[2021年的生活和工作]]></title>
<url>%2F2021%2F12%2F07%2F2021%E5%B9%B4%E7%9A%84%E7%94%9F%E6%B4%BB%E5%92%8C%E5%B7%A5%E4%BD%9C%2F</url>
<content type="text"><![CDATA[ 您好, 这里需要密码.]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>生活</tag>
</tags>
</entry>
<entry>
<title><![CDATA[浅谈项目管理]]></title>
<url>%2F2020%2F04%2F28%2F%E6%B5%85%E8%B0%88%E9%A1%B9%E7%9B%AE%E7%AE%A1%E7%90%86%2F</url>
<content type="text"><![CDATA[各个岗位都有管理无论你的职级多高,能力多强,在企业中第一优先级的角色都是“员工”。你天生需要与身边的伙伴协作共事,让他们充分知晓情报是你的义务。而“信息同步”在这个过程中扮演着非常重要的角色,最基础最常规的事却发挥着最有利最有效的作用。 为什么要做信息同步呢? 管理将承担风险降低风险当代职场已经很难出现完全独立的工作事项了,让信息公开一定有利于降低项目风险。团队中不同的角色视角是完全不同的,研发关注成本与实现,视觉侧重于好看与美观,市场着眼于怎么宣发,销售想着能不能卖钱,老板只关心划不划算。在立项之初,各侧参与者对同一件事的理解大概率是不一致的。没做好信息同步,要么项目组织不起来,要么运行到中段执行冒泡,要么在收尾阶段频繁暴雷。公开信息,让不同角色用不同的视角来观察项目,澘在风险提前提出,在事发之前就做充分准备,极大降低风险。切记,信息公开代表着合作与尊重。坦诚是互相建立信任的敲门砖,别浪费建立革命友谊的机会,为合作团队提供调整空间。一个工作事项的完成往往需要多个角色共同参与。举个例子: 12月15日我们要发布一个产品,市场计划在当天召开发布会,销售为了业绩決定开启促销活动。假使项目出现延期,产品质量低,功能不完善的情况,便需要配合部门的同事做好计划调整。发布会的口吻可以从“产品发布“调整为”产品公测“,销售将促销“的活动玩法变更为”邀请试用得大奖”。 问题每天都会有,总有办法来解決。后面单独起文章展开讲解。切记,当出现不可逆的情況下越早让信息公开,挽救的可能性便越大。 为上司负责每个职场人都有上下级的关系,扁平化管理的团队也会有类似导师( Sponsor)的角色存在。经常听到有同学抱怨自己的工作成果没被看到,错失升职加薪的机会觉得委屈。这仅仅是从我们自己的角度的分析结果,那么从领导的角度呢?有没有我们可以提升的空间? 作为“领导”,可能会同时跟进N个项目,无法事无巨细了解每个项目的细节。在这里你有义务积极主动让 ta 知晓你的工作近况。作为“领导”,能力或是资历是强过你的,他会从资源和经验的角度给你一些支持。比如: 这件事曾经做过已经有成熟的落地方案,你只需要在确定的方向上继续优化放量;或者这件事别的部门已经在做了直接协调资源与他们合作推进即可。 为了支持团队成长,我们都会给新人独立负责项目以成长的机会。免不了会因为经验不足犯错误。这种时候你的“领导”会是被问责的第一对象。如果你没做好信息同步,他被他的“领导”用一个不知情的方案和结果问责,这是管理失控。切记,不要搞这种乌龙让“领导”连为你解释的机会都没有。 保留证据团队之间协作共事,难免会遇见冲突或者扯皮的事情,不管是合作伙伴疏忽“没记住”,还是能力欠佳。我们作为项目负责人都应该主动避免这类问题发生。信息同步就能很好解決此问题,不要扯皮看会议纪要,看邮件就好了。里程碑事件也有利于项目组的士气提升,在大型项目时里程碑事件尤其重要。切记,不要做无谓的争论。除了让威信受损,你什么都得不到。信息同步工作做不好,我们认为这个项目负责人是失职的。 管理该同步哪些信息一般来讲我会主动同步以下几类信息:项目进度 项目进度 里程碑事件 项目风险 项目阶段性结论 项目进度完成度与时间度 完成度=已完成工作量/总工作量 时间进度=已用工作天数/计划交付工作天数我们一般会在项目启动时对既定工作进行工时估点,做到工作事项可衡量。比如: 项目完成度为35%,对比时间进度为45%,存在10个点的进度落后。我们需要通过其他方式追回一些进度。 里程碑事件在项目管理里方法较为常见,常见的里程碑事件有立项、方案评审、阶段性结果、提测、发布等。封闭开发类项目,立项、提测、发布等可以不做为里程碑事件做信息同步。其余情况下都不建议缩减里程碑事件。你要知道没有人愿意在没有存在感的团队中做事的。要积极向合作伙伴们释放确定感。 项目风险项目过程不可能一帆风顺,每天都要处理各种问题。常见的风险有:项目延期、需求变更、人员变动等。遇见风险不可怕,可怕的是风险不可控。所以当你进行风险向的信息同步时,请对风险进行分级「重要/不重要,紧急/不紧急」不要个风险就汇报,也不要害怕风险被暴露。如果能对风险提供你力所能及的解決方案,团队会愿意积极配合你工作的。比如: 「项目延期」xxx项目具有延期风险项目成员xxx3月1日至14日休产假,生产力短缺建议抽调基础项目部xxx进行弹性人力支持 模板访问时存在跨域问题,加载速度绶慢,负责人xx正在进行技术攻坚,预计耗时3天 以上两个风险都是事实,都是为了你的目标服务的,一场已发生的事故说明一定存在数个风险,而每个风险又指代了尚未被发现的数十个隐患。不是所有的风险都要被解决,但风险需要被管理。 阶段性结论项目进程中我们会进行各种正式或非正式的沟通,讨论。这些谈话往往以达成共识和计划 review 为目标的。这种情况下,做好信息同步是必要的。我更建议用会议纪要这种方式同步以下几方面信息: 参与人(注明主持人,与会人)时间,谈话发生的时间主题,讨论了哪些问题结论,基于问题的结论,后续计划,动作时间负责人。 每个企业和团队情况各有不同,当你为同步什么信息挠头时,我建议大家使用这个原则来决策「这个信息对于项目进程是是否起正向作用?」「如果是,讲”是”的重点,如果不是,讲不是的重点」 当然每个人对于正向的理解有差异,多向你的上级或导师请教,听听别人的意见。同步时未处理好信息密度,说不到重点或者事无巨细的婆婆嘴都是不理想的选择。这部分能力缺失的项目负责人是不合格的。 怎么进行信息同步企业中,我们常用:邮件、即时通讯工具、WIKI、 Teambition等,也会通过每日站立会议,周例会等方式同步。不同的方式定位也存在较大差别。 邮件:非常正式的信息传递工具。你要同步的信息具备「严肃正式,后续可查询」两个特性,请使用部邮件 即时通讯工具:相对宽松的沟通工具,临时的,讨论性质的内容大多在这里发生 站会:口头告知昨天做了什么,今天准备做什么,需要参会人知道的及需要团队支持的 会议是个特殊的话题,我会在后面单独展开来介绍。下文只介绍线上的信息同步方式。 邮件怎么写一篇好的汇报邮件,我会分成标题,收件人,正文内容,附件几个部分来介绍。标题 标题的原则很简单,一句话说清楚重点。比如: 『会议纪要』3月28日模板市场周例会会议纪要『方案确认』移动端适配模板市场需求方案,请xxx确认 建议使用“「类别」+具体事宜”的结构来书写邮件标题。目的是方便协作伙伴们快速判断这封邮件的类型是否需要看下去,是否需要立刻马上处理。对了,关键信息记得前置以便于在频幕较小的移动设备上仅通过标题便能判断。 收件人邮件的收件人类型分为发送,抄送,有的还包含密送功能。不同的类型代表的业务含义也有区别。发送列表中填写的大都是需要知晓信息的同事。抄送列表中一般填写与项目相关,但非直接负责的同事。比如其他部门接口人的上级等。除此之 外,建议 follow之前让信息被更多人知道的原则,添加上项目组同事都在的邮件组。密送列表中的人会收到邮件但不会在邮件中明文显示,所以用法比较特殊,自己琢磨吧:) 还有一些通用的细则,比如有的同事同时使用好几个邮箱,为了信息到达效率请提前确认好收件邮箱;也不要偷懒发邮件组就不再单发收件人,因为有的时候同事会因为邮件较多设置收件规则 「只看收件人包含自己的邮件」导致你的邮件遗漏 正文内容一封清晰的邮件正文,我会按照如下顺序书写: 先说结论:节省大家的时间先说结论,是否查看得出结论的过程由收件人自行判断。 再说过程:证明你结论的完整推导过程,背景,实施方案,以便于收件人知晓更多细节来做判断 后续计划:结论对项目的帮助是?我们的后续准备怎么做,需要什么支持? 写邮件是个艺术,不同的人汇报同一件事也会有截然不同的效果。以上三点基本可以帮我们把事儿有效率地说明白。有兴趣的话,我后面会结合些实际案例展开聊聊不同类型邮件的写法 附件附件一般是服务结论的物料格式类型各有不同。这里就唠叨一点,如果你的邮件中需要添加附件,在你写邮件时第一时间将附件上传上去。我们见过太多邮件遗忘附件而后续追发盖楼的乌龙了。请避免这种不职业的情况。 即时通讯工具一般大家都会使用微信,企业微信,钉钉等即时通讯工具进行沟通。在工作环境中,请你谨慎使用语音功能,大多数情况下语音的效率是弱于文字消息的。每个伏案工作者在沟通工作时收到五、六条长达60秒的语音消息都不会愉悦。当然你是老板的话,你想任性请随意..其实也不建议 同步给谁终于说到最后一个环节了。同步信息给谁值得你花点儿时间好好设计,它和你做信息同步的目标强相关。比如: 你汇报了因为xxx要休年假导致团队生产力下降,那么你的同步对象一定要包括具备资源调动能力的人 原则:与你的项目相关的人,你希望Ta知道你表现的人 所以常见的同步对象如下: 你的上级,导师等 你的团队,与你一起推进项目的人,你的业务方,和你项目有依赖关系的上下游某些特别的人(能看到这里,你肯定很聪明又勤奋,自己意会吧) 最后信息同步是成为项目负责人的基本功,是你成长为一名可信赖组织者的必备条件。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[如何理解机器人互动?]]></title>
<url>%2F2020%2F02%2F28%2F%E5%A6%82%E4%BD%95%E7%90%86%E8%A7%A3%E6%9C%BA%E5%99%A8%E4%BA%BA%E4%BA%92%E5%8A%A8%EF%BC%9F%2F</url>
<content type="text"><![CDATA[前言现在机器人已经在各个领域都有沉淀,并且不同的行业都有自己完整的价值体系,在工业层面机器人一直是提高效率,取代人来完成某些动作和事项。比喻仓库机器人、快递机器人等,今天要和大家一起聊的是遍布在互联网各个角落的机器人帐号,这些帐号可能是充数,也可能是完成一些互动,也可能是制造一些数据来完成 KPI。作为一个产品经理我们该怎么理解这些机器人呢? 分析理解基于自己接触过的聊聊 原来做社区的时候考核的主要互动指标是转赞评三种行为,狭义上聊这个问题可以只基于转赞评来分析具体策略。这块我浅显得接触过,基于价值观考虑后浅尝辄止再扩大一层就是把营造社区氛围都算上去,那机器人影响到发布、关注等行为也算。 再广义一些,扩展到社区产品以外的产品,例如我现在做的教育产品,涉及到业务和用户交互的环节都算互动,这个环节也有不少机器参与的部分。可能对机器人评论的思考有所参考。 1.社区内容冷启动 用脚本直接抓取內容,內容打标签,分配给一雄机器发布者发布。很多年前做社区的时候,为了让社区内容不至于太贫瘠用过这个方法。当时大家普遍不重视版权观念,我们也主要抓取国外内容为主。 随之带来的问题是为了让机器人显得真实,不得不继续做自动回复、自动点赞等功能,各种机器簸略混在一起,可能单条策略看似问题不大,当各种策略交织成网 状,社区里内容产生就变得杂乱无章。严重影响了社区氛围的培养。 2.賞造互动氛围 在做社区和做秀场的时候都做过类似的需求 做社区的时候,后台准备了一大批机器号,并且定时改名。这些机器人对发布内容数小于N条的发布者自动回复、自动点赞。回复的内容是从预先录好的语料库里随机挑选的。后来做了个升级版,语料库也是从网上抓取的,如果当初有精力再做得细致一些,可能还要根据发布者、发布内容的属性区分不同的语料库。 这个角度能精细做下去的纵深还是有的。先抛开自然语义识别,对于没有能力处理的属性、内容的关键词、内容所属的分 自然语义的团队来说,也可以根据发布者类、标签等,从不同的语料库挑选车轱辘话回复给用户。顺着这个场景延伸,就是用户与机器人相互关注以后的自动打招呼等功能,”小肚皮”里面很多互动信息我猜测应该都是机器人发出来的。 但是现在回头看,这些做法纯属杀鸡取卵。对于內容社区,我应该预先想好要激劤哪些内容,激劤哪些创作者,而非为了数据指标一味冲数据(这也是在大公司做内部创业项目很容易跑偏的事情)。去年做另外一个社区产品的时候,虽然我们也有互动数据的指标,但是从产品和运营策略上,首先区分了哪些人是创作者,我们 给予集中奖励激励他们生产内容,哪些人是参与者,我们营造热闹的氖围让他们旁观、互动。最终没用任何“机器人”手段,互动数据(转赞评)也提升了非常多。 当然如果社区的主要目的不是为了沉淀內容培养氛围,而是为了通过积累流量快速变现,做一些假繁荣也是无可厚非了。 3提高运营效率 在做教育产品的时候会重点考虑这类需求 核心诉求是提高运莒效率,降低人工成供更多与用户互动的抓手,二是通过技术 本。主要手段一是通过技术手段为运营提手段代替人工完成某些行为。 我们先用纯人工的方法迭代几版运莒SOP,然后分析其中哪些环节可以产品化,哪些技术可以替代人工。例如 1)家长添加助教微信时,助教用脚本模拟点击通过微信好友。实现方式有很多,PC微信插件、安卓端的脚本、虚拟机上跑模拟器等。2)老师两先录入初频/音频语料,机器根据学生回答拼接成教师反馈,通过机器/人工手段发给家长。 (3)通过简单的OCR识别批改试卷。高级点的可以识别学生手写内容自动批改 初步一点的只需要识别题干位置,然后显示出预先录好的批改笔迹,来帮助助教快速批改试卷。这个层面的核心并不是机器策略的复杂度,而是要理解业务需求,判断哪些环节可以用机器来替代。因为对于教育来说,有的时候效率反而不是好东西,适当的人工参与,培养客情关系相比之下更重要。 对应到社区内容上,虽然用机器人伪装成正常用户发布评论在我看来是违背价值观的行为,但如果机器人是知乎那种用来册评论的小助手,应该会有效率工具的作用。 总结下来是:“如果是为了提高产品的核心价值,通过机器人介入提高效率,往往能产生价值;如果是为了提高虚荣指标,通过机器人营造假环境(无论对公对私)可能会杀鸡取卵”。 最后定期做产品经验和看法交流,可以渗透到各个行业,深刻理解行业的法则,一些浮在上面的貌似正确的观点,在实战和刁钻的环境下有些“门外汉”,毕业后,我第一要感谢的是 @纯银 。同时感谢 @二红 的倾囊相授。]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[企业 IM 产品的一次覆盘]]></title>
<url>%2F2019%2F07%2F05%2F%E4%BC%81%E4%B8%9A-IM-%E4%BA%A7%E5%93%81%E7%9A%84%E4%B8%80%E6%AC%A1%E8%A6%86%E7%9B%98%2F</url>
<content type="text"><![CDATA[互联网寒冬手里最近负责的项目有两个最近要交付了,辛苦了小伙伴们,看着你们一步步成长,很欣慰。每个项目做完,我都会做一个回顾和总结,看看哪里可以走快点,哪里可以走稳点,哪里可以做得更好。从去年8月份开始,整个互联网都在动荡,资本市场退出,诸多初创企业由此而亡,而且勉强度过艰难时刻的各大二流互联网公司也都开始裁员。 网易、美团、京东、小红书、拼多多这些口碑红遍大江南北;平时给人一种“入该司是一种荣幸”的互联网新贵也都开始裁员。我有一个武汉的朋友就是在这个黑暗时期离开斗鱼的,不过他现就职中国移动。 其实无论什么时期,一件事情的发生是有预兆的,不信你去看看,2018年是互联网公司上市数目最多的一年。上市前玩的是融资、市场、规模,上市后玩的是盈利、开销、业务收缩和市场聚焦。上市浪潮之后,肯定会有一波人员优化,在寻求融资的过程中投资人除了看重产品的规模,团队的规模很大程度上决定最后能不能拿到钱。可能这也解释了为什么公司的惯性做法都是:上市前疯狂招一波人,拿上市后分股权做诱惑,等上市钟敲响后,和谐部门业务,优化人才,部署长远有利益公司健全的发展战略,所以一部分人幸运的拿到了 N+1,不幸运的就是被迫“裸辞”。 当时网上流行这样一个段子:“2018年是过去10年里最差的一年,也是未来10年里最好的一年”。 互联网模式互联网的本质是服务,而如今传统的服务模式,都已经根深蒂固,口碑和名气难以动摇。比喻电商服务淘宝、游戏市场的腾讯游戏。在逆境中获得机会和重生,要么走弯道,和对手服务同样领域,从时间上打,先占领市场,然后病毒蔓延,要么创新从细分领域去切入;服务分工具服务(所有平台型)和技术服务(所有提供存储、计算型)。我在17年设计过一个 IM 产品,公司人员常住外地;oa流程外网无法完成;远程会议效果欠佳;文件传输走邮件和社交软件方式存在更改存档的重复步骤,这是当时直观的痛点总结;这款工具型产品在调研阶段,总结了大部分企业面临的相同问题: 1、移动端份额越来越大,企业迫切需要移动协调办公:企业内外的任何时间、任何地点的资源及信息交互 2、市场的变化和进步,企业需要节约人力成本,开源节流:减少成本、提高效率、增加产出 3、企业投资方的介入,需要越来越多的系统支持:专业和高效 市面上的产品(企业微信、TIM、钉钉、美团大象、叮咚、倍洽、Worktile、班聊和纷享销客等)存在数据泄露和隐私外泄的风险,当时的规划是:做出雏形,第一步完成信息传递,提高办公效率,以协作的方式减少沟通和时间成本。产品上线后,主打简化流程步骤,提高信息收发效率,转移“开会决策”模式到“多渠道协作”上。在使用反馈数据中我得到了很大的启发: 1、工具型产品要做到两个极致。效率、专业。 2、IM 产品是从生活出发并且服务工作的。这是产品的大场景,所有的设计和出发点都是在这个基础上去展开,然后场景细分,落到工作和沟通中,把信息不对称和工作流程的复杂度降到最低,以人力资源和员工为两个主要的角色构成用户群体,在线上把“职场是生活的一个子集”体现和刻画出来。 3、企业 IM 产品商业属性 > 社交属性。起初做熟人社交的微信,现在成了工作的首要工具,虽然钉钉的垂直切入垄断了大部分老板的市场,在实际使用上面关于沟通大家不自觉的回到了微信,所以在竞品分析的一大段时间里,总会看到企业 IM 产品中多多少少有社交的“影子”,其实这是没有认清产品立足和产品定位的一个表现。 4、IM 产品的最大价值是提供一个虚拟的“职场”。随着科技、理念的发展,未来的办公不再是大家围着桌子坐在一起,这个虚拟的职场到来你可以理解成刚开始互联网的到来一样,未来的办公模式和最开始大家的在上冲浪类似,冲浪是把网民和网络内容链接起来,职场是把工作和员工链接起来。这里有个数据,以18年全国缴纳社保的数据近8亿人来算全国的职工数,那么就有近8亿的用户市场,每个月最少21.75个工作天数,这个体量数据还仅仅是算国内的。 5、企业协作工具的最终远景是成为生活的拐杖。虚拟的职场是生活的一部分,一个月30天假设有21.75天离不开,不言而喻,这已经是生活的拐杖了。 上面几条经过不同企业的调研和沟通,最后都得到了肯定和一致的认可,我将上面几条细分,和大家一起分享下这次覆盘。 我的覆盘第一:我在看《沸腾十五年》和《马化腾的腾讯帝国》的时候,里面有个人物介绍不多但是提到次数非常多,这个人就是张志东。为什么两个极致偏偏是效率和专业呢,现在20年过去了,张志东为 OICQ 设计的框架几十年都没有变过,专业的沉淀和合适的选型决定一个产品的未来,这就是技术沉淀下来的专业性。效率,一是产品自身迭代的效率,在创业和新产品如雨后春笋的时代,时间是成功的首要素;二是产品的体验效率。在看《推荐系统实践》这本书的时候,无论是哪一种推荐算法,最后衡量其好坏的就是“满意度”。算法是产品的一部分,满意度一样是衡量产品推出后是否成功的唯一指标。产品体验是绝对的优势,身边这样的例子很多,像微信、QQ已经非常成熟,但是它们都有个特点,产品大的方向和形态始终如初,而且新功能的推出都是有灰度测试,这是将损失和失败带来的影响降到最低的一种做法。所以,技术和架构应该专业;产品迭代和产品体验应该高效。 第二、企业 IM 应该是以公司和单位为组织的。主要联系和消息接收对象应该是本公司的同事,可以有合作伙伴的好友关系链,但这个链是虚的,对于跳槽和离职,这种关系链会回到微信,因为我身边离职后的同事基本很少再联系,有也是微信之间的寒暄,所以钉钉里面非好友状态的A和B脱离同一个组织之后是不能相互发送消息的。 第三:企业 IM 产品和社交没有关系。社交细分可以是C端的交友社交也可以是B端的商业合作社交,但是有关项目的合同拟定以及相关审核流程是脱离社交属性的。所以产品的根本是贴近流程服务工作,实际的去解决用户问题而又能保证数据安全,所以这个产品更多的是商业性质,将人与人之间的交互带了鲜明的工作、商业特色。 第四:每个阶段都有属于这个时代的产物和特色。从目前的趋势来看未来办公形式随着5G的到来肯定会发生质变,无论是办公形式还是质量和大家办公地点关系不大,这是一致期盼的,没有实施的原因来自多方面,一部分是规章制度的强制要求,这是人的问题;一部分是通讯速度缺陷带来的效率问题,这是技术问题。形成虚拟的职场是个宏观的愿景,就像30年前没有谁预测到最后把人链接在一起的是“互联网”。 第五:这点应该是最重要的。其实很多时候,当我们回首再去看历史相当于知道谜底后去看谜语,很少回去思考为什么?关于腾讯和微信的三本书,我看完第一遍之后,觉得只是一个历史的回顾和介绍,再看一遍后我认识到腾讯现在的成功如果把那几个创始人换掉一个也许早就倒下了,他们非常清楚自己的目标和职责。微信V1.0的时候功能非常简单,但是后面对张小龙的采访能够看得出来,他对微信生态其实一开始就有个宏观的布局。而对于企业 IM 产品来说,需要有短期的一个战术也需要有个长远战略,当工作和生活因为这个产品把分界线模糊化之后,效率和信息不对称自然就会解决了,而依赖的产品因此变得不可或缺,成为日常生活的拐杖,可能真的是工作使我快乐的现象。 其实看到上面,很多人会问一个问题:我企业为什么要用你这个产品?我用户为什么要用你这个产品?这个问题在任何一个产品冷启动时都会面临,微信开始用户也不用,企业也不愿意去申请公众号发文,后面用户发现上面可以了解很多新闻咨询,企业动态,科技文章,感觉比较贴近生活又能掌握网上最新讯息,用户慢慢沉淀下来了;企业发现这里读者人群比较聚集,文章和咨询内容阅读量和转化率很高,便慢慢去创作优质内容,最后广告商发现流量,纷纷合作。于是用户、作者、广告商构成了三角互相依赖的关系,这就是微信的生态,打不破这个关系,微信倒不了。那反过来看企业 IM 类产品,其实用户、企业在里面扮演的角色和微信生态中两个角色非常像,就看怎么抽丝剥茧了,感兴趣可以给我留言,我们交换想法,分享感悟。 下面是我画得几张草稿]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(六):K-Means 算法]]></title>
<url>%2F2019%2F01%2F31%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E5%85%AD%EF%BC%89%EF%BC%9AK-Means-%E7%AE%97%E6%B3%95%2F</url>
<content type="text"><![CDATA[物以类聚,人以群分。在机器学习中,对于海量的数据,经常要做的一件事就是找出他们之间的特征,将这些数据归类,就像德米特里·门捷列夫一样把各个元素整齐的排在一起,后面形成了元素周期表。 在行业中这个做法有个专业的名词叫“聚类/分类”,今天要和大家一起分享的是聚类中最常见的算法:K-Means 算法。 前言在开始之前,必须也必要让大家知道“监督式学习”和“非监督式学习”的区别,因为这个概念非常重要,只有根深蒂固的记在脑海里,对于学习机器学习有很大的帮助,思维模式也不一样。 监督式学习:输入的数据有标签。 非监督式学习:输入的数据没有标签。 K-Means 算法属于非监督式在非监督式学习中,聚类任务是使用最多的,而 K-Means 算法是聚类任务中最简单、最好理解、运算最快的一种算法。聚类的主要思想就是物以类聚,人以群分,在 K-Means 算法中实现起来主要分以下几个步骤: 定义一个 k 值,这个 k 决定了聚类后有几个类别 从数据中随机选出 k 个数据点做为初始研究对象 然后把剩下的数据点当作投票者,投给谁,自己以后就跟谁。他们投票的方式是计算自己与已确定的研究对象的距离,谁和自己距离小,就投给谁 第一轮投票完成,为了公平,重复投票,这次的初始对象就不是随便选,而是在已投票的 k 堆中选取 重复上面的步骤,直到和预期的一致 实例为了方便说明,我模拟一组数据,如下图 我们随便定义6个点P0、P1、P2、P3、P4、P5,在二维座标系中我们可以直观的看出,前面三个点在一堆,后面三个点在一堆。接下来我们通过 K-Means 算法验证一下是不是像我们实际看到的这种扎堆特征。 设定 K 值开始投票我们定 K = 2,那么在6个点中随便选择两个点当作初始对象,这里我们就选 P0(0,0) 和 P1(1,2),接下来我们分别计算剩下4个点 P2、P3、P4、P5 和P0、P1的距离 对比之后发现,在剩下的4个点中他们都和 P1 离的近一些,所以他们4个把票都投给了 P1,这时候就有两组 A 和 B,A={P0} ,B={P1,P2,P3,P4,P5}。 开始第二次投票很显然 A 组只有 P0,所以 P0 这次还是初始对象,但是 B 组中现在有5个数据点,这次在 B 组中选取初始对象就不是随便选了,我们选择平均这5个点的横、纵坐标来形成一个之前没有的虚拟点位 P’ ,把P’当作 B 组的初始对象。那么 P’((1+3+8+9+10)/5,(2+1+8+10+7)/5) = (6.2,5.6)。这是新一轮投票结果 这次投票后形成的 A = {P0,P1,P2},B = {P3,P4,P5},这时候虚拟的数据点 P’ 就剔除。 再次投票按照上面的逻辑和步骤,形成新一轮投票,这是两个新的初始点位分别是Pa’=(1.33,1),Pb’=(9,8.33),新的投票结果是 这次投票后 A = {P0,P1,P2},B = {P3,P4,P5},这和我们前面看到的”前面三个点扎堆,后面三个点扎堆”现象一致了。 我们可以发现,经过上面几次投票,数据已经出现了收敛,聚类到此结束,实验的结果和我们之前真实看到的完全一致。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[一年的总结]]></title>
<url>%2F2019%2F01%2F15%2F%E4%B8%80%E5%B9%B4%E7%9A%84%E6%80%BB%E7%BB%93%2F</url>
<content type="text"><![CDATA[对一年的怀念,其实是从公司准备年夜饭那一刻开始的,仿佛在这一年中发生的一切都会随着年会结束画上完美的句号。当岁月潮水般从我脚下退去,我发现我带不走任何东西,那种无奈驱使着每个人去学习,去完善去充实自己,我喜欢学,也喜欢动手,因为只有这样我才能把我学到的和我认识到的真实的展现在我眼前,这样才有机会去覆盘,去反思。 判断自己在这一年中是否有所成长,其实很简单:看看你现在做的事,放在过去两三年你能不能干,如果能,你已经浪费了一年时间;看看在过去面临的问题,你现在能否从容解决,如果能,在这一年,你成长了很多;是否提高了沟通效率、是否学会了做工作计划、是否新学会了一门的编程语言,并且能实践应用、是否学会了管理项目、是否学会了向别人传达自己的产品/工具理念等,这些都可以当作衡量自己成长的指标。 2018年闲暇做的一些事这一年中在不影响负责的5个项目进展的前提下,自己学习了很多便于工作,提高沟通效率的技能。负责项目期间,项目经理和产品经理的区别非常大,我深深的感觉到你做事的时间很少,开会和沟通消耗的时间占据一天工作时间的80%;提高效率才是保证项目正常进展和事半功倍的最佳捷径。从事数据分析,经常需要做数据 Ectract,数据 Transform,数据 Load,数据 Compute,很荣幸在这个过程中重新熟悉了 Hive,Hbase,Kafka,RabbitMQ 和 Kettle,新学习了 Streamsets,Flume 和 Spark,掌握了主流的数据可视化工具 Tableau 和 DataV 以及海致 BDP,并且为公司成功搭起自己的数据可视化平台和基于 Hadoop 的大数据分析集群。 python 充能笔者工作中离不开数据,一切和数据相关的事都会有所接触,后来我又加强学习了 python,跟着教程、书籍结合自己的兴趣做了些自己觉得很有意义的事,再回过头去看那段时光,还是觉得这次尝试和充能很有意义。 爬取知乎用户数据并做出用户分析;爬取了本人微信好友头像并拼接成大图;写了合并多个 Excel 脚本;分析了退役篮球巨星科比生涯投篮位置数据(基于 pandas);爬了拉钩“数据产品经理”的招聘数据;将《腾讯传》分词,并自动拟写章节摘要… 自己动手去和程序接触,这在和程序开发组交流和沟通的时候有种潜在的默契,我动手去做这些事,一方面对程序实现一项功能的过程有个真实的体验,在管理项目过程中和技术组沟通有个铺垫;一方面我能了解现在行业上主流的语言趋势。我不用去想着开源,去想着造轮子,我做得这些只为在工作中把沟通的隔阂和信息不对称带来额的阻力降到最低,做最有效率的交流和产品需求传达。 有了自己的博客从开始工作那一年,我就喜欢写文章,喜欢和别人分享,也愿意聆听别人,开始是在简书上写作,中途工作定位的问题,产出逐渐减少,停更了一段时间,年初3月份搭建了自己的博客,后来的文章写作基本上都是在这里和大家分享。至今,写了32篇文章,获得15357位同仁到访。 沟通协作工具基于 slack 的轻打扰模式设计的沟通协作工具。工作中微信、企业微信、钉钉等沟通工具已成为主流,但从用户体验和效率来讲,市场还有很大的发展空间。 如何高效的做到信息分流?以群组的形式汇聚“一帮”人或者“一类”人,自由加入、自由发言、公开讨论… 如有效何构建私讯体系?私讯体系和单聊不一样,不仅仅是一对一的私密聊天,涉及到不在线模式获取信息逻辑,在线模式规避信息打扰逻辑。 如何构建交互传递?分两大块,一块是发言方式,图片、文字、链接、语音、视频、表情等,这些传递载体的展现方式和融合方式怎样做到简单明了,轻量易用;另一块是回复和通知方式,表情回复,层级回复,已读未读提示,被@提示等等,这些回复和通知方式怎么样在遵循高效和不打扰的理念下和用户交互? 其他工具和辅助功能如何引用?指名讨论、评论、转发、收藏、日历、消息置顶和在线协作等等 上面提到的问题都是我曾经用市场上沟通协作工具后沉淀的问题,有些在我设计的工具中已经解决,有的正在构思和设计,闲暇时间产出的原型,文档没有完善,有同样爱好的朋友,后续可以一起来做。 搭建数据仓库的一次实践在笔者一次项目实践中,有几个数据模型需要应用,从数据需求调研到模型设计到最后测试上线,中间一大部分时间都花在需求确认和数据仓库设计上,由于底层应用数据涉及到业务系统,上层应用所需要的展示数据复杂且复用性很高我们选择构建数仓,以人、车、案为事实表,基于时间、事件、属性为维度表搭建一套完整的数仓。下面是脱敏后模拟的 Excel 表,感兴趣的可以看看我之前的文章 PMcaff 的积累这是我最喜欢的社区,汇聚全国顶尖的产品经理、UI/UX设计师和高级运营人员,大家在社区中发表观点,解决疑问,分享干货文章。社区注册需要邀请码,邀请码的获得好像是根据你发表答案后其他用户对你的认可数量以及你原创文章所获得的喜欢数量,具体的我忘了。下面是我帐号下累积的邀请码,等待优秀的有缘人,送完为止。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[积分体系和排序算法]]></title>
<url>%2F2018%2F11%2F19%2F%E8%AE%A9%E6%88%91%E5%81%9A%E4%B8%80%E6%AC%A1pmcaff%E7%9A%84%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%2F</url>
<content type="text"><![CDATA[背景好像在今年四月份的时候,pmcaff 社区开放注册,在官网上线后的一两个月里,我们“优秀答主”群里几乎都在反馈,社区的质量下滑严重,主要表现在:问题重复、无人回答、精选文章陈旧、使用 BUG、产品学徒的作业出现在“待回答”里面等等。下滑的原因一部分是开放注册平均了社区用户质量,一部分问题来自产品运营的重心转移;于是在很长一段时间里,我很少上线,零散写了几篇文章。今天如果我是 pmcaff 的产品经理,我会通过以下几个点来做产品迭代。 存在的问题pmcaff 社区是一个以交流为中心,以产品、UI、交互为目标,汇聚一类或多类从业者和爱好者的社区。交流其实是信息传递,pmcaff 的信息传递有两大模式:发文、提问。我今天要和大家一起分享的是提问这一块,根据反馈和自身体验,提问这块的问题非常大: 没有限制,没有门槛,造就了没有质量。 没有回报,没有收获,造就了没人回答。 没有算法,没有排序,造就了没有聚合分发。 没有标签,没有归类,造就了没有精准推荐。 … 迭代的方法针对上面的问题,我细化成两个大模块:第一:门槛;第二:算法。 做产品一定要系统和框架,没有框架和大局,产品骨架就不明确,功能就会遗漏,涉及到流程的可能就会死循环。系统的看待提问,可以归纳为两个重要的角色,提问者和回答者(我们把旁观者也当作回答者,只不过他的回答操作永远没有按下 Enter 键)。 提问者对于提问者,最直接的办法就是提高提问门槛,以下是我做得一个表,行为和积分权重可以根据运营后的数据再优化,“+”代表获得,“—”代表扣除 回答者贡献回答是无私的,为了保证每个问题被尊重,每个答案有价值,那就必须告诉用户,不是所有人都适合对这类问题发表答案或者不是所有人都可以随便发表答案,诸如“卧槽”、“666,这个问题问得好”、“泻药,balabala”、“Nice 兄dei”的没有任何价值的回答,就扼杀在门槛 在一个以UGC为产物的的社区,提高一群贡献内容的用户发表内容的门槛,可能是个败招,但做为一个产品经理社区,在中国仍然属于一个小众社区,做细做精,保证质量再扩增数量可能更容易获得亲莱和驻扎,因为很多的“产品经理”在大多数公司都是个职位而已。 算法逻辑算法逻辑我思考了很久,在现有的产品层单纯做算法没有意义,也比较棘手,我个人的看法是,提问者提出的问题肯定源自对产品的思考,那么问题就可以归类,我的想法分以下几点: 提问时必须选择问题属性,站在整个社区的角度看,所有的问题都有个总的归属关系,这个功能的展现形式不做限制:标签、主题等等都行 每个属性下的问题应该具有聚合一类用户的能力,比喻推荐,分发;为了能获取最新最热的内容,属性下的问题应该有个科学的排序算法 Pmcaff 的答案的排序现在做的超级烂,按时间和按认可数都不是一个最好的筛选项,而且对于排序在主动获取而不是被动检索的场景下,规则应该有算法来决定而不是手工筛选,下面这个回答仍然是第一位。 无论出于什么,一些普遍认为“水”的答案,在爆光上应该往后站站,这关乎社区的印象和用户体验。 具体实现接下来就是具体实现这两块了,积分有积分规则,算法有算法规则 积分 积分只是一个方式,目的是提高社区创造内容的成本,因为在目前阶段能限制质量的也只有门槛了。 积分的数额设定依据人民币面额值:1,2,5,10…100,在我设计这个功能之初,积分和人民币一样,需要“赚取”和“花费”,所以在数值设定我就偷了个懒。提问之后在赚回“积分”的道路上并不坎坷,因为标记为好问题之后,剩下的时间都是获得积分。奖励积分遵循一个原则:为社区带来新用户的行为就大大奖励、活跃者多奖励。每天登录的奖励可以自行设置,是动态随机还是递增的,你来定。 排序关于属性、标签以及推荐和分发是一个庞大的体系内容,今天不做展开,我今天主要分享关于答案的排序如何通过算法实现。在介绍之前,先削除大家的的一个心理障碍,“算法”其实没有那么高达上,就是实现一个功能的数学逻辑,要么是一个公式,要么是几个公式,要么是一个规则文档。 要做答案的排名,我们先整理出影响这个答案排名的一些指标: 从上面这张图可以得到和答案息息相关的以下几个信息: 发表时间 认可数量 水数量 分享数 评论数 那么算法就围绕这几个指标展开,这里切忌将一些“私有”属性列入到算法里面,如:答者的粉丝数、回答数、认可数等等。因为算法的意义就是让大家在同一个起跑线上,排名只由答案的自身属性决定。 我们先理一下常规的思路:第一:发表越早(越陈旧)的答案应该稍微靠后,因为理论上应该让新的评论给更多浏览者看到。第二:赞成和水之间应该有权衡关系,有一个衡量的指标来告诉算法当前的答案是属于认可还是不认可(水)。第三:评论和分享和总得浏览人数有关,不是评论越多答案越好,也不是分享越多答案越好。基于这些分析,我先给出算法公式 上面的公式以运算符号为间隔分成以下四个部分 我们一个一个来看 字母SS:每个答案最后的得分,程序就是根据这个值来把分值高的答案排在上面 右边第一部分 以10为底的对数,这里说一下,以10为底的对数和以 e 为底的对数,在很多算法中都会利用,爱数学函数的朋友可以多回顾下高中函数知识,在这里表示:当出现大家都认可这个答案现象之后,越到后面投认可票,对得分越不受影响。看看 Q 代表什么意思 上面公式中,x = 认可数量-水数量,表示这个答案在大家心中的认可程度。当:认可数量 = 水数量,Q = 1当:认可数量 != 水数量,Q = |x|,当差值不等于零,其实隐含告诉你一个信息,这个答案已经在“一边倒”了。 右边第二部分 t = 答案发表时间 - 问题发表时间,t 可以直观看出这个答案够不够“新鲜”(离当前时间越近)。 公式中 y 是个变量,当普遍认可这个答案的时候,y = 1;当普遍觉得这个答案很水的时候,y = -1;当两方观点不分伯仲,y = 0,右边第二部分值为0,也就是说,在争议非常大的时候,答案的排名已经和时间参数 t 没有关系了。 45000秒是个常数,等于12个半小时。从这个公式可以看出 t 是个固定的常数,越“新鲜”的答案会得到更高的分。 右边第三部分 m:评论数。这里算人头(独立IP),1个人评论10条,m = 1。 n:答案分享数。 w:阅读数。 可以看出,如果浏览人数非常多,但和文章的交互(评论、转发、点赞、收藏等)非常少时,这部分值越趋近于0;可以有效筛掉一些标题党,让真正有价值的内容尽快赶上来。 再回头重新看一下公式 平时如果有研究的朋友应该已经发现了,这个算法就是根据大名鼎鼎的 Reddit 社区帖子排名算法修改的,我结合我要做的产品,将算法做了修改,在没有数据见证的情况下,好与坏我没办法给出答案。真正上线之后还是需要数据反馈,再次对算法“调教调教”。 最后积分体系的产品,我相信任何一个规则,只要这个用户正常,最后的结果都是用户积分越来越多,大家可以考虑下到达一定的积分后,如何使用积分?关于后面这个算法从数学角度分析,还是有很多问题,有了答案的排序算法,那么问题该以什么样的算法呈现出来是个最关键的步骤,大家可以自行思考,后面更新的文章会给出答案。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[国际贸易数据的可视化]]></title>
<url>%2F2018%2F08%2F08%2F%E5%8F%AF%E8%A7%86%E5%8C%962017%E5%B9%B4%E5%85%A8%E7%90%83%E8%BF%9B%E5%87%BA%E5%8F%A3%E8%B4%B8%E6%98%93%E5%95%86%2F</url>
<content type="text"><![CDATA[进口国际贸易,最根本的思维和模式还是共享,但是这种共享是用钱买个所需,或者以所长赚几个币。比专业的解释在这 2017年全球进口贸易 据美国统计数据,在1929年至1934年期间,世界贸易下降了66%,造成这一现象的主要是在斯姆特-霍利关税法通过后发生的贸易战,如今打响的贸易战,对中国的影响是最大的。 进口量 Top15: 出口2017年全球出口贸易: 出口量 Top10: 和我们的关系出口贸易直接拉动我国的GDP增长,由于我国的国情,出口贸易占GDP增长的1/3以上,我们从几个数字看一下这意味着什么 我国每年出口在2.26万亿美元,我国人口在14亿左右,分到每个人是1614美元。 而德国虽然排在第三,每年向国外发出1.4万亿美元商品,他们却只有8300万人口,也就是没人每年有18000美元的商品出口。而把美国和德国比较下,会发现,美国其实对出口的依赖性比较低,一年1.55万亿美元的出口,每人约4800美元。对出口贸易依赖性月强的国家,在贸易战中受到的打击和影响就越大,我们假设一个极端的情况:世界完全封锁,杜绝贸易,那么我们国家有1/3以上的GDP等于0,这是个什么概念,如果以每年的GDP来纵观改革30年的发展,从经济的角度看,现在的中国现状会退回去很多年。 对比下美国的进口和出口,相差差不多8600亿美元,可想而知贸易是多么的激烈。 世界18大贸易商品 美国:主要是石油和医疗设备。对石油的进口量大出口量也大,这些高度专业的工业,美国廉价进口低级石油加工成高级石油在高价出口。 德国:主要是汽车和制药。德国是汽车出口大国。 中国:主要是在计算机、广播设备、珠宝等产品出口量最大;同事对石油和飞机的进口量排在首位。 在贸易中美国占有绝对的优势,从贸易的产品和方式就可以看出,低成本进口高价出口他国,这相较于其他国家而言,是个双倍的收入,加上他依赖性低的特性,提高关税,这个货币流动的口子就越来越窄,你要买所需就要付出高价,你要卖所长就要付出阿额外的高税。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[长生生物“疫苗订单”的可视化]]></title>
<url>%2F2018%2F07%2F24%2F%E9%95%BF%E6%98%A5%E9%95%BF%E7%94%9F%E5%AE%98%E7%BD%91%E2%80%9C%E7%96%AB%E8%8B%97%E8%AE%A2%E5%8D%95%E2%80%9D%E7%9A%84%E5%8F%AF%E8%A7%86%E5%8C%96%2F</url>
<content type="text"><![CDATA[首先感谢 V 站 ID 为 “wstart”大神提供的数据,真的非常感谢。 这篇文章,我是带着很多的疑问去写的,比喻:这些疫苗分别是什么?哪些疫苗销量最多?生产企业都是长生生物吗?价格是不是贵得离谱等等。 本次分析的数据由上面提到的前辈提供,我在他的数据上做了些处理,我将16个省份(直辖市)的数据合在一起,其中”price”一列做了清洗(因为部分含有单位) 总览数据 本次数据均取自2016~2018三年最新的数据,其中订单销往省市共计16个;涉及疫苗的种类239种;涉及生产企业144家,涉及检测报告企业107家。 涉及企业 这是负责检测报告的企业,也是参与检测超过10次的企业。细心的朋友应该发现了,长春长生生产有103个订单,但是却只检测了102次,从后台的数据看得出,生产、报告的企业有99%为同一个,就是:”我自己生产,我自己检测,我自己报告”。那么我可以认为,长生生物这家公司有一个订单或者一种生产疫苗是没有通过检测的。后面的分析我将证实这个看似不严谨的假设。 销量前十 流感疫苗最多,其次是乙肝之类的。重组乙型肝炎疫苗没有重复,后面有个括号,有细分汉逊酵母和酿酒酵母 产地类型 绝大部分是国产,非常小的一部分是进口(双价不知道什么类型) 订单变化 阶梯上升。 疫苗价格 最贵的是人用狂犬疫苗, 最贵的疫苗的生产企业 最贵的疫苗是叫‘成都康华’生产的 进货总量 数据中没有湖北的数据,其实我最想看看湖北的 疫苗去向 这个维度的分析是我后面补上的,我比较关心有这个没良心的企业生产的疫苗最红销往何处,对比上面的柱状图,可以发现,他家生产的疫苗没有销往“天津市”。 由长生生物生产 他家只生产狂犬病疫苗,还记得开篇时候我的假设“长春长生这家公司有一个订单或者一种生产疫苗是没有通过检测的”吗?这条数据很明显,检测报告企业为空。 最后 这张图我留了快一年了。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[一次收入调研]]></title>
<url>%2F2018%2F07%2F21%2FV-%E7%AB%99%E4%B8%8A%E7%9A%84%E4%B8%80%E6%AC%A1%E8%B0%83%E7%A0%94%2F</url>
<content type="text"><![CDATA[真的感谢大家的投票,为期两天的投票结束,再次刷新了我对程序员这个群体的三观。本次投票,自主、自由、公开,没有攀比和等级高低之分。下面是投票的结果。如果里面有一条数据来自于你,希望您能在本文下面给我留个言(无需登录和注册),小吴同学非常感谢。 本次收入投票,我失误了,开始直接选取“金数据”平台,链接发出去后我才发现这个平台有数据限制,后面补上腾讯投票平台的链接,导致数据分散在两个平台。 数据总览金数据平台的有效投票总数 腾讯平台的有效投票总数 总得投票数为468+676=1144. 大家普遍的学历 由于将985、211和普通的一本区别开,数据显示大家的学历普遍是二本。还有部分朋友为了“皮”那么一下,选择“我不想告诉你学历”。 工作城市 北京还是程序员的天堂。 工作年限 工作年限都处在1年到3年,那些工作十年以上的大佬,估计都是技术总监和架构师吧! 月薪 大家月薪普遍在10~15这个范围,其次是15~20,再次是5~10,然后20~25。这样来看,貌似没有帖子中那么恐怖,都是年薪几百万,月薪都30k 往上啊! 使用的语言 还是 Java。好多朋友建议语言多选,我觉得大家或多或少都会一两门语言,还有全栈的朋友,但是总有一门主要的语言是你经常使用的。 工资的去向 好惨,不知道是不是间接反应程序员这个群体普遍单身。单身的朋友我今年过年给你们发女朋友~ 单一来统计这个显得很呆滞,可能你现在和我一样迫切想知道,那些高收入、高学历的都在哪个城市;或者来自哪个城市的投票者把钱都交给了老婆等。 本次投票,在北京月收入20~25占比最多。有很小一步部分5以下,可能是无效数据。 博士的月收入真可观,书多读点是有好处的。 这个图有点奇怪,那些工作一年以内的,且月收入有50以上,不知道这样的公司在哪?还招不招人? 我回去一定要看看,青岛、郑州、常州、宁波这几个城市的投票数。 随着工作年限的增加,工资交给老婆占比上升,有了老婆和家庭算是一件幸福的事吧。 开始没有加这个交叉,后面看留言我补上的,我觉得月薪一定程度受语言的影响比较小,受工龄和城市影响较大吧。 完。 数据准确性无法控制,样本数据有限也不能概全,但有说明性,从统计学的角度,抽样具有代表性,但是这个范围可能很局部。所以社区的月收入是不是人均30+我不清楚,起码这次投票结果在一定范围内否定了这个以前从没有被证实过的说法。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[一张图看看世界200个 unicorns]]></title>
<url>%2F2018%2F07%2F18%2F%E4%B8%80%E5%BC%A0%E5%9B%BE%E7%9C%8B%E7%9C%8B%E4%B8%96%E7%95%8C200%E4%B8%AAunicorns%2F</url>
<content type="text"><![CDATA[这些都是私人创业公司,价值均超过$10亿,地图是根据公司原产国而不是确切的地理位置绘制。 再来补一张,看看2018年科技互联网巨头公司全20名,基本被中国和美国包揽。 其中今日头条也就是“字节跳动”和美团并列20名,但是从某种意义上来说,滴滴算不上科技公司。百度被蚂蚁金服甩在了背后也确实令人唏嘘。 这张图根据估值来排名,若真是站在产品的角度,结合公司的创新技术和在行业内的影响,按照上面的排名顺序,今日头条这家公司不应该在滴滴后面。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[数据可视化中国35个城市GDP]]></title>
<url>%2F2018%2F07%2F18%2F%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96%E4%B8%AD%E5%9B%BD35%E4%B8%AA%E5%9F%8E%E5%B8%82GDP%2F</url>
<content type="text"><![CDATA[最近,我看到一篇《2018年互联网趋势》的报告,报告中一张数据可视化图吸引了我,从展示和图片上的属性,我猜到这不是国内统计出的报告。进入今天的正题。这是统计中国35个城市的 GDP,这些经济体相当于一个国家。 在国外的经济学家或者数据工作者眼里,中国似乎总有一层神秘的面纱,该文中有这样一段话: With 1.4 billion people and the third-largest geographical area, the country is a vast place to begin with. Add in explosive economic growth, a market-oriented but Communist government, a longstanding and complex cultural history, and self-inflicted demographic challenges– and understanding China can be even more of a puzzle. 译: 这个拥有14亿人口和第三大地理区域的国家是一个广阔的起点。再加上爆炸性的经济增长、一个以市场为导向的共产党政府、悠久而复杂的文化历史,以及自我造成的人口统计学挑战,理解中国可能会更加令人困惑 这篇文章中,排在第一的一个评论。 他们在研究中国的经济发展明确指出三个经济大区。 Yangtze River DeltaWith a combined GDP of $2.17 trillion, which is comparable to Italy, the Yangtze River Delta contains cities like Shanghai, Suzhou, Hangzhou, Wuxi, Ningbo, and Changzhou. Pearl River DeltaWith a combined GDP of $1.89 trillion, which is comparable to South Korea, the Pearl River Delta has cities like Hong Kong, Guangzhou, Shenzhen, Foshan, Dongguan, and Macao. Beijing-TianjinWith a combined GDP of $1.14 trillion, which is comparable to Australia, this megaregion holds the two largest cities in northern China, Beijing and Tianjin. The two cities are a 30-minute bullet train ride apart. 译: 长江三角洲长江三角洲的GDP总和为2.17万亿美元,相当于意大利,包括上海、苏州、杭州、无锡、宁波和常州等城市。 珠江三角洲珠江三角洲的国内生产总值合1.89万亿美元,相当于韩国,拥有香港、广州、深圳、佛山、东莞、澳门等城市。 北京-天津这个大城市的GDP总和为1.14万亿美元,相当于澳大利亚的GDP。这两个城市相距30分钟的子弹头列车。 国内外文化差异非常明显,暂时忽略这个数据的准确性问题,可惜居民生活幸福指数很难量化,不然加上这个数据对比,报告似乎更据有现实意义。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[斗鱼,直播界的缩影]]></title>
<url>%2F2018%2F07%2F12%2F%E6%96%97%E9%B1%BC%EF%BC%8C%E7%9B%B4%E6%92%AD%E7%95%8C%E7%9A%84%E7%BC%A9%E5%BD%B1%2F</url>
<content type="text"><![CDATA[2011年腾讯提出泛娱乐概念:积极构建以音乐、动漫、影视、游戏、演出、周边、文学等多元化形态组成泛娱乐生态。在这七年当中, QQ 音乐、微信读书、腾讯视频等产品的市场占有率纷纷说明腾讯的这一战略布局,带动了年轻人喜欢玩,喜欢多元化的躁动之心。2017年,《人民的名义》、《三生三世十里桃花》、《王者荣耀》、《战狼2》引爆全民追琢的热潮。 2018年,《偶像练习生》、《创造101》、《这就是街舞》引爆综艺流量的同时创造了众多赞助传奇。 英雄联盟给斗鱼带来了巨大的流量与其说给斗鱼,可以说给所有做游戏直播的平台都带去了巨大的流量。那个时候,没有移动直播、没有“泛娱乐直播”的概念,那个时候入驻的都是英雄联盟比赛场上的解说以及一些退役选手,这种新型的媒体内容产业链就此形成:用户需要这种提升游戏技术的教学视频,现学现用,既真实又丰富;而游戏本身需要这样的视频做市场宣传,扩大用户群体提高玩家粘性;直播平台算是一个中间体,提供展示(主播)和获取(观看用户)的平台,这三者形成完美的利益共存体。(现在再看直播这类产品,在没有资本搅局的情况下,不需要提供硬件,不需要独立发展种子用户,不需要自主产生内容。产品形态清晰,模式简单,更重要的是,市场前所未有的大,而且监管处于真空,这意味着,未来的路,怎么走,自己说了算)。 斗鱼给英雄联盟提供了强大的用户回流效应我身边这样的例子很多,很多以前忠实的 LOL 玩家,后来由于工作生活都开始沉淀了,但是近两年直播的生活化,娱乐化再次唤回他们回到游戏界面。这是所有用户的一个特点,也是人性的一个心理:强有力的刺激可以让用户找回初期对某些产品的那份执着。在产品里面,这种心理称作“情怀”。游戏玩家关注比赛内容,比赛解说成为 LOL 里的另一个焦点,他们在平台直播,带来流量,直播内容又去刺激用户回到游戏,这样闭环的产品形态,非常的经典,和当初电商的购物闭环几乎如出一辙“我需要商品,你提供商品,我付钱,你发货”,都是基于一个简单的需求,将服务做到最大化,而直播,精神上享受,电商,则是物质上的满足。 直播内容的衍生和探索2016年,行内称为直播元年。这一年直播平台如雨后春笋,纷纷挤进市场,秀场直播更是抢占风头无数,这种形式我个人觉得犹如早期出现综艺节目;娱乐化甚至有些低级趣味,为了博人眼球,打情色擦边球不在少数。经过两年的行业摸索和孵化,移动直播基本稳定了整个局面;随着移动直播内容的监管提升,凭借低级趣味博人眼球的直播平台纷纷关停整改,以斗鱼为首的直播平台专心深耕内容,内容质量和用户体验明显上升。 直播生态产业链日益完善,内容供给、平台运营、传播扩散和服务支持的模块趋于成熟;加上行业监管促进平台良性发展,内容、产品、商业模式和技术交流创新成为核心驱动力。 秀场直播归根结底还是娱乐,好玩,这种媒体化产品,回归到用户需求本质,还是精神上的消遣和满足。泛娱乐直播平台为了吸引用户粘性同时尽可能的针对B端客户产生商业价值,更应该在内容,功能,产业等方面战略布局。整合营销、创新互动营销、精准营销以及“直播+”营销应该成为首要的战略方向。 几个有趣的数据 2016年4月中国媒体/娱乐 App 月度有效时长百分比 2018年4月中国媒体/娱乐 App 月度有效时长百分比 明显看出,两年的时间,用户在娱乐/媒体性产品的使用上,有个量级的转移:只有通讯类产品使用时长在下降。而增幅最大的属视频类,媲美通讯聊天类。我想在某种意义上这个数据似乎可以反应今年腾讯较头条的那阵风波,没有流量或者流量的转移是一个公司最大的危机。 2017年1月至2018年4月中国移动直播用户规模变化 2017年1月至2018年4月中国移动直播日均使用时间 2016年至2018年中国网络直播平台的监管事件时间线 左边是2018年4月统计直播用户的城市分布,右边是2018年4月直播收入分布 观看直播的原因和观看直播的类型 斗鱼的成长路线早期斗鱼平台,只是一个传统的弹幕式直播平台,以至于无法满足主播和用户的强互动性,从而会出现主播将用户转移到 QQ 或微信这社交通讯平台,毕竟在一个群里,而且 IM 确实在某些时候比较方便他们之间的唠嗑和互动,因为在直播的那几个小时以外,用户和主播处于一个隔绝的状态,所以,后来有了鱼吧。 游戏萌生了电竞概念,电竞丰富直播平台内容;而电竞带动了电竞外设,这个产业离不开电商,在直播生态圈电商也是直播内容可考虑发展的一个方向,早期的主播纷纷将自己的粉丝导流到淘宝,我觉得这是直播平台的一大损失,这种粉丝和主播强粘性的特殊关系,几乎主播说一粉丝不说二的,在后来斗鱼上线的鱼购,将这种模式正式推出市场,没有官方的数据,这个产品模式的推出效果如何就不得而知啦。 时至如今,斗鱼生态系统包含直播、秀场、游戏、鱼吧、鱼购、线下活动等内容,在如今内容分发和短视频的风口上,我觉得斗鱼的未来可以往以下几个方向布局: 精准内容分发。首页的推荐不光是热度算法,个性化推荐适合一切媒体内容应用,根据主播设立内容标签,结合用户使用习惯和订阅属性推荐新主播是个快速迭代粉丝效应和鼓励新主播产生优质内容的捷径。 完善鱼吧。鱼吧的聚焦点在于将主播的琐碎(非直播状态时)时间充分利用在用户在线时间上,那么这个出发点就多了,有了直播的基础,散发思维短视频可以在这个模块和主播玩起另一个互动,这种模式简单,市场成熟,玩法门槛低的产品已经被用户肯定。 数据驱动。两三年来沉淀的用户数据,面对规模这么大,甚至数据基本结构化呈现的企业,好好利用数据是一种战略,建立数据仓库,结构化输出内容或者根据主播数据以及互动特性服务于 B 端企业是个好的方向,毕竟现在主播孵化已经是个行业了。 产品升级。娱乐化传播方式,趣味性的互动,如: PK、组团等手法增强用户参与感,建立品牌情感。这种模式适合主播也适合用户,既然是攀比心和贪之欲,那就进行得彻底一点;场景化营销,避免过于生硬的广告,传达品牌信息,从而导购到鱼购;利用碎片化和网红效应,直播用户几乎是跟着主播走,主播在哪,那批用户就在哪;渠道变现,嘉年华这种线下活动可以逐步分割在线上进行,早期的品牌效应在线下更能建立,但长远发展这种官方活动在线上进行更有利于扩展(PGC,如:已经成型的赛事举办;电竞类的娱乐综艺等),随着新鲜感的逝去,审美疲劳等用户效应会增大线下活动的风险;国际化,突破语音识别和实时翻译的技术难点,将产品国际化,娱乐化到全球,不同国度和文化的用户在没有语言障碍的情况下,文化差异带来的新鲜感更有利于建立用户粘性,这将促使游戏直播朝着移动段进军。 直播营销发展相关布局 内容精品化。为了保证用户规模、用户付费的健康增长,同事扩展更多的商业变现机会,直播平台应该发力 PGC、PUGC内容,依靠原有平台优势,打造精品化、差异化的直播内容。几个案例:陌陌在《蜘蛛侠:英雄归来》的电影预热期间,对主演进行直播采访;YY 直播在世界杯期间推出足球赛事精彩活动;映客举办的樱花女生盛典活动等均通过优质的内容输出为平台和广告带来双赢。 互动玩法的升级。2018年直播行业基本稳定,各平台应该着力开发更有趣的互动玩法,如各类小游戏、PK赛、团战等,进一步吸引用户粘性,同时,通过权限开放,互动游戏开放,付费直播等方式增加收费项目,尽可能扩大商业变现,例如,YY直播推出的欢乐斗,告白墙等玩法,映客推出的直播对战、多人直播间等玩法、斗鱼推出的直播 PK等等。 社交化。直播平台的商业逻辑本身是基于社交关系的用户自愿付费行为,社交关系和心里欲望也能带来更多的消费场景和付费动力,以发帖和 LBS 为主要形式的社交逻辑纷纷登上各大直播平台,斗鱼的鱼吧,映客、YY等平台的“同城”等等模块,已经逐步趋于成熟。 网红效应。直播平台进一步渗透网红产业,纷纷开展“造星计划”建立网红生产到营销的闭环商业体系,利用优质、丰富的网红资源,开展 ToB 的商业服务,通过创新有趣的内容话题,为直播红人造势。 最后“现代管理学”之父彼得·德鲁克曾说:“战略不是研究我们未来要做什么,而是研究我们今天做什么才有未来”。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[今日的今日头条]]></title>
<url>%2F2018%2F07%2F04%2F%E4%BB%8A%E6%97%A5%E7%9A%84%E4%BB%8A%E6%97%A5%E5%A4%B4%E6%9D%A1%2F</url>
<content type="text"><![CDATA[令人敬佩的张一鸣 张一鸣,1983年出生福建龙岩,家庭事业单位背景,父亲早年是市科委工作人员,母亲是名护士。大学就读南开大学,曾由微电子专业转入软件工程。他是一个非常有想法,不干于现状,敢于创新的创业者,2005年毕业初期,短暂入驻过微软。 早期就组成3人团队开发企业IAM协同办公系统,后面参与创建酷讯网站,时至2009年,创立九九房,拿下150W用户,占据房产类产品第一名,2011年底辞去九九房CEO,12年初创立字节跳动科技有限公司,从此将信息、内容、分发型产品画上新的时代高度。(早期的时候张一鸣、程维、王兴创立的饭否后面被下线,感兴趣的可以查查资料) 头条的产品家族 头条的产品涵盖的领域非常的广泛,从新闻咨询到视频媒体,从图片社区到垂直型餐饮、直播、短视频,甚至炒股、汽车、电商、广告、企业协作都渗透中外,在印度等互联网不发达的中南亚地区更是有较强的发力,这些战略上的布局成就了如今这个令人恐怖的创业互联网公司,其实一家公司最后居高不下,当你扒出他的历史,总能发现惊人的相似点:在面对竞争激烈的市场,顶着互联网谩骂的声音,他们悄悄将步伐和眼光铺向各个领域,收购、投资、发布新产品等,在每一个行业占据一份土地,如果非得给这个举措和经过给一个名字不可,我会用“吞噬”。 跨时代意义的个性化推荐算法互联网的发展时间相比其他金融、政治显的非常短,周期更是缩短一大截,这离不开互联网“快”的特性。早期流量时代,信息索取,有 Google 和百度等搜索引擎,中期内容带动互动效应,引领社交狂潮,自发式传播将信息带给更多人,也把更多人带入互联网,这种“人产生信息,信息服务与人”的蝴蝶效应,带来了很大的一个问题就是信息内容分发,之前我们担心从哪里获取咨询,现在我们担心如何获取想要的咨询,太多了,随便打开一个软件或网页,铺天盖地的信息,精准索取成了网民迫切的关注点,这个时候今日头条应运而生。 今日头条利用AI算法模型,将信息精准分类,做到“合适的内容让合适的人看”。关于头条的算法准确度,不在讨论范围内,这里不做评判。这种推荐算法的触发点是你的浏览习惯,你浏览在先,后台的算法只会记录你的阅读习惯,通过行为日志按照推荐模型给展示内容,不可能全部做到“懂你”,千人千面只是一个说法,没有完美的算法,只有更完美的模型优化方案,早期今日头条我也反感过,但是做为一个 PM ,我肯定这种技术也真心希望这种算法模型能应用到更多的产品中来,我觉得犯错才会进步,而且这种“常人不为而为之”的气魄很令人敬仰。不去尝试新的技术和模式,总在陈旧的模式上发展,落后是必然的,退化绝不是因为时间,而是自己不愿意改变现状。 独树一帜的算法驱动产品设计A/B测试和用数据说话是头条对待问题和产品的常用手段。6年前,今日头条诞生之际,取名的时候就很讲究,在同个产品模式以不同名字抛向市场,通过数据,最后“今日头条”在各项数据占据第一,于是就命名为“今日头条”。2012年,那个时候移动互联网可以说还没有起步(如果对互联网的状态没有感知的标准,我说个数值大家想一下:11年才有微信。如果说移动互联网的发展离不开APP,那么微信和 iphone 的兴起才是移动互联网发展的催化剂。)一个创业公司敢于尝试新的模式和技术,用数据来打造一个产品的名字,这在当时算是一个非常创新的做法,这也是后来头条大多数产品都成功的原因。 通过数据驱动打磨产品设计,现在在头条内部应该是标配。最近几年,和数据相关的科技、模式、产品炒得已经不知道什么是真什么是假啦。我始终认为,真正重视数据的公司,不会在意如何宣传,而是在执行上面淋漓尽致的体现。为什么叫“今日头条”?问答领域的产品为什么叫“悟空问答”?为什么有“西瓜、火山”还有打造“抖音”?汽车栏目的产品“懂车帝”的名字怎么由来?等等看似不起眼的行为举措,好思考一下“为什么”,你抽丝剥茧的能力会上升一个档次。 政府、竞企的打压巨人的道路是坎坷的,腾讯也好,阿里也罢,在企业发展之初,都是步步维艰。 那个用文字几乎可以调侃一切的超级产品于2018年4月10日驾崩,享年6年零一个月。 面对国家广电的强力整顿,头条的部分产品已被关停,虽然产品触碰了法律的边缘,但是,某些产品的价值是不容忽视的,因为能让人记住并且好感的产品已经不多了。 四面受敌是残酷也是挑战。无论是从信息出发的头条,还是从人出发的腾讯,在产品终端闭环中,都侵犯了各自的利益,利益面前不能让步,也让不了。 头条的情怀舆论声中,褒贬不一。 如果擦边球可以给一个产品判死刑,最该第一时间关停的是直播产品和 QQ。QQ伴随着90一代的青春逐渐将曾经的“通讯、空间、等级、装扮、贵族”等富含时代意义的产品棱角慢慢磨平,更多的演变成游戏载体,情色/赌博内容的根据地。一个通讯工具类产品,原本内容是由用户群体产生,这种内容是轻量级的,是辅助日常使用而诞生的,搭载的内容,无论模式还是架构都遵循一个道理,由用户来回到用户那里去。 在法律和人性的边缘,头条产品做得也很逊色,甚至有些过激。头条产品有个很大的特色:重运营。这是所有媒体属性产品拥有的共性,既然是媒体,还是看内容,既然是内容,总会有创造直指欲望、钱财内容的作者,这就造就了一个问题:审核和监管。所以后面众多媒体报道出,头条改变之前的说法: “张一鸣说今日头条不会也不需要设立传统意义上的总编辑,忌讳价值观先行,不干涉是对内容最好的管理” 在内涵段子被关停的第二天2018年4月11日张一鸣道歉: 今日头条将强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核。 内容审核是所有媒体企业最头疼的一环,不仅成本高而且难度大,随着国家广电局的政策收紧,未来 AI 审核是个很大的方向,在 NLP 领域,对文字和篇幅性质的内容已经有很大的成就,这种初步的内容审核就是需要一个敏感和疑似“擦边球”的关键词库,当未来一天,AI 不单单只是辨别一篇报道的正反面而是能真正读懂的时候,也许审核这个关键的一环可以交给一套算法来完成。就在前不久,头条公布“灵犬反低俗助手”上线,也许,这是个开始,也许,这会成为传奇。 头条的情怀,不同于网易云音乐,不同于小米,也有别于锤子,在某种意义上,头条在产品层面的创新和一贯“要么不涉足,做就爆款”的犀利手段比在面对媒体摄像头和话筒前用言语掩盖怠慢的做法来的爽快,说没什么用,你做出来才是硬道理,不切实际的东西不仅误导群众,也会让自己越飘越高。默默无闻做自己,轻轻松松打天下的人,最后都会成功。 文中所有的观点都属个人,阅后即过。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[python、R语言、机器学习、数据分析、文案设计等资源分享]]></title>
<url>%2F2018%2F05%2F31%2Fpython%E3%80%81R%E8%AF%AD%E8%A8%80%E3%80%81%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E3%80%81%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E3%80%81%E6%96%87%E6%A1%88%E8%AE%BE%E8%AE%A1%E7%AD%89%E8%B5%84%E6%BA%90%E5%88%86%E4%BA%AB%2F</url>
<content type="text"><![CDATA[python 篇分享是一种最好的学习方式,这些材料都是我平时学习时候整理的, 如果涉及侵权和其他问题请联系我,秒删。在此感谢伟大的原著作者为爱学习者做得贡献,真诚感谢。也希望来下载的朋友可以留下一个评论(无需注册即可评论),帮小吴涨涨牌面˚≤˚ think pyhon 中文版 链接:https://pan.baidu.com/s/1YrWmuswpcdJxYeF2HG8eZg 密码:tkl7 python 做数据可视化编程 链接:https://pan.baidu.com/s/1U6qXNoyt0mR9ZI_VaWT8qA 密码:vrm5 python 数据分析基础教程 链接:https://pan.baidu.com/s/1GPFhMaOhm07R4Y0vkyGv_A 密码:zedt python 分析核心编程第 3 版 链接:https://pan.baidu.com/s/16vWJCbiAjMd1sOpknvtcDQ 密码:511t python 编程:从入门到实践 链接:https://pan.baidu.com/s/1aUCc--3RRi2tmfFjiJW8kQ 密码:r2wy python 黑客编程 链接:https://pan.baidu.com/s/1daKJ8o330AskugGNW0UBFQ 密码:thrc 与孩子一起学 python(python 2版本),我极力推荐 链接:https://pan.baidu.com/s/1RONh_OsQsUapCWSKW1Zkaw 密码:erjh python 网络数据采集(珍藏版) 链接:https://pan.baidu.com/s/1QYhDkePref8Tgk9RiuXa3A 密码:8e7m 自然语言处理(NLP) 篇 自然语言处理综论 链接:https://pan.baidu.com/s/1v1-OK_aSU28E6WRTLgof4g 密码:m8s6 用 python 进行自然语言处理 链接:https://pan.baidu.com/s/1-LcCyL_wq_SGJKSLtKDCNQ 密码:zzno R 语言篇 R 语言数据操作 链接:https://pan.baidu.com/s/1Q7nzNpDX8P1mggiAApu_qg 密码:3jv8 R 语言实战 链接:https://pan.baidu.com/s/1ji-kdLf45h5mtKhJdcUdvQ 密码:1t0f R 语言基础编程技巧汇编 链接:https://pan.baidu.com/s/17eyNXUW-eY1Ybver4T1rBQ 密码:64my 数据分析与图形艺术 链接:https://pan.baidu.com/s/1keNzpig581fRaM_TiHi32Q 密码:dl8l R 语言编程艺术 链接:https://pan.baidu.com/s/10vLA6Pr9Z19gMY3dxhjg-A 密码:x0ok 统计建模与 R 软件(下) 链接:https://pan.baidu.com/s/1_Wb_8PMqjun8JtDkJDL7fg 密码:n8fm 统计建模与 R 软件(上) 链接:https://pan.baidu.com/s/1RHCBBPEF85nxQZDjBJqC_g 密码:55hf 机器学习篇 统计学习基础 链接:https://pan.baidu.com/s/1H4u1koQKmOJjuGMNhpJ5Ag 密码:fu7r 深度学习 链接:https://pan.baidu.com/s/18bN7pWe90tOfhO33QNliYg 密码:j4u6 机器学习导论 链接:https://pan.baidu.com/s/1quzGKRlg3qE8SQim8lBRBw 密码:3022 数据挖掘_概念与技术(韩家炜) 链接:https://pan.baidu.com/s/1I-N7ZftD2L1vbR2KZakgHw 密码:jrlz 机器学习及其应用_周志华 链接:https://pan.baidu.com/s/1eVD6qPROEYKt-v1UuPMj-g 密码:rivw 机器学习中的数学 链接:https://pan.baidu.com/s/1Jpz-yVK99twz7xLLZqua_A 密码:5u1s 机器学习 链接:https://pan.baidu.com/s/1eKpwamkpj3SsBiTesNDauw 密码:pw6w 数据分析篇 Excel 数据分析教程 链接:https://pan.baidu.com/s/1ouPW3p6NVsKGoZPX53gG8w 密码:j0rn Excel 数据处理与实战精髓 链接:https://pan.baidu.com/s/1N4V5VtvsT6r7c4e1XpMkMw 密码:09xf 用图表说话 链接:https://pan.baidu.com/s/1aWmkhbgBz7puzy4kYKY3yA 密码:nmm1 EXCEL 图表之道 链接:https://pan.baidu.com/s/1m-nVyIYe6jOR8B6P35LJXg 密码:zyvx 数据集篇 做数据分析的同学可以拿这个数据练手。 微博用户数据(我截图到时候发现一枚奇葩˚¬˚) 链接:https://pan.baidu.com/s/1Cfr83bIeOfdLCO8Q1rv6WA 密码:xulw 百万知乎用户数据 链接:https://pan.baidu.com/s/1jZIapSjpnSzbXCvRjalHfQ 密码:hu4b 科比生涯投篮数据(这是小吴画得科比投篮位置图) 链接:https://pan.baidu.com/s/1dhU6_jfiEACk_OCWwVqenw 密码:ddsz 英雄联盟的数据 链接:https://pan.baidu.com/s/1_mwpKtRIUgA6BClZetsAHw 密码:1upl 豆瓣读书数据 链接:https://pan.baidu.com/s/1-vKvR2Eqv2-DPNBg1JKcNQ 密码:9qpb 物流网点数据 链接:https://pan.baidu.com/s/1x5M3Hv4fwjjfesVD8LoPLQ 密码:sh70 大众点评店铺、评分等数据 链接:https://pan.baidu.com/s/1orpA2w-AV-IibrXTV5CG9Q 密码:ilfl 运营设计篇 H5 界面、文案设计参考书 链接:https://pan.baidu.com/s/1d9vmiIwP-tBpa1M8_fUJGw 密码:fc5v 广告设计参考书 链接:https://pan.baidu.com/s/1hxVjPMRLFYBhp7AzFtPLAQ 密码:btpp 排版参考书 链接:https://pan.baidu.com/s/1W7y_veZk-xH1aTmkrfe8sQ 密码:ddvt 文案参考书 链接:https://pan.baidu.com/s/1cE9dj-LXnEIBNAN8LobxaA 密码:yzb8 后续会更陆续更新,如果有帮助到你,别打 call,打赏!]]></content>
<categories>
<category>资源分享</category>
</categories>
<tags>
<tag>资源</tag>
</tags>
</entry>
<entry>
<title><![CDATA[曲终人在]]></title>
<url>%2F2018%2F05%2F18%2F%E6%9B%B2%E7%BB%88%E4%BA%BA%E5%9C%A8%2F</url>
<content type="text"><![CDATA[今天经历的一切必须记录下来… 和往常一样在香港路下地铁,去骑 ofo 上班,骑行时间9分钟,我一出地铁站外面格外的黑 接着就是大风,大雨,骑着 ofo 我大概走了五米左右,我便停下来,在“浙商大厦”躲雨,单车被吹得到处“飞” 我便无奈去了上面图中的那家书店,平时经常经过这里,书店留下的最深的印象就是生在这么嘈杂的地方 里面环境贼好 这一排垫子都是给避雨人准备的 穿白衣服的那个爷爷是和我一起进来的 楼上全是来看书的,有位头发斑白的爷爷 楼上的视角很广 我不知道这里怎么收费,拍照也没人干涉 那位白衣服的爷爷已经出去了˚≥˚ 我琐碎找本书看看,我往隔壁走,看到了大厅,前台处放着非常微妙的音乐,是邓丽君的《清平调》 随手捡一本书。 云想衣裳花想容,春风拂槛露华浓。若非群玉山头见,会向瑶台月下逢~ 到公司,身上全湿透了,我还是骑车去的,虽然不远 到公司后,衣服脱了,鞋子脱了,开始梦幻般的一天。]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>生活</tag>
</tags>
</entry>
<entry>
<title><![CDATA[孤独终老]]></title>
<url>%2F2018%2F05%2F17%2F%E5%AD%A4%E7%8B%AC%E7%BB%88%E8%80%81%2F</url>
<content type="text"><![CDATA[爱情,是一个灵魂对另一个灵魂的态度,而不是一个器官对另一个器官的反应。]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>生活</tag>
</tags>
</entry>
<entry>
<title><![CDATA[抖音艳史]]></title>
<url>%2F2018%2F05%2F04%2F%E6%8A%96%E9%9F%B3%E8%89%B3%E5%8F%B2%2F</url>
<content type="text"><![CDATA[来者皆友,各位注意身体… 我首次知道抖音这个产品的时候是在2017年7月份,当时张一山的《春风十里把不如你》首播,中间广告有段就是剧中演员说“我在抖音等你”;印象加深的一次是在18年元旦前后也就是17年快除夕的那段日子,正好快放假,大家都忙着支付宝集福以及头条的集发卡领现金的活动;在头条上看到的视频推荐,有抖音有火山,后来闻声渐大,口碑愈好… 短视频产品是国外兴起的最初的音乐短视频产品起源于国外,后面国内的小咖秀、抖音等都算是最得意的“门生”。 经常上 Facebook、Twitter 的朋友应该都知道曾经的“冰桶挑战”,这一幕短小的搞怪、搞笑的视频几乎所有人都会点开播放,后来在微博上有很多明星都在效仿。而日韩美欧的明星录制这段视频的产品就是 Dubsmash。这款德国人开发对嘴表演工具,玩法简单粗暴:选声音、配合表演、发布。这款应用最开始是在14年 TechCrunch 大会上发布,短短一周荣登德国 AppStore 榜首,然后对嘴表演的搞笑搞怪风气迅速席卷欧美,直到15年年底全球过百的国家 AppStore 下载量仍然非常优异。他们团队很注重中国市场,比如老早开通了微博,比如和国内知名媒体互动等等很可惜,这款产品最后并没有打开中国的市场,无奈之下被后面国内的报道纷纷称作“德国版小咖秀”。 15年国外产品登顶 AppStore 似乎越来越容易。就在这一年,很多产品纷纷冲到了排行榜前列,1月份的 Dubsmash、4月份有福建的小偶、7月份来自上海的妈妈咪呀、9月台湾的17,他们都有个共同点,以娱乐短视频发散人性最初的乐趣。 抄袭最快的 musical.ly这款后来被国内媒体称作“美国快手”的产品,来自上海团队,他们抄袭 Dubsmash 并最快爬上美区 Appstore 榜首,这个产品完美解决了 Dubsmash 存在的弊端: 制作10秒的视频模板,内容太拘谨 没有用户分享视频功能,仅仅属于拍摄工具 没有社交帐号体系,关注互动等于没有 这个团队可以说站在 Dubsmash 和快手的肩膀上打造出一个混血儿,好玩、有趣,很快在美国自发性传播,并获得无数好评,在产品层面,这个产品体验相当完美,倒序、快进、慢镜等拍摄手法应有尽有,并且支持全屏,在当时的美国算是标准的创新。 这款产品后面不温不火,原因有两点:第一,变现问题。直到今天这依然是短视频产品面临的问题,你问问自己,“抖音怎么变现”你现在能给出答案吗?第二:市场的冲击。不要小看这个原因,15年直播兴起,在媒体属性面前,直播太粗暴了,简单、好玩、还能很好的圈钱,这对于一款抄袭而生的产品来说,碰撞冲量无法承受,这不, musical.ly 后面也做起了直播… 小咖秀诞生小咖秀最火的时候,微博上近2000名明星都在用,而秒拍做为投资者,算是帮秒拍打开了新的局面 这款产品犹如寒风中的雪梅,一开即过。小咖秀当年创下的战绩至今惊人,15年7月登顶中国区 Appstore 榜首,霸榜持续一周多,短短的一个月横扫社交,一览全无。很多人应该还记得明星模仿金星的橙汁视频。这种昙花一现的产品在短期创造如此惊人的数据离不开微博的流量导入和明星效应,他抓住了视频+音频的风口,但是,由明星带起来的产品最后只有一个字:死。明星效应本就是短暂的,新鲜感一过,烟消云散,小咖秀是,分答也是。而反观主打农村包围城市的产品快手,走得更加稳重,一步一个脚印。 小咖秀命运衰败的另外一个原因和 musical.ly 一样,他们的团队后来也做起了直播,叫“一直播”。 抖音问世抖音改过名,开始她的名字很萌的,叫 A.me,不过我现在看,我觉得这名字真得改,越早改越好,特么 A.me 摆在面前,谁知道是干啥的? 抖音的产品经理是个女的,和今日头条”标题党”以及内涵段子的“黄晃皇”不一样,我对抖音的评价就几个词:活力、格调、好玩、年轻。 这是安卓市场的下载量艾瑞咨询移动应用2018年3月月度独立设备数据日均独立设备数据用户性别占比抖音拥有来自头条核心的团队,并且头条闻名的推荐算法也用在抖音的推荐页上,在技术和市场上,似乎抖音一拥有较高的起跑线,杀入娱乐媒体市场,我比较期待后续抖音在产品上的发力:如何以媒体内容为载体将年轻人的自我表达做到极致。 短视频市场,各路诸侯,小咖秀的晃咖,musical.ly 重回母国土的 MUSE 以及腾讯的闪咖等等,这些产品后面都会“死”去,留下谁只是一个时间问题,这是产品上的赛跑原理,抖音也一样,头条的火山、抖音最后也只会留下一个,从产品来看,一个公司的两款产品火山、抖音,我看不出一点点逻辑差异。 最后抖音是抄袭吗?是。完完全全的是,不然开始命名为什么是 A.me 这和 musical.ly 的长相相似的有点过分…前阵子头条“内涵段子”的遭遇,从某种意义上来说,对抖音百利无一害。期待后续抖音在短视频上的表演,也更加期待其他的后起之秀。现在的年轻人不好伺候,更别说做年轻人的产品啦,创业做产品太难了,内部怼开发,外面怼市场;辛辛苦苦大半年上线,一个月不到,被大厂抄袭,烧钱把你逼上绝路,要么投靠,要么死去… 相比之下,我更喜欢中国人民共产党,千百年始终如一:为人民服务!!!]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(五):关联规则推荐算法]]></title>
<url>%2F2018%2F05%2F03%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E4%BA%94%EF%BC%89%EF%BC%9A%E5%85%B3%E8%81%94%E8%A7%84%E5%88%99%E6%8E%A8%E8%8D%90%E7%AE%97%E6%B3%95%2F</url>
<content type="text"><![CDATA[这是“产品经理识算法”系列的第五篇,拖得有点久了… 什么是关联规则推荐关联规则推荐:关联规则是数据挖掘中的概念,是通过数据找到看似没有任何关系的两个对象之间的关联性。那么用在推荐上是什么意思呢?你现在可以这样理解,关联规则推荐算法,实际应用下来跟著名“啤酒与尿布”(如果不知道“啤酒与尿布”大家可以Google)是一样一样的,也就是“当用户把尿布加入购物车后推荐啤酒”比“直接推荐啤酒”订单转化率更高。接下来我们一步一步来看。 首先模拟一套数据为了方便下面文章的展开,这里模拟一套案例数据:横向展开是商品类别;纵向展开是订单数量 商品支持度 商品的支持度是指某个商品在所有订单中占比重,也就是看看多少人购买了这个商品 上面商品1在5个订单中,出现了3次,那么商品的1的支持度就是suport(商品1)=3/5。类似可计算商品2、3、4的支持度依次为:3/5、5/5、2/5。 有了单个商品的支持度,我们可以计算下商品两两组合的支持度,为了简单快速理解,我们只做两两组合的支持度说明。上面共计4个商品,那么两两组合就是C(4,2),商品1和商品2的组合我们记作:{12}。那么最后C(4,2)可表示为:{12,13,14,23,24,34}。商品1和商品2的组合支持度就是既买了商品1也买了商品2的订单那么suport{12}=2/5现在你可能有这样的疑问:我们为什么要计算这个支持度呢?组合支持度是衡量这两个商品“凝固度”的一个指标,一个订单中包含了商品1很大程度上也包含了商品2,那么我们认为商品1和商品2“凝固”得紧一些,都是同步购买的,在推荐顺序上优先推荐组合支持度高的商品。 商品的置信度这个概念很拗口,这样来理解:买了商品1的来推荐商品2和买了商品2来推荐上1,这两个算法不应该相同。于是,就引出了商品的置信度。还是看上面的那张图商品1、2的置信度为confidence(商品1商品2)= 2/3,这和组合支持度不一样,这里的分母是只包含商品1的总订单数,而组合支持度的分母是所有的订单数。即:confidence(12)=suport(12)/suport(1)值得一提的是,confidence(12)和confidence(21)不一样。所以当用户买了商品2是推荐商品1和推荐商品3所占的权重不一样,置信度是衡量两个商品关联“紧密度”的一个指标,也就是需要商品2的同时对商品1和商品3的需求是不一样的。举个例子:买了炒锅的用户你推荐锅铲比推荐筷子更贴切,因为炒锅和锅铲的“紧密度”明显高于炒锅和筷子,但是炒锅、锅铲、筷子最后很可能都会出现在同一个订单中。所以这种场景之下:用户有了炒锅后对锅铲的需求是最大的也是最直接的。所以在推荐的时候优先推荐这种需求更大的商品。 推荐提升度看了上面的说明,细心的同学已经发现了:confidence(23)=1购买了商品2的全部购买了商品3,这说明“对商品2的有需求的用户全部都对商品3有需求吗”。答案是否定的,如果真的是这样,我想市场上早把商品2和商品3打包成一个商品(或一个套餐)了,既然存在100%的必然关系,为什么要分开卖呢?我们回头看一下开始关联规则推荐的目的:也就是“当用户把尿布加入购物车后推荐啤酒”比“直接推荐啤酒”订单转化率更高。每个商品都是独立的,从上面的表格 可以看出,每个订单中都包含商品3,也就是你推不推荐商品3都一样,用户最后都买了商品3。那怎么解决这个问题呢,我们就要用“提升度”这个概念。提升度:两个商品的置信度confidence(12)和单个商品的支持度suport(2)的比值。lift(12)=confidence(12)/suport(2) lift(12)>1:通过商品1关联推荐商品2比单独推荐商品2效果好 lift(12)=1:两种推荐效果不相上下 lift(12)<1:购买商品1后再推荐商品2还不如直接推荐商品2 看实例怎么选择商品1和商品4是关联推荐商品4还是单独推荐商品4: 关联推荐的置信度confidence(14)=suport(14)/suport(1)=1/3 单独推荐时商品4的支持度suport(4)=2/5 lift(14)=5/6 结论:lift(14)=5/6,小于1,购买商品1后再推荐商品4还不如直接推荐商品4 总结 商品1支持度:所有订单中包含商品1 的订单数量suport(1)=商品1的订单数量/总订单数量 商品1和商品2的组合支持度:所有订单中包含商品1有包含商品2的订单数量suport(12)=同时包含商品1和商品2的订单数量/总订单数量 商品1和商品2的置信度:confidence(12)=suport(12)/suport(1) 关联规则调教指标“提升度”:lift(12)=confidence(12)/suport(2) 大于1;通过1关联度推荐2效果优于单独推荐2 等于1;两种推荐效果都一样 小于1;单独推荐2效果优于通过1关联推荐2 如果你们公司没给你们发年终奖,记得在产品的推荐页上,全部推荐小于1的。以上,完毕。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[2018斗鱼国际嘉年华]]></title>
<url>%2F2018%2F05%2F01%2F2018%E6%96%97%E9%B1%BC%E5%9B%BD%E9%99%85%E5%98%89%E5%B9%B4%E5%8D%8E%2F</url>
<content type="text"><![CDATA[看着自己喜欢的城市,一天比一天好,真的超级开心。 就是她,2018年4月30号,成功让武汉“宕机”;现场的保安让数十万人留在300米以外欣赏,安全起见,不予靠近…]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>直播</tag>
</tags>
</entry>
<entry>
<title><![CDATA[青丝,白发]]></title>
<url>%2F2018%2F04%2F17%2F%E9%9D%92%E4%B8%9D%EF%BC%8C%E7%99%BD%E5%8F%91%2F</url>
<content type="text"><![CDATA[在青山绿水之间我想牵着你的手走过这座桥桥上是绿叶红花桥下是流水人家桥的那头是青丝桥的这头是白发]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[大数据实战:百万知乎用户分析]]></title>
<url>%2F2018%2F04%2F11%2F%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AE%9E%E6%88%98%EF%BC%9A%E7%99%BE%E4%B8%87%E7%9F%A5%E4%B9%8E%E7%94%A8%E6%88%B7%E5%88%86%E6%9E%90%2F</url>
<content type="text"><![CDATA[背景这几天,同事都去出差,稍有感冒的我提前在办公室感受到了“孤独终老”的恐惧。于是,我想在自己有能力并且还有激情的时候,去做一些以后值得回忆的事。我萌生了去“探望”下知乎的念头。 前言我个人是15年注册知乎,三年过去了,我个人主页数据是:我一直不喜欢知乎上面的氛围,但是通过知乎我确实拿到了很多学习、设计、阅读和产品灵感的资源,都是通过知乎链接到其他平台;在此也感谢这个平台给每一个求知者带来的帮助和启发。这次我将利用知乎用户的数据,从数据分析的角度,以用户、区域、行业、专业、大学、喜欢数、粉丝数和性别为交叉对比展开分析,因为我迫切想知道,那些大 V 从哪来,做了什么事,是个什么背景等等像打了马赛克一样的信息。下面我们一一展开。 数据直接爬取知乎的用户数据,包括ID、粉丝数量、工作信息、回答数量、文章数量等等。部分数据不完整,gender 列中“1”表示男,对应的“0”就是女啦。 这些用户的分布区域是什么样的拿到这些数据,我一开始不关注用户的性别,我知道,这个参考价值并不高,因为,我在一些社区都会在性别那一栏填上“女”。于是, 根据用户的地域信息,得到如下这张图 气泡大小表示数据多少,很明显北京和上海的用户是最多的,这个地区分布有着什么样的潜在含义?读者可以思考下这个问题,后面的分析会给出答案。 用户分布区域决定这个区域的回答数量吗其实在做下面这张图之前,我的猜想的答案是肯定的,很明显嘛,哪里人多,自然而然的就会回答多一些,但是我注册知乎后的个人数据又说明存在特例:有的用户都不喜欢回答。带着疑问我做了下面这个分析,看看这些区域的同学是不是平常贡献答案最勤快的。这个图几乎和上面的完全吻合,用这个图来说明“我的猜想是正确的”并不合适,但是用这个图来打消你心中对这个猜想准确性所产生的疑虑,应该足够了。 用户都来自哪些大学 我乍一看这个图,我就知道数据有问题,虽然学校的排名与上面地域占比的关系吻合(清华、北大排第一第二与北京用户最多符合常识)的,但是整体数据量太小了,我回头看一下原始的数据,我发现“学校”这个字段下面的值都大多都是“Null”,在处理做图的时候默认过滤空值。发现这个之后,比较庆喜,至少这展示出来的部分数据真实性很高,因为不想公开自己大学的用户可以直接不填(也就是Null)而不会出现不是北大填北大的现象;如果有,那这样的人,我们忽略他吧。 哪个大学的用户贡献的答案最多我们都知道,知乎是一个问答社区,贡献自己的回答,来帮助他人,从知识的领域,将雷锋精神发扬光大。那么哪个学校的用户总体回答数最高呢?最喜欢回答问题的用户大多来自武汉大学,紧据第二的是复旦大学,前四名被武汉和上海两个城市占据。这个时候也许你和我一样,那用户数占据最多的北京大学呢?我个人现在的解释是:知乎总部位于北京,在平台冷启动之初,种子用户的大学这个字段的值都是“北京大学”,那批用户开始塑造社区氛围后,后面就“隐居山林”了,如李开复博士;所以后面用户量大起来,发言次数每排上榜就是正常的啦。 用户粉丝的多少与哪些因素有关 这是知乎用户的粉丝排行榜,这张图给我的疑问太多太多是不是回答的数量越多,粉丝越多呢?是不是获得感谢越多,粉丝越多呢?是不是文章写得越多,粉丝越多呢?…带着这些疑问,我做了如下这张图,根据分析结果,上面这几个疑问的答案就不言而喻了 并不是回答和文章次数越多,粉丝就越多,这也提醒大家,产出高质量的答案和文章,比高数量的答案和文章更有价值,更能得到别人的关注,多没用,要好才行。 有意思的专业谈到写文章,我就想看看这些平常喜欢写作的同学都是学的什么专业诸多默默奉献文章的高尚之士,都选择隐藏专业,在可分析的维度上,软件工程的同学摘得桂冠。中间这个“修地球专业”的文章我猜想是同一个人的贡献,因为这个专业名字除了他,应该没人想得出来233333举一反三,我又得到了以下这张分析图,看来付出和回报是成正比的,你付出的越多,得到感谢就越多,这个世界还是很公平很美好的。差不多有200万的用户关注了“经济学”专业的同学,看来在比谁钱多的时代,经济方面文章和知识是个值得补充和提高的,大部分人在这块有极大的需求…在计算机科学专业方面的回答比肩软件工程专业,原来程序员哥哥除了不喜欢洗头,还是有很多优点的,比喻“乐于助人”。 那些经常提问的同学都来自哪个行业领域还记得开篇的时候让大家思考的那个问题吗,如果你还没来得及思考,你现在可以再回头看一下~在“互联网”行业,获得感谢接近13M,获得了900k的回答…现在我们来看看开篇中的那个问题上面的分析我们清楚的得到,用户普遍来自北京上海;而这张图可以看出,知乎上的用户在互联网这块的产出和关注度非常高,那就很好解释了:这群来自上海和北京的知乎用户,由于上海和北京互联网发展最快最发达,导致他们普遍比较关注互联网这一块。互联网之都:北上广深,(后面发展较好较快的还有杭州、南京、成都、武汉等等)关注和从事互联网的几乎都在这个四个城市,那么前后这两个看似没有任何关联不同维度的数据,恰巧有着天衣无缝的吻合。 开始我本来想直接查看个用户的职位性质来直接说明这个,但是我觉得单纯以一个在“注册”和“完善资料”步骤中填写的一个职位来说明这个有点牵强和草率,所以后面我换了一种思维,我想从用户关注的点,以及知乎上面的问题和回答所呈现的数据反推“所在的地域决定了大的环境,环境影响人关注的行业和领域”这一点,这样也显得更加严谨和科学。 下面是用户职位的分析(去除空值null后的) 其实职位不用分析也知道是这个情况。其中“创始人、合伙人、联合创始人”等都可以当作“创始人”;“产品经理、PM,产品,产品设计师”等都可以归纳为“产品经理”,“创始人”和“产品经理”这两个职位和“互联网”这三个字凝固得非常紧,而且不是这个行业的工作人员高度关注这个行业貌似也说不过去,去问或者去回答这块的问题就更扯了… 首次发言的潜在寓意是什么仔细看上面数据 excel 截图的同学应该发现了,其中有个字段是”first_answer”,这个字段很有用 这是爬取的用户当中,首次回答的用户数量在以年为维度上的走势,(很多用户的 first_answer 我不知道为什么没有爬到~)首次回答和什么有关系?当然是注册时间啊,任何一个产品在用户首次注册的时候,新鲜感和活跃动力是最强的,如果在开始注册之际这个用户就没有参与平台的互动,我们大可以断定这个用户已经沉淀或流失。我们假设知乎上面的用户在注册的时候就开始去回答别人的问题(可能有一两天甚至一两周的时间差,但是在以年为维度,可以忽略),那么 first_answer 可以转换为注册时间,而注册时间可以反观一个平台的推广力度和运营力度,那么有了这个思路,我们再看上面的图 从10年到11年,几乎垂直上升,说明在这个时间段,有大量的用户注册。事实是,知乎是10年末期开放邀请注册的,那么此期间用户剧增,理所当然 从11年到12年,有下降,说明在产品形成初期,有一定的用户基数后,注册遇到了瓶颈,在知乎社区活跃的几乎都是老用户,所以没有新用户,不存在首次回答,于是,出现了下降 从12年到14年,再次出现峰值,说明又有大批用户注册,去翻知乎的发展史可以看到,这个时间段,知乎取消以往的邀请注册,开放公众注册,那自然而然会出现用户暴增了 之后的几年都是下降,如果读者是互联网从业或者关注这块的信息,你应该已经想到这是产品的用户瓶颈到了,一个平台的用户天花板只有这么高,当没有新用户注册并且参与活跃,first_answer 这个字段就没有意义了,所以到了16年,首次回答的用户非常低,说明,这个平台的新用户增长低,甚至没有 这是从 first_answer 得出的分析,那么你能根据 last_answer 得出什么结论呢? 总结有时候从数据分析去反推事实很有意思,这大概也是数据产品最迷人的地方吧。以后的一段时间,我将爬拉钩、爬新浪、爬大众点评、爬物流等一系列平台的数据,来和大家一起分享数据产品经理的乐趣和日常,感兴趣的朋友,欢迎来我博客做客。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[走好,摩拜]]></title>
<url>%2F2018%2F04%2F09%2F%E8%B5%B0%E5%A5%BD%EF%BC%8C%E6%91%A9%E6%8B%9C%2F</url>
<content type="text"><![CDATA[背景2018年4月4号,摩拜单车被美团全资收购。以下是双方官微信息截图。 摩拜单车是15年成立,那个时候我正在随米,在15年,几乎所有的创业都会有个共识,那就是“O2O”,而这个新型的商业模式:共享,在当时并没有人看好。纵观这几年的行业发展以及各大产品纷纷倒闭的现实数据,共享,与其说是一种商业模式,不如说是一种投机赚钱的机会。 行业环境那个时候由于我负责产品,所以获取行业中的新闻和创业消息是工作的一部分,因为你不去发现新的东西,就开阔不了你的视野,你没有了视野,就没有雄心和方向,那么你的产品就会死掉。那个时候我刚毕业,满大街的 O2O 产品真的让人有点厌烦,因为他兴起了一个新的产业:快递。打破了当时的平衡。在摩拜和 ofo 纷纷拿到融资,并且在市场铺开的时候,国家政策正在大力度的打击 P2P,好多非法集资的金融公司纷纷被“处理”,有兴趣可以去了解下“E租宝”。后面再去分析一些事情,我觉得孟子说的“天时,地利,人和”真的实用于一切。 如果当时国家不去实施这个政策,不去打击 P2P 我相信那些 VC 更愿意选择这种用钱赚钱的产品,我担保共享单车的融资不会那么的顺利,更别说“雨后春笋”般的市场扩充,这是天时 单车是最普通、最环保、最简单的出行工具,环保,政府不会过多的干预(起码开始不会,后面各个城市疯狂铺开就充分验证这一点),简单,用户愿意使用,而普通就决定了这是个低成本的事,这是地利 在行业氛围迷茫,而且 O2O 产品逐渐形成垄断的情形下,VC 都在寻求新的商机;出行方式(自驾除外)挤公交、挤地铁的无奈有了新的解决方式,用户愿意去尝试和体验,这是人和 于是,以 ofo 和摩拜为代表的共享革命由此展开,这也注定后面这两只队伍成为最尖锐的竞争对手。 产品模型提到共享打车,我真的佩服北大的那几个孩子,真的是天才造就传奇。共享单车模式和产品模型一早是北京大学的戴威提出来的,起初的简单模式就是解决大学里面自行车“被偷、上锁麻烦、自购有成本、毕业后难处理、停车不便”等等痛点而推出的一款校园产品(说到这里,这种简单解决校园学生痛点的模式,熟悉得不能再熟悉),而这款很不起眼的校园产品就是后面的 ofo。 商业模式。共享单车的商业模式其实就是租赁。但是这个商业模式真的很厉害:第一:租赁价格非常低,基本上满足用户“用多少给多少钱”的吝啬心里第二:租赁和供应链市场有个大痛点就是解决链条两端的“拿”和“还”的问题,共享单车用四个字解决这个问题,那就是“随停随骑”第三:这也是这个商业模式中最厉害的啦,就是押金,对于常人来说,一两百块钱真的不算什么,大家也不怎么在乎,针对于一个创业公司来说,这是一笔巨大无比的启动资金,后面就是流动资金,而且会发生蝴蝶效应:你市场铺得越开,就越容易消除用户“押金被骗”的顾虑,而且还会很快获得认可 产品架构。单车本身就是一个简单的出行工具,用户扫码开锁,系统开始计费,用户开始骑车,骑车结束,关锁扣费,停车。整个流程需要用户做得就是拿出手机扫一下,然后关一下锁,而且只需要付出2元人民币,而这么廉价的行为解决的是一个人短距离(5公里内)的出行,从解决一个人到解决成千上万的人,你就会发现,“共享”模式后来被疯狂复制的原因在哪里。这里会遇到押金难、APP 难推广、单车维护成本高的问题,我们在下面来说说这个问题。 运营模式。这是共享单车最致命的缺点。前期推广几乎只需做三个事:融资、买车、往街上一扔。一个简单的产品的流程就形成闭环,剩下的基本就是盯着数据库看受益了,这不是优势吗?怎么是缺点?这个毫无技术含量的产品被各个大咖发现了,并且他们看好这个市场,这样一来,满大街五颜六色的单车堆积如山,有些接满灰尘的单车似乎是从古代穿越而至,一身沧桑,不堪入目。绕乱交通、毁坏市貌,用户也由一开始的接受慢慢变得厌烦,选择多了,就没有唯一,这个是运营解决不了的,因为这个问题本来就是运营造成的,铺市场铺的太快,大家都来分一杯羹是必然的,你有钱,你就活,你没钱,你就被淘汰(后面各大产品都有或或少的难融资的报道);随着市场的铺开,单车的运营成本就不是开始预期的那么简单了,竞争对手多了,之前一天一辆车被骑四五次,现在可能一辆车五天被骑一次,这就是运营的瓶颈,没法解决,随后他们把眼光抛向了国外…新加坡、内蒙、澳大利亚等等也开始涌现单车大军,但是没有用。你没有技术含量,也没有优势,后面各个产品均从“提高骑车体验”、“升级单车硬件”、“推出免费月卡”等手段来获取用户的青睐,但结果证明这些都是徒劳,因为,你会他也会,你做我也做。慢慢的活跃度下降,开始退押金,押金被周转出去订购单车,所以,退押金有出现一周没退下来的现象,后面口碑传开,扩展推广 APP 就困难多了。 大环境现在的中国,商业圈真的和古代的官场没有任何区别,环环相扣,互相搀扶,牌面上的并购其实就是以大吞小,这次收购也不列外。如果仔细去分析,其实后面的竞争真的令人惊讶。我们都知道今年 ofo 刚拿到阿里的融资,缓解了17年末“账上资金不足维持一个月舆论“的扩散,其实这算不上舆论,这条新闻最开始由腾讯新闻发出,我想这算不上舆论,因为背后的真实情况就是这样的。市场上所有的互联网行业(现在某些传统的企业也有覆盖)都可以分成“阿里系”和“腾讯系”。小企业背后的竞争其实也是这两家独大的企业在竞争,这次并购,小的方面看,是 ofo 和摩拜在牌面上的较量,赚多少钱,每天的盈利额其实都说明不了什么,谁独立运营到最后,谁才是赢家;大的角度看,ofo 背后一直在搀扶他前进的是阿里,而摩拜大家都知道其实是腾讯是大股东,美团并购摩拜,似乎和这两家大企业并没有什么关系,但是,美团属于腾讯系产品,这样的巧合,似乎寓意很深远…前不久美团刚推出了美团打车,进军出行市场,中国的出行市场我们都知道滴滴做了一年的独门生意,先推出美团打车,这再来个并购摩拜,对于出行行业,美团的蓝图太明显了,我们无法定论未来的美团走的这条路正确与否,我可以肯定的是:任何东西,任何事,想没用,做才行,只有付出,并且迈出一步,你才会体会到“原来是这么回事”的感觉,商业管理也好,工作生活也罢,想法和现实之间隔的不是时间,而是行动。我们可以大胆的得出一个结论,国内所有的竞争,其实终究脱离不了阿里和腾讯,无论采用什么养的手段,都只是阿里和腾讯的代理人。 创业没有回头路收购新闻宣布后,各个糟点不断刷新用户的三观底线,挪用资金、盆满钵满等字眼纷纷出现在各大头版头条。当你发现市场,而你又年轻,并且没有负担,你真的抵制不了创业的诱惑,这条路一走就无法回头,成,就对,败,也没错。在你的产品不断走向市场,你需要钱,而唯一可以换来钱的方式,就是拿你产品的未来去换取有钱人的钱,行业中有个冠冕堂皇的词叫“融资”,这些有钱人愿意用庞大的资金换取他在董事会上的发言权和决定权,最后来左右和干预产品的成长方向,如是你变成了做事的,只是个做事的,其实这个时候产品已经不是你的啦,充其量你算是这个产品的“保姆”。当最后产品被收购或者停止运营,犹如自己的孩子被霸占和夭折,那种无能、无助的感触,无法形容。那些“才三年不到,算是赚够了”、“挪用资金,欺骗用户”、“胡玮炜别哭…”之类的话,不用太在意,因为这些,与你无关。我预测,未来不久,胡玮炜、王晓峰等人都会离开,也许是辞职,也许是被替换~]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[《遇见》]]></title>
<url>%2F2018%2F03%2F31%2F%E3%80%8A%E9%81%87%E8%A7%81%E3%80%8B%2F</url>
<content type="text"><![CDATA[有些人,才遇见一下子就好像认识很久似的什么事都想和她说]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[从数据的角度看《前任3》]]></title>
<url>%2F2018%2F03%2F29%2F%E4%BB%8E%E6%95%B0%E6%8D%AE%E7%9A%84%E8%A7%92%E5%BA%A6%E7%9C%8B%E3%80%8A%E5%89%8D%E4%BB%BB3%E3%80%8B%2F</url>
<content type="text"><![CDATA[前几天,旁边的女同事说:“一看到有关《前任3》的新闻报道,我第一时间就想到了吴xx。”于是,我决定去看看这个电影。我想去折腾这个的原因,不是受“啜泣女孩影响影院正常运作“的新闻,也不是影片的票房,我的动机有两个: 和相处近10年的她刚分手(也许某些生活场景我刚经历)。 去电影院看是找罪受,爬些数据从另一个角度看,会收获意想不到的效果。 这篇文章,我主要的思路是通过某些网友的观后感受以及对影片的主观评论来解读这部青春剧的网络发酵的原因。那么接下来我需要完成以下几件事: 获取这些观后感和主管评论 将这些碎片化的文本数据处理成可分析的标准数据 建立分析维度,从标准数据中感知数据传递的信息 得出结论 获取信息我先去查看了下30天以来微博的热度指数 出现这么明显的高峰,很容易想到,这个区间一定处在上映的时间,在26号飙到最高3w多,这不是偶然,每部电影在上映前都会大力铺垫,广告飞上天,呈现的热度也说明了这一点,媒体效应的转化其实是带动一个处于冷却的东西向更热的一端进化。 接下来要正式获取数据了。这是最基础的步骤,你想从事这方面的分析,这个你必须要会。在选择来源的时候,我犹豫了很久,知乎上面的太裝;微博上面太假;网易云音乐我试了,数量不是很大,没有代表性;走而周转,纠结半天,最后还是去了豆瓣,豆瓣上的评论几年前我觉得很有价值,后来慢慢也下海了,今天还是选择了她,也许是出于情怀,也许是出于无奈。 我爬取了豆瓣《前任3》下面的评论,我的目的直接简单,就是要这些评论内容,像“id、链接、喜欢数、时间”等等信息,只是为了以后能再次用得上这张表,今天这里不做赘述。把这些评论处理成文本信息,去掉其中的标点符号,这里提醒一下:像“嗯~啊、~吗”这种语气叹词,最好不要处理,虽然在 nlp 中经常会过滤这些信息,但在这里,这些词有可能代表评论者的某些情绪。如:“嗯~3都出来了啊?还嫌没虐够吗?啊!”当你把这句文本中的“嗯、啊、吗”都去掉,你读一下,绝对感受不到原文本所表达的那种强烈的情绪。所以,数据预处理需要科学的手段也需要理性的经验。 处理信息将全部评论信息打包,作为语料进行分词,按照词性来分得到以下这张图: 名词占比最多,我们来看看到底是哪些名词出现的次数最多 这个很好理解,为什么“电影”会是第一,在大家纷纷发表看法的时候,总会带上主观色彩,于是都在说“很虐心的电影”、“又是一个人看电影”、“这可能是三部中最好的一部电影”;在大家纷纷讨论电影的时候,那些要么分手了,要么分手过,要么快分手的人在说“我的前任早死了,哈哈哈!”,“嗯,我前任渣到至今我没法忘记”或者是“我还在等我前任”“前任1、2没这个好看”等等一系列的话题。前任死没死不重要,重要的是“前任”这个词和“爱情”是分不开的,他们在现实中是前因后果,在实际中是“豆浆油条”只要出现,总是“凝固”得最紧。爱情伴随感情而生,日久生情是建立在有感情的的基础上,多少爱情不就是小时候她帮我背了几个单词这点小感情而来的吗? “(本来)曾经(当初)有一份真诚的爱情放在我面前,我没有(过去)珍惜,等我失去的时候我才后悔莫及,人世间最痛苦的事莫过于此。如果(未来)上天能够给我一个再来一次的机会,我会对那个女孩子说三个字:我爱你。”在爱情面前,没有忏悔的机会,失去得是青春不是某一个人。这一连串的时间维度的词不禁让人感叹,回忆和梦想是现实中最好的补给品。这几个主角的名字也成了评论的焦点,”至尊宝“是个什么我不清楚,应该是剧中直接或间接植入的某个广告吧,名字中只认识郑恺,貌似名字男生多一些,我猜测在我所爬到的数据中评论者的性别女性多一些。 关系链,整个网友《前任3》为中心,360度蔓延,语义分析的维度有很多很多,不同的分析会得到不同的结果,既可以做出运营调整报告,也可以做出产品决策书,大到可以作为商业投资依据等等。因为文本包含的信息是含有感情色彩的,这比那些死板的数据带来的信息多很多。 分析某些分析已经从基本的词频、词类说过,这是一个维度的分析,直接简单,好理解。但是从文本数据表达来感知评论者的喜、怒、哀、乐等分析(行内称“情感分析”),比较复杂,这里说一下具体的思路,(会有些枯燥,不想看的同学直接跳过)将处理的文本分词后与一个已有的词库进行对比,这个词库包含喜、怒、哀、乐等情感词,统计完成后,将的词与原有的感情库数据对比,算出一个分值,如:“真伤心,好虐心的电影”中把”伤心、虐心“等词归纳到感情色彩词”哀”,将各个类别一起完成,形成权重分值,挨个执行之后,整个文本就会由这些附带感情色彩的情感词组成啦 这部电影表达了一个负面的感情过程,评论自然不会是积极向上的,待定人物的负面得分稍微高一些(数据量越大,这个越明显),这个是数据永远遵循的规律,数据反应真实的结果,数据也遵循客观规律。 上面有些内容需要很专业的知识,有的还需要程序来支持,这里给大家介绍一下相关的工具和免费在线系统: python(数据分析处理的神级语言)Jieba分词(分词库,挺好用的)Bdp(可视化)Gensim(词向量、主题模型)bokeh(可视化)plotly(可视乎)图锐(在线做词云,免费)新浪微舆情(舆情分析系统,可试用)excel(很多数据都可以通过它预先处理)烽火普天(在线文本处理) 文本分词后做的词云 结论 一部电影出来后可以在一段时间上影响一群人的情绪,看这部电影看哭的人很多。 在大家理性评论的时候,有些人已经忘记前任,放松看开了,喜上心头;有些人坠入爱河,痛极生悲;有多少个前任就有多少个悲剧,韩庚也好,郑恺也罢,生活是自己的,提醒大家爱自己,爱他人。 任何一部电影都会有明星效应,吐槽评论之间,主角什么的都会成为话题,红不红火不火颜值占一部分,角色占一部分。 一部电影播出,除了票房收益,还可能让不红的演员红起来,让很红的演员掉一波粉,某些广告可能销量剧增,甚至同款拖鞋内裤纷纷爆上某宝首页。 很多看似很平凡的逻辑推理,在数据的驱动下显得更有说服力,不是数据有强大,只是让那些喜欢反驳的人少了一个扯淡的理由,任何一项分析、预测、推荐不是100%的达到预期效果,但是只要执行下去,优化算法,加以人员运营,总会慢慢变好,这是社会的趋势,也是发展的必要。本文从“为什么要做这个分析>>分析什么>>怎么分析>>分析结果”等流程来阐述整个文本文本语义分析的流程,中间很多处理数据、计算、模型选择等都没有阐述,主要是这片文章旨在给在职的 pm 一个互相学习的机会,有机会的话,下次的文章将会针对技术一点,从写爬虫>>excel预处理>>文本分词>>词性分类>> 情感话分析权重比对等过程。 我是一枚数据 pm,有态度,有追求,有情怀。只希望在未来的某一天,数据驱动产品迭代、决策、运营能够成为行内标配。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(四):数据挖掘之距离计算算法]]></title>
<url>%2F2018%2F03%2F22%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E5%9B%9B%EF%BC%89%EF%BC%9A%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E4%B9%8B%E8%B7%9D%E7%A6%BB%E8%AE%A1%E7%AE%97%E7%AE%97%E6%B3%95%2F</url>
<content type="text"><![CDATA[在数据挖掘和分析的过程中,我们经常需要知道某两个或多个分析对象之间的差异性,从而判别分析对象之间的相似性和所属类别。在数据分析和挖掘领域,用得最多的就是“分类”和“聚类”算法,如:KNN 和 K-Means。今天将主流的一些距离计算算法做一个归纳。为了方便理解,我们暂定分析的对象只有两个个体 A 和个体 B,并且两个个体在同一个维度: A(a1,a2,a3…an)B(b1,b2,b3…bn)我们先来了解一下相关名词,距离度量(Distance)是用来衡量空间上两个个体之间的距离,接下来一些算法公式中会频繁使用这个概念,我们在公式中用“dist“表示。 欧几里得距离这是最常见的距离度量公式,读书在数学课本中已有接触,公式如下: 这里需要提醒的是,我们开篇已经注明,是在同一个维度上的两个对象,如果一个描述的是距离(单位M),一个描述的是重量(单位KG),这样比较没有任何意义,也没有可比性。 我们将上面的距离公式做个变形 做这样变形的目的就是是上面一些看上去僵硬不变的线条符号用数字表示出来,因为数字的是灵活的,会给人带来启发,如上面的公式中就有人获得灵感,将公式中的“2”用变量代替,结果会如何,这个人叫“明可夫斯基”,最后的距离公式被后人称作: 明可夫斯基距离 当t=2时,明可夫斯基距离公式等于欧几里得距离公式,使用绝对值因为变量t不能确保两者之差为非负数(关于这个问题上篇文章有提到过)。当t=1时,明可夫斯基距离等于曼哈顿距离。 曼哈顿距离 曼哈顿距离依赖座标系统,它还有一个名字叫“城市区块距离”感兴趣的可以移步这里上面看到了当t无限缩小后衍生的距离公式,那么当t无限扩大后又是什么样的结果呢?我们将明可夫斯基距离公式中的“t”放大到无穷大: 这就变成了“切比雪夫距离”,这些距离都是欧式距离的特殊应用。欧式距离不能忽略比较对象的维度,所以在针对不同维度的比较对象时,需要对数据做标准化处理,这些经过处理后的标准数据,再采用欧式距离比较时有个新的名字:马哈拉诺比斯距离。 余弦相似度这里有个和“距离度量”类似的名词“相似度度量”,相似度度量(Similarity)在下面的会频繁用到,我们用 “Sim” 表示 皮尔森相关系数即相关分析中的相关系数 r,分别对 A 和 B 基于自身总体标准化后计算空间向量的余弦夹角: 欧氏距离与余弦相似度欧氏距离是最常见的距离度量,而余弦相似度则是最常见的相似度度量,很多的距离度量和相似度度量都是基于这两者的变形和衍生,所以下面重点比较下两者在衡量个体差异时实现方式和应用环境上的区别。 借助三维坐标系来看下欧氏距离和余弦相似度的区别: 从图上可以看出距离度量衡量的是空间各点间的绝对距离,跟各个点所在的位置坐标(即个体特征维度的数值)直接相关;而余弦相似度衡量的是空间向量的夹角,更加的是体现在方向上的差异,而不是位置。如果保持A点的位置不变,B点朝原方向远离坐标轴原点,那么这个时候余弦相似度cosθ是保持不变的,因为夹角不变,而A、B两点的距离显然在发生改变,这就是欧氏距离和余弦相似度的不同之处。 根据欧氏距离和余弦相似度各自的计算方式和衡量特征,分别适用于不同的数据分析模型:欧氏距离能够体现个体数值特征的绝对差异,所以更多的用于需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异;而余弦相似度更多的是从方向上区分差异,而对绝对的数值不敏感,更多的用于使用用户对内容评分来区分用户兴趣的相似度和差异,同时修正了用户间可能存在的度量标准不统一的问题。 在实际应用中都是距离度量和相似度度量结合使用,任何一个算法都是在特定场景下发挥到极致,脱离使用场景,这些伟大的发明仅仅是个公式。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(三):个性化推荐]]></title>
<url>%2F2018%2F03%2F16%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E4%B8%89%EF%BC%89%EF%BC%9A%E4%B8%AA%E6%80%A7%E5%8C%96%E6%8E%A8%E8%8D%90%2F</url>
<content type="text"><![CDATA[有上篇和上上篇的基础,我们就可以针对性的对一个产品搭建出一个个性化推荐模型,在这个模型中,我们需要解决两个问题: 第一推荐什么。 第二哪些内容应该优先推荐。 上两篇文章很好的给出了具体的算法参考,大家可以回顾。 在进入这篇文章的正题之前,我们先一起解决上篇文章遗留的问题: 1.依据上面的公式,最后的分值 P 是不是会变成负数?比喻 08 年北京的奥运会的某篇报道…… 2.很多 App 上的文章都有转发、收藏、点赞等功能,那么有这些因素存在后,算法该怎么调整? 先来解决第一个问题,我们看一下上篇文章中我们最后的公式为: 那么为了避免出现负数(其实负数并不影响算法的执行,只是在某些环境下,为了数据美观,我们尽量避免负数出现)这个问题很好调整,我们只需要将上面的公式做下微调 经过微调之后,热度值无限接近于零,这也符合实际,时间过去的越久,一篇文章的热度就越低。 我们知道任何一篇报道或文章都存在用户交互行为,像评论、收藏、点赞、转发等等行为是影响热度的重要指标,这个时候我们引入一个新的因子:用户行为分;我们用 表示, 那么我的公式最后就调整为: 在算法执行初期,根据运营的数据和经验,合理制定用户行为分,例如: 不同的产品这些分值可以调整,在算法实施过程中尽量保证各个影响因子能够调整配置。 好了,上面的问题解决了。看似很简单,做起来是很复杂的…… 当你和我一样,顺着这个思路,一步一步将这些算法上线之后,并获得一定的数据反馈和领导的认可,恭喜你,你的内容产品已经顺利度过早期阶段,拥有几万或者十几万的日活。每当这个时候,你会发现由于这些内容在你所制定的算法驱动下呈现给用户,会出现以下几个问题:1.内容太过集中2.个性化和长尾化的内容都被埋没 抱着解决这两个问题的目的,是时候上个性化推荐了。个性化推荐一般有两种解决方案,基于内容的个性化推荐;基于用户的个性化推荐。这两种解决方案,用通俗的话解释:喜欢A的用户在某种程度上也喜欢和A相似的B;喜欢A的用户1和喜欢A的用户2,在某种程度上有一定的相似性,那么尽量把用户2喜欢的某个物品(或文章)B推荐给用户1。 这两种解决方案,市场上都有典型的代表产品,基于用户的协同过滤对用户的规模要求相当高,所以今天的文章内容我们就以基于内容的个性化推荐为例展开。 我们先来看看几个名词“特征向量、分词、关键词”,任何两篇文章或者两本书或者两个歌单,我们都可以用“特征向量”来标识目标的属性,文章、书籍、歌单是所有标签(关键词)的合集,那么标签越类似两个目标内容越相似。获得关键词的第一步是要讲目标进行拆分,为了简捷,我们以两篇文章为例: 1.分词分词前面有提到过,分词有两个词库,正常词库和停用词库。正常词库类似一个规则,将目标文章按规则来分词;停用词库是去掉目标文章中没用的词,比喻:“了、吗、的、地”和“the、are、that”等之类的,因为这些词对分析没有任何作用,在分词前先剔除。 网络每天都在更新,正常词库和停用词库需要不断的更新,如果某篇文章中出现“疯狂打call”“尬聊”“扎心了,老铁”等词之后,机器算法是识别不了的。所以词库需要不断的更新,这些网上有很多,各种各样可供参考。 2.关键词关键词是决定一篇文章的特征向量指标,有没有可能两篇文章的关键词重合的90%,但是讲的却是两件事呢?答案是肯定的。看个例子: 文章1:“支付宝和往年一样又开始集福分钱了”主要讲述支付宝的集福活动,“支付宝”是个高频词,文章最后说了句:“大家可以分钱了”,那么“分钱”最后也被收录,进入了特征向量. 文章2:“现在过年压岁钱我都是支付宝发”。“支付宝”按例被收录,文章最后总结的时候说“每年过个年,都是在分钱,压岁钱都支付宝发,感觉时代进步真快”,虽然整篇文章“分线”只出现一次,但是还是被收录进入特征向量。 两篇文章的关键词非常类似,但是讲述的却是两个完全不同的事,这个时候机器算法就会出错,将这些相关性弱的文章误以为类似,这个时候推荐出去就会出大事,所以特征向量还需要引入第二个指标,叫词频TF(Term Frequency),衡量每个关键词在文章中出现的频率。 那么又有一个问题,如果两篇文章的关键词重合度很高,词频也和接近,是不是说明关联性就很强呢?大多数情况是这样的,但是也有特殊,比喻某些文章都是将武汉的,武汉美食、武汉大学、武汉互联网、武汉体育等等,这些关键词都包含武昌、汉阳、汉口等,并且都有这相似的频率,那么算法就会误以为他们是相关性极强的文章,所以我们引入一个新的指标,即在所有文章中出现频率的相反值,用IDF(Inverse Document Frequency)表示。这个也很好理解,因为一个词在所有文章出现的频率小,在某篇文章中出现的频率大,这个词就对该篇文章的标识作用越大。因此,关键词对文章的作用衡量出来就为TFIDF=TF*IDF,这个就是著名的TF-IDF模型。 3.算法实现 根据前面几篇文章的内容,两个向量的夹角越小,相似度越高,假设两篇文章的特征向量如下表: 那么这两篇文章就由“支付宝”和“分钱”两个重合关键词决定,根据余弦相似度可以算出两篇文章的相似度,这里不做赘述,有心的朋友可以看看前面的文章。 4.用户特征用户特征类似热度算法一样,根据用户阅读、评论、收藏、转发等行为来赋予一个“钟意度”,例如 那么将文章和用户钟意度结合起来,我们只需要将关键词的TFIDF乘以用户行为特征即可得到用户特征分数。 我们有文章特征、用户特征,就能根据根据用户关键词做匹配,得出最符合用户胃口的文章,做出个性化推荐。基于内容的个性化推荐不需要大规模的用户量,无论几亿、几千甚至几百都可以,因此是绝大多数产品前期做推荐的不二首选。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[谁知道这首诗的名字?]]></title>
<url>%2F2018%2F03%2F15%2F%E8%B0%81%E7%9F%A5%E9%81%93%E8%BF%99%E9%A6%96%E8%AF%97%E7%9A%84%E5%90%8D%E5%AD%97%EF%BC%9F%2F</url>
<content type="text"><![CDATA[其实,所有的美丽都会随时间飘走其实,所有的花朵都会被风雨带走芬芳剩下的只有静静飘摇的旧时光倒影这一苑黄花一苑恋人的不胜忧伤当所有的风景都换成黑白两色是否还有人向往着彼岸的灯火一路上一路上我们都没话说一路上一路上我们眼里看的会不会是同一片云朵风熄了,草长了岁月变成沙漠烟消了,梦醒了喧哗变成寂寞你是你我是我虽然可以彼此诉说忧伤但是我们的痛苦却一直沉默]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[直播的新玩法]]></title>
<url>%2F2018%2F03%2F14%2F%E7%9B%B4%E6%92%AD%E7%9A%84%E6%96%B0%E7%8E%A9%E6%B3%95%2F</url>
<content type="text"><![CDATA[产品架构方面这个其实你到处都能够找到,这点不新鲜,毕竟直播这种产品还是媒体属性,既然是媒体,看的依旧是内容。 从用户角度看就我这个非粉丝纯好奇的用户观察,目前直播的平台少说也有30+了吧,还有些人想进来。但是,我个人觉得靠风投输血总不是个事儿,如果吸引不来新的人,后果只有血本无归(不是危言耸听,参考之前的团购大战就知道)。玩儿了几个,感觉目前做得不错的应该是斗鱼,战旗和虎牙(我其实不是太熟)。斗鱼和战旗都是最早最直播的,虎牙靠YY的老用户转身的,有一个共同点就是—都是做游戏出身,可见游戏拉用户黏度是一个非常棒的角度。因为主播能提供的内容管太多只是表层,而且是需要重复的,一个天天直播的主播你还能期望每天能整出什么新鲜玩意儿,因此观众看的时间一旦久了,新鲜感下降是常态。游戏则不同,因为每一把游戏都不是重复的(比如LOL),骨灰级别的玩家们总是会想出新的手法去获胜。其次是唱歌主播,虽然有很多歌,很多曲风可以发挥,但是由于唱的人自身的素质问题,唱久了音色依旧会让人感到审美疲劳。另外,很多唱歌就是走过程,不是在“唱”这个点上 综上,平台的走向,就直播来说,内容发展到一定时期是需要规范化,深入化的-也就是所谓的专注度。规范化包括: 1. 直播内容要正规,涉黄违法啥的你玩儿不长久(别和我强调ooxx是任何新鲜事物的内动力,对,我不否认,但是没有哪个ZF会允许你明着来,何况天朝);经过一轮的媒体轰炸后,直播平台的自律意识会加强,至于监管给力多少,是否表里如一,那是另外一回事儿。 2. 版权,现在很多直播平台还有些主播用的是盗版的视频作品等,这个擦边球肯定打不久的,随着直播内容深入细分,既要包括对直播内容的梳理,对形式的扩展(比如吸引更多的明星来做客,五花八门),这些个人主播端,也要包括平台自身活动的策划,主播和观众的互动,长期节目策划和制作等等。 关于商业化直播的商业化,我认为这是最难的一点。不管是YY还是斗鱼,很多都还是一些土豪在输血,屌丝撑人气,个主播吸引人其实也只是起了二八效应的绵薄之力,其中花钱的粉丝也如此。相比于一般的网站,用户在斗鱼等直播平台的观看时间会长一些,因此,一个盈利点就出来了—广告。这是传媒或者门户网站盈利的最为主要的方式之一。目前,直播平台大多数都是和游戏厂家合作,未来随着直播的多样,广告收入和广告渠道也会丰富,因此盈利比较可观。软实力方面说完了,剩下是硬件。可以考虑出售一些硬件设备,现在申请主播的人开始逐渐增多,可以考虑推荐一些设备,整一个线上商城,卖摄像头,电容麦,云台,自拍杆,美颜相机等等,并打包一些服务卖出。再考虑做变现的时候,直播平台节流是非常重要的一环,除了庞大的宽带费用,某些主播的签字费,盈利点拿捏不好会出现蛋糕做得太大,但是分不了的情况。]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>直播</tag>
</tags>
</entry>
<entry>
<title><![CDATA[需求调研不是你想的那么简单]]></title>
<url>%2F2018%2F03%2F13%2F%E9%9C%80%E6%B1%82%E8%B0%83%E7%A0%94%E4%B8%8D%E6%98%AF%E4%BD%A0%E6%83%B3%E7%9A%84%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%2F</url>
<content type="text"><![CDATA[产品经理的工作在不同的企业或者不同的行业,工作方式和内容相差很大,在不断扩散和细分的趋势下,产品经理是一群和某一类人的总称的概念越来越深入人心,如同“工程师”这三个字,可以不断的细分到各个领域,如“数据产品经理、AI 产品经理、UGC 产品经理、电商产品经理”等等。今天我们就一起看看这一类人日常中交叉的一部分工作:需求调研。 产品工作的现状我始终坚持自己的观点:人人都是产品经理 这句话是不对的。产品人的基本要求我觉得有三点:善于发现、善于转化、善于学习;再大一点就是:善谋或善断。产品这个岗位我大致归属在两个大的环境中存在:互联网公司、软件公司。这两种应该包含了所有,这样分的原因很简单,因为在做需求分析的阶段,这两种公司存在一个很大的差别就是“咨询”这个角色。其实根据我自己的经历,需求调研在我呆过的公司里面是最不被重视的(至少以前的工作是这样),因为 leader 和老板都觉得这个过程属于浪费时间,而且他们总有种“自己超级懂用户,一句话可以描述所有人的痛点”的错觉,所以经常会听到这些词眼“无非是…”、“…不就是…”、“这很简单…”、“我看…也做了,我们就按照…来”等等。无论在软件公司还是互联网公司,我觉得一个产品的周期理应是:需求调研/用户画像/原型设计/开发上线。而大部分公司都是从第三部开始的,并且老板和 leader 还把这个当做产品的重要考核,所以需求调研要么没有,要么一笔带过,这种现状的结果就是:超低质量的产品一搜一大把;功能复制型产品比比皆是……最难也是最重要的就在第一步,第一步是用来定型的,也就是一座大厦最后的主干,比喻,微信的主干就是聊天;支付宝的主干就是转账;网易云音乐的主干就是听歌。如何判断一个产品的主干是什么其实也好做,你就试着拆分那个产品的功能结构,然后去除某个功能,你看看你还会不会用就知道了,所以张小龙的一句话颇有感触“一个产品只能有一个主要功能”。下面这句话很多产品人都有体验,但是晚了。 “设计产品是一件非常困难的事情,很多时候,只有在产品面世后,人们才知道他们想要什么。” (Steve Jobs) 如何去了解需求身临其境是最快,也是最有效的方式,比喻:你在一个都讲粤语的环境下生活,很快你也会遇到美女喊“亮妹”遇到帅哥喊“靓仔”。做产品也一样,你要准确的获取需求,你需要参与到这个需求的主体中去,贴近用户,最简单的获取需求的方法:提问聊天+观察反思。如: 用户:我想吃周黑鸭 仔细了解和询问之后,这个用户正在看18年的 NBA 比赛,旁边垃圾桶中都是烟头和啤酒罐,平时喜欢吃辣,是个零食控……那么如果是你你怎么提供?如果是我,有周黑鸭的话,提供一盒,然后加灌啤酒一盒香烟;没有周黑鸭的话,一盒小零食套餐(薯片饼干),然后附送一份 NBA 球星纪念卡……我们如上做了三件事:需求收集/需求分析/给出解决方法。 我想吃周黑鸭。(需求收集) 看 18 年 NBA…是个零食控。(需求挖掘分析) 周黑鸭/零食套餐。(解决方法) 接下来我们看看这个过程中具体的细节,首先我们得到“想吃周黑鸭”在不了解用户场景和使用细节的时候,只通过这句话,貌似只能是周黑鸭才能解决痛点,因为你得不到除此之外的任何信息,通过询问和聊天之后,我们发现,他是在看 NBA 的场景下产生的需求,这个需求是什么?这个需求是“将闲情的场景渲染的更加浓厚,体验更加舒适,精神和视觉的双重满足”那么仅仅是周黑鸭能达到么?一袋零食行不行?一个零食套餐行不行?在上个例子中,细心的同学已经发现了,我们提供的两种解决方案,都有个特点,就是附带了一些用户没有直接表明需要的服务,这是什么?这是需求挖掘啊,需求挖掘除了分拆当前的痛点,更多的是提供衍生方案,因为很多时候,用户都不知道自己要的是什么,但是那个需求真实存在。聊天需求,只是做个 IM 吗?大家聊着聊着想看看对方的生活故事,如是有了朋友圈;转账需求,仅仅是做个转账吗?钱来钱往,大家纷纷考虑理财,如是有了“余额宝、花呗、借呗”;听歌需求,仅仅是做个在线听歌软件么,除了下载、收藏还能干什么?听着“我相信”就想到了高三的誓师大会,听着“漂洋过海来看你”就想到前对象…这种情感共鸣之下歌曲评论就悠然而生。这样的例子有很多,只要去思考发现,很多产品的思维是可以借鉴和学习的。 需求调研的步骤需求调研的步骤可以分为四步:1.需求收集2.需求挖掘3.需求评估4.需求分析 需求收集的方法有很多种,常见的比喻问卷、普查、反馈、后台数据等。当我们主动去收集需求资源的时候也是有道可循的,比喻你要做一款校园的工具型产品,那收集的对象就很鲜明,你直接在校园登点即可,问卷的投放渠道也尽量是学生所能看得到并且有动力参与的。 需求挖掘,是个复杂也是最难的步骤,这个只能靠自己,就如同一道数学题,同样的学习,有的人就是能找到最优方法,在最短时间内解出答案,你也能作对,但是耗费的时间和精力是双倍的,这就是一个人能力的瓶颈。当然平凡的人毕竟占多数,我给出两个方法用于需求挖掘:需求穷举和重点锁定。这是什么意思,就是面对一个需求或者一个问题,你要反复的去问自己“为什么/怎么做”,这就是“归因”;找出问题的本质,换位思考问题的初始原因和发生场景,把自己当作用户去找方法,这就是“同理心”。当一堆的问题和答案摆在你面前,你需要锁定最直接最有用的去转换成产品功能。如,这是个信息获取的穷举案例(仅供参考)信息获取:怎么获取?主动去找:找的方法有哪些?搜索:搜索模式有哪些? 需求评估,这个步骤是一次“砍”需求的过程也是一个规划的过程,这个过程需要有个理性的判断,做决策的过程。不该留的坚决不留,应当做的非做不可。这个可以按照重要性和紧急程度去判别,当然这个建立在已经过滤了伪需求,下面是一个四项限模型,优先级:一>二>三>四。 需求分析,其实走到这一步,你的产品基本定型了,你需要为你的产品画个圈圈,产品边界在哪,底线是什么,你可以采用基本的需求扩散、拆解、组合等等方法打造出你的木桶高度,你的团队的就是木桶容量,承载能力决定付出的成本和受益效果。你可以把这个过程好好利用,这可能是你的一次复盘,也可能是你的一次启发。 总结产品人没有对与错,只有优秀和一般之分。任何一个产品不可能100%满足所有人的口味,产品本就是在众说纷纭,夹缝中迭代的过程,成就对!败也没错。走好自己的每一步,不马虎不应付,哪怕最后创造的产品结果是停止运营或者下架,回忆这个过程,仍然甜过初恋。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>复盘</tag>
</tags>
</entry>
<entry>
<title><![CDATA[禅说]]></title>
<url>%2F2018%2F03%2F12%2F%E7%A6%85%E8%AF%B4%2F</url>
<content type="text"><![CDATA[曾经,满树花开就等你经过曾经,满洒一地花瓣是为你颤抖曾经,香风阵阵就为了优雅的亲吻现在,微风吹过只因要拂去尘埃现在,满地落花只因土地不够肥沃现在,满树花开只因树要结果禅说树就是树花就是花风就是风尘还归尘]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[直播,欲望的驱动效应]]></title>
<url>%2F2018%2F03%2F11%2F%E7%9B%B4%E6%92%AD%EF%BC%8C%E6%AC%B2%E6%9C%9B%E7%9A%84%E9%A9%B1%E5%8A%A8%E6%95%88%E5%BA%94%2F</url>
<content type="text"><![CDATA[我试图从一名用户的角度去分析:我为什么看直播? 因为有美女啊,美女是什么?我为什么看美女?咱们有句老话叫,“窈窕淑女,君子好逑”啊!这是人之本性啊!另外为什么看?因为我想看看她们都在做什么啊?讲什么?这是什么?这叫想窥探她的秘密啊,所以题主所问,看直播背后的需求是什么? 简单不过,荷尔蒙和窥私欲啊,这是人之本性,这才是“刚需”啊,是雷打不动,腰斩不断的与生俱来的需求啊,大圣贤王守仁说,“天理即人欲”,那是什么?就是要告诉我们说顺应人的欲望就像天理一样正常啊,这就是为什么你在街上看见美女,总想回头望一望,挤地铁时候,看见别人玩手机,你总会有意无意瞄一眼。 所以这才是直播爆红背后的核心关键所在。 但是,我相信在直播的背后一定还有另外的诉求被得以满足,因为每一种爆红现象的背后,一定是对消费者心理的准确洞察。 一、直播的“情感共鸣”:无论在什么情况下,我始终认为感动是这个世上最牛逼的武器,这种通过人与人之间的情感互动引起的共鸣,可以让人短暂忘却所有的情绪状态。 就好比在影视剧中,观影者在观看电影的过程中,身份会随着主人公一系列的苦难、磨练,痛苦而带入,而现实生活中观影者过往自身的林林总总,工作不顺,小人算计,心酸,苦辣一并涌上心头,情感在此刻达成共鸣,而忘却了自己现实生活中的不顺,这也就是为什么?所有的企业营销策划活动,老板总说“要能唤起消费者情感共鸣”,公司的策划在写文案的时候,老板都说 “妈蛋 要走心”。 那么回到直播,我认为在直播的过程中,人与人之间也产生了“共鸣”。 如今的互联网时代,科技缩短了人与人之间的距离。隔着屏幕,刷着弹幕,看着他人此刻的举动和感叹,大伙可以通过这种”共时性”的行为体会情感上的交流。 从这个意义上来说,直播,也是一种“情感共鸣”。 因为你有人陪了,因为你不无聊了,大家通过直播聚在一起,寻求的并不一定是内容的丰富性,而是窥私,互动,或者因为此刻“有你”陪伴。 因为我们可以通过一块小小的屏幕,就可以轻而易举的与另一个甚至很多个遥不可及的人产生无延时的“勾搭”,我们一起怒喷,谩骂,举杯高歌,推杯换盏。 因为你会发现有另外一个你说出你从来不敢说的话,你会发现那是平时不曾丢掉的节操下线也可以轻易丢掉,这是何等的快感~~所以你会大嚎一声,“沃茨,原来直播真好玩”。这种新的形式让当代的小伙伴产生了巨大的满足感。 二、直播的“金钱模式”:在经济学里有一个著名的效应,叫口红效应,也就是说每当在经济不景气时,口红的销量反而会直线上升,人们会把口红作为一种“廉价的非必要之物”安慰自己,尤其是当柔软润泽的口红接触嘴唇的那一刻(不是姑娘在亲你,别YY了兄弟 ),会造成一种“生活品质提升”的错觉。 因此,当主播念出了打赏投入的那位观看者的名字并表示感谢之后,你会发现区区百十块钱的打赏,就能在某一个直播间里让某一个人享受到等级瞬间提升的快感,甚至一步登顶,变成令人羡慕的“社会顶层”。 在这个小小的直播间里,付了钱的人如同帝王,不仅可以得到美女的感谢,甚至还可以命令“后宫佳丽”们说出他们想要听的话,甚至是做出他们要求的举动。 这是什么啊?这是皇上啊,皇上最吸引人追逐的是什么?是权利啊,“问世间,权为何物?直叫人生死相许啊”,兄弟萌!而观赏者就是这个角色,深陷其中,而不能自拔。 而这种消费心理,我想任何的直播平台绝不会不知道,而他们也一定会使劲浑身解数展开行动让更多人体会帝王的荣耀,所以你会看到在直播间里有人凑热闹的,有人发更大红包的,还有人会喊“沃茨,大土豪,真牛逼”,在这样的情绪之下,主播的直播的内容还有关系吗?无所谓了吧,重要的是 “土豪任性”。 那么回到直播平台,题主说直播越来越多,这样庞大的利益,连BAT都不敢放弃,各路公司更是都想来分一杯羹啊,正所谓,天下熙熙,皆为利来,天下攘攘,皆为利往。 说到这,可能有人要喷我了,打赏的土豪毕竟少数,对,说的对,除了少部分的“真土豪“以外,绝大多数受众是基数庞大的收入中下阶级,但是无论是谁,他们都需要阶级提升感和满足感,而直播可能是最简单的方式。 而这也成就了直播成为了当下大量社会男青年的YY场所,我们屌丝有什么共性?我们没有见过“世面”啊,我们一生鲜有机会接触高端美女人士,不能体会到那种浑身气场,气质超凡脱俗的场景啊,所以我们只能通过这种情色擦边来满足自己的需求啊。 而直播恰恰解决了这种对高阶层气质向往的权力感和情色欲,尤其在情色展现上,让人“意淫”的方法就更为简单粗暴,什么showgirl,素人,cosplay,还有各路主播,穿着都极为惹火,让人浮想联翩,所以你会看到浓妆艳抹,烈焰红唇,黑丝低胸成为标配,有的美女更是拼了,拿鞭子自残,痛苦不堪,却依然故我,意志之“坚定”堪比佛祖释迦摩尼,因为她要满足我等屌丝肉欲想象啊,让你走向人生巅峰啊。 这也就是为什么,国家一再打击粗俗淫秽,但也总是屡禁不止,因为平台甚至都“有意为之”啊。 对于直播是否能长久? 我反问一句,你说呢?]]></content>
<categories>
<category>碎碎念</category>
</categories>
<tags>
<tag>直播</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(二)热度算法]]></title>
<url>%2F2018%2F03%2F11%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E4%BA%8C%EF%BC%89%E7%83%AD%E5%BA%A6%E7%AE%97%E6%B3%95%2F</url>
<content type="text"><![CDATA[上篇文章分享了“余弦相似度”的理解和实例应用,今天和大家一起分享下热度算法。 21世纪注定是一个信息大爆炸的时代,我们不再担心获取信息的渠道有限,信息量狭窄等问题,互联网将世界各个地方的人、事、物巧妙的链接起来,相互交互,共同渗透……那么在任何一个硬件设备上展示最有价值的内容,自然成了每个平台都需要思考的问题,所以排序问题就悠然而生,今天要分享的就是解决一些信息排序问题需要用到的“热度算法”。 本文结构如下 基本原理 实例分享 总结 热度算法的基本原理任何一个算法都存在一个巧妙的思维转换,为了便于理解,这里我们形象的举一个例子。假设现在有一杯100摄氏度的水,我们将这杯水放在室内的桌子上,很快这杯水的温度会下降到和室温保持一致,那么能得到这样一个公式:最后的温度T=初始温度T0-随时间衰减的温度Tt那么我们现在假设存在一篇文章,这篇文章最后呈现在用户面前时候有一个衡量它新鲜度的值,那么我们就可以根据这个值来把成千上万的文章有序的排列下来,让那些新鲜度高的文章展示在前面,优先让用户看到,我们形象的把这个值称为文章当前的热度。那么一起看看下面的实例吧!!! 实例我们以一个新闻报道为例来解释这个算法的逻辑。既然这个值是我们人为给添加的(没有哪篇文章真正存在热度),那么为了公平起见,我们把新闻类的报道分类,每一类都给一个初始的值(保证那些非常非常冷门的文章报道不至于在起跑线上就输了),好了,我们大致把报道类的文章分成:科技、金融、体育三个类别。那么最后的值P=P0-Pt。(Pt,随时间衰减的值) 初始值都一样吗 初始值P0 我们先抛开“这样设定的依据是什么?“的疑问,在很多时候,规定一项制度或规章,是解释不清的,比喻“为什么过往行人一定要靠右走?靠左走行不行?” 根据不同的产品,这个初始值可以调整,比喻某个体育报道的 App 他可以将体育的初始值调高一点,或者某个产品的用户数据体现出,金融类文章的点击率和收藏量很高,那么针对这些用户这类文章的初始值也可以微调高于其他类。 如上表,我们例子中的三类文章的初始值: 科技:P0=1 金融:P0=2 体育:P0=3 热度的衰减随时间的变化其衰减梯度是一样的吗我们假设时间为24小时,由牛顿冷却定律,我们知道,任何一个向外散播热度的过程满足一个数学公式,下面是来自维基百科的“牛顿冷却定律: 一个较周围热的物体温度为T,忽略表面积以及外部介质性质和温度的变化.它的冷却速率(dT/dt)与该物体的温度与周围环境的温度C的差(T-C)成正比. 即dT/dt=-k(T-C).其中,t为时间,k为一个常数. 计算方法是: 对dT/dt=-k(T-C)进行积分,得 ln(T-C)=-kt+B (B为积分常数) (T-C)=e^(-kt+B) 公式1 设t=0,也就是物体的初温,上述公式1变成 (T0-C)=e^B 然后代入公式1得 T=C+(T0-C)e^-kt 算出B与k,代入t的值,就可以算出某个时间物体的温度. 科学的解释总是符合一点,balabala 一大堆,最后还是不知道说的啥。。。我们简化上面的内容,直接上公式 很明显,热度的衰减不是线性变化的,那么我们的文章冷却就可以参考这个定律(文章不可能说过十小时就掉10分,其变化也不是线性的)那么类似的,我们可以得到一个公式: 热度衰减公式 (有兴趣的可以去推导这个公式,为了不制造麻烦,现在你只需要记住这个公式就行,其中T0是发布文章时间,T1是当前时间,e=2.7182818284…) 最后的公式经过上面的分析,最后公式就演变成: 分值计算公式 这样一来,就可以根据初始值、衰减值,最后算出当前值,然后给文章排序。这里我们不做数学公式演示,有兴趣的可以自己制造数据尝试为100篇文章排一下序。 总结热度算法应用中,我们首先明确我们的思路,以一个分值来衡量某篇文章的新鲜度和热门程度,然后以这个分值作为排序的标准。最后解决一些影响分值变化的因子最终得出具体的计算公式。 大家可以先思考下面几个问题,下篇文章将给出解答。 依据上面的公式,最后的分值 P 是不是会变成负数?比喻 08 年北京的奥运会的某篇报道…… 很多 App 上的文章都有转发、收藏、点赞等功能,那么有这些因素存在后,算法该怎么“调教”? 如果你是一枚 PM 正在了解产品中相关的算法,我们可以一起交流学习,只会画原型、跟进项目、排期迭代这些技能似乎会被行业淘汰,机器学习、人工智能、搜索引擎、推荐算法等等热词如今已和产品经理四个字紧紧的凝固在一起了,这个系列文章会不断更新,我们一起加油,一起升值。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[年轻]]></title>
<url>%2F2018%2F03%2F10%2F%E5%B9%B4%E8%BD%BB%2F</url>
<content type="text"><![CDATA[夏代有工的玉,后海有树的院子,此时此刻的云,二十来岁的你…]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[产品经理识算法(一)余弦相似度]]></title>
<url>%2F2018%2F03%2F09%2F%E4%BA%A7%E5%93%81%E7%BB%8F%E7%90%86%E8%AF%86%E7%AE%97%E6%B3%95%EF%BC%88%E4%B8%80%EF%BC%89%E4%BD%99%E5%BC%A6%E7%9B%B8%E4%BC%BC%E5%BA%A6%2F</url>
<content type="text"><![CDATA[这系列文章会以连载形式呈现,后面会不定时更新,旨在和大家一起分享学习相关的算法。关于各个产品中的算法,像 csdn 等技术博客都有介绍,总结下来有以下几点: 代码形式 解释的层面和角度偏技术 缺乏实例 这就是我写这系列文章的动机,通过实例通俗易懂的语言来解释算法的逻辑和应用。本文的结构如下: 余弦相似度的数学表达式 公式解读 应用实例 优缺点 数学表达式假设平面存在向量 a 和向量 b,由向量的点积公式可得俩向量的夹角: 将向量 a、b 赋予坐标,如:a(x1,y1),b(x2,y2),带入上面公式,得到: 将向量 a、b 由平面推广到多维空间上(有相关论文已经证明推广到多维空间,公式仍然成立),得到: 公式解读数学上,这些公式很好理解,只是简单的代换转化,那么余弦相似度是怎么引用到产品上的呢?余弦相似度一般会应用在研究两篇文本的相似程度上,这里有个思维的转换:我们先把文本当作是一个向量,里面出现的词频数量当作上述公式中多维向量的坐标,运用上面的公式就可以算出两个文本的相似程度;具体我们看一下下面的例子。 应用实例例 文本1:“产品经理”;文本2:“数据产品经理和项目经理”,现在用上面的公式计算文本1和文本2的相似度。我们首先将文本1和文本2进行分词(关于分词,后面的文章会介绍),文本1分词后:“产品/经理”;文本2分词后:“数据/产品/经理/和/项目/经理”。分词完成后,将分好的词形成并集得到{数据,产品,经理,和,项目}。我们把文本1和文本2分别命名为向量 A 和向量 B ,接下来计算 A、B 的坐标;并集中的词一共有5个,那么这5个词分别在文本1和文本2中出现了多少次很容易得出来,形成以下这个表格 文本1 文本2 数据 0 1 产品 1 1 经理 1 2 和 0 1 项目 0 1 将这些词在文本中出现的次数定义为该向量的坐标就有: A(0,1,1,0,0) B(1,1,2,1,1) 那么,代入上面的公式为 如果一模一样为100%的话,那么75%这个数值就可以来衡量文本1和文本2的相似度,其实通过字面意思,我们也可以判断两个文本是很相似的,无论数据产品经理、产品经理、项目经理在某些环境下,其实就是同一个人😭。 优缺点在分析优缺点的时候,我们先看一看余弦相似度的应用场景: 文本本身对字或者词的顺序不敏感,比喻“蛋炒饭”和“饭炒蛋”、“王者荣耀”和“荣耀王者”等等。 篇幅大,字数多的文本,一篇文章,一篇论文,一本小说等等。如果两篇文章的相似度很高,就说明两篇文章的用词很多是重复的,存在抄袭行为;还记得大学时候编造论文字数的日子吗,经常会自己去验重,对的没错,就是用这个原理啦!! 优点: 操作简单,不需要很复杂的处理,分词后得出词频,就可以计算 短文本,长文本都可以使用 软文、新闻、论文等领域都可以使用 缺点: 对顺序敏感的文本不适用。像年号等等,如:“二零一八年”和“二一零八年”;“数据产品”和“产品数据”等似度是100%,其实字面意思看得出,这两个文本表达的意思完全不同。 重复字词较多的文本。如某个领导对你说:“产品!数据数据据数据数据!”和“产品产品产品产品!数据!”两个文本的交集就是其并集,相似度为100%,但是表达的重点是不一样的。]]></content>
<categories>
<category>我爱数学</category>
</categories>
<tags>
<tag>算法</tag>
</tags>
</entry>
<entry>
<title><![CDATA[同学]]></title>
<url>%2F2018%2F03%2F09%2F%E5%90%8C%E5%AD%A6%2F</url>
<content type="text"><![CDATA[人生只有两个年龄年方或者 年过宇宙只有两个时刻毕业后或 毕业前生活只有两个姿势低头或者 仰望心跳只有两个时刻初见或者 再见这么多年你 只变了一点点从同学变成 老同学你在我的故事里永远就一个角色花儿或者 少年]]></content>
<categories>
<category>老来多健忘</category>
</categories>
<tags>
<tag>诗</tag>
</tags>
</entry>
<entry>
<title><![CDATA[10个案例说明什么是产品模型(二)]]></title>
<url>%2F2018%2F03%2F09%2F10%E4%B8%AA%E6%A1%88%E4%BE%8B%E8%AF%B4%E6%98%8E%E4%BB%80%E4%B9%88%E6%98%AF%E4%BA%A7%E5%93%81%E6%A8%A1%E5%9E%8B%EF%BC%88%E4%BA%8C%EF%BC%89%2F</url>
<content type="text"><![CDATA[7、接着说网易摄影,它是我在2007年用门户资源拉起来的一款摄影产品,2009年跟着我并入网易相册。在摄影分享社区(不包括摄影论坛),流量居于POCO之后的第二位。 商业模式以国内的摄影大环境, 摄影产品很难有成熟的商业模式。体量最多做到100万量级,盈利主要靠卖广告,从商业上来看,只是一笔垂直市场的小生意。除非把摄影圈内的影响力做到振聋发聩,靠影响力变现,才能提升到下一个层次。 产品架构摄影产品有几个方向。一是媒体,侧重于优秀用户的作品展示。二是社区,侧重于摄影爱好者之间的社交互动。三是论坛,重话题讨论,而作品展示的效果平平。 不同的方向,做法完全不一样。其中论坛的产品形态老化,而媒体的想象空间不够大,于是我选择了社区,但后来有点后悔,待会儿再解释。 社区也有好几种做法,我在2007年用分类展示,2009年拓展关注动态,2010年拓展小组与活动,都没有很好的效果。数据还能看,但带不动亮眼的上升曲线。 2011年,我惨然总结道,产品架构并没有错,然而目标用户群的定位错了——这是运营体系的范畴。理解到这一点,我做社区产品才刚刚入门。 运营体系社区运营最重要的事,是定义你的核心用户群。 我下的定义是“摄影爱好者”。 问题是,国内的摄影爱好者又分成很多种类。老法师,小清新,器材党,学院派,旅行摄影,商业人像……更多的是刚买数码相机,热情很高昂,姿势很难看的摄影小小白。这些人混在一起乱了套,互相瞧不起,就像是龙猫同笼一样很快掐起来。 所以运营需要定义清楚,谁是我的核心用户,先伺候谁,不伺候谁。 一开始,我来者不拒,门户自然导入的流量以伪摄影爱好者为主,社交最活跃的是中老年,内容质量最高的是商业人像。2010年以后,运营向小清新倾斜,这时龙猫同笼的麻烦就来了。垂直社区并不是靠流量推起来的,口碑传播更重要得多,如果产品气质不纯,那么社区的吸引力也不强,而摄影这个主题圈子里,用户群的差异实在太大,合笼必然损毁掉鲜明的气质。 做产品,减法永远是王道。 在这个致命的背景下,具体的运营动作怎么做都是平庸。 好的社区运营,是从一小撮核心用户身上生长起来的。彼此气味相投,惺惺相惜,产品设计与运营动作围绕着他们去展开。有了鲜明的社群气质之后,品牌形成,自然扩张,在这个过程中再渐渐吸收多元化的用户,同时也冷酷地干掉背离社群气质的用户。 这样就能理解我之前说的“后悔选择社区”,从门户导入的流量构成太杂,对垂直社区几近于作死,但不借力于门户,我又缺乏平地里做一个社区起来的信心。回想起来,或许借助网易的门户品牌,走媒体路线是更好的选择,但产品经理都有一个愚蠢的社区梦。 8、很少有人知道我在2010-2011年还做了一个婚纱摄影的电商平台,网易爱拍。 它的模式和现在点评网做婚纱摄影业务相似,商家入驻开店,为婚纱摄影提供定制的展示服务,用户获取短信优惠码进店打折,网易则得到一单数百元的提成。 在爱拍上,你可以按不同的风格、颜色、服装来筛选婚纱照的样张与买家秀,借助于我做网易摄影的经验,展示效果相当出色。即便在两三年后,这个网站看上去依然不错,找不到另一款能与之相比的“挑婚纱”产品。 然而它死相难看,2011年即停止运营。 商业模式商业模式上没有任何问题,虽然只是个垂直小市场,但有着刚性的消费需求。如果我们能帮助用户找到更满意的婚纱照,就能在高毛利率的婚纱摄影店里拿到丰厚的佣金。按我当时计算的一二线城市体量,一年做到几亿流水很正常,横向拓展到更大的婚庆市场后,盈利前景更佳。 产品架构产品架构也没什么问题,主题商店街嘛,关键性的商品展示与筛选都做得很好。你甚至能筛选全站所有粉色系、古典风格的旗袍样张,或是所有在马尔代夫外拍的买家秀。拍过婚纱照的人都知道,套系说明非常复杂,非常唬人,而爱拍实现了套系商品的标准化,支持对比不同商家的套系细节。虽然商品评论还不够强,但只要有流水,迟早能把评论给做起来。 运营体系对头,这一回我还是死在运营上面。 这倒不是BD的锅,当时杭研BD组特别支持我,试点城市天津的婚纱摄影店TOP100,入驻了70%,不少还给了用户特别的折扣。那我是怎么挂的呢? 要知道,婚纱摄影虽然消费刚性,但频次低到……你能理解的对吧。它是一个在人生的特定时间段,突然出现又很快消失的强需求,所以几乎无法建立产品品牌。我的推广渠道是网易邮箱的登录页与EDM,前者给了一个月,后者只给了几百万的量。哪怕EDM点击率优化到了3%左右,但邮箱部门并不能容忍我不停发垃圾邮件(他们是对的)。 爱拍上线三个月后,我发现自己失去了大部分的推广渠道,或者换个角度说,门户无法为这种突发性的消费场景提供有效推广渠道。由于这三个月的销售数据(对于网易)并无惊喜,我无力在内部争取后续推广资源。虽然天津婚纱摄影店纷纷表示,你们一开始做到这个量已经很不错了,网易大厂牛逼!爱拍前程似锦!但我自己明白,产品已仆街,有事请烧纸。 那么谁才能抓住突发性的消费场景呢? 想想看,传统婚纱摄影店是怎么做的。在闹市区开店,吸引过往人流的视线,日久天长留下印象,真要拍婚纱时,就会去留在脑子里的那条街,那家店。而在互联网上,“闹市区”就是热门的本地生活网站,“店招牌”就是稳定的频道入口。产品本身的差异性在这里近乎于零。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
<entry>
<title><![CDATA[10个案例说明什么是产品模型(一)]]></title>
<url>%2F2018%2F03%2F09%2F10%E4%B8%AA%E6%A1%88%E4%BE%8B%E8%AF%B4%E6%98%8E%E4%BB%80%E4%B9%88%E6%98%AF%E4%BA%A7%E5%93%81%E6%A8%A1%E5%9E%8B%EF%BC%88%E4%B8%80%EF%BC%89%2F</url>
<content type="text"><![CDATA[这系列文章来自胸大、腿直、腰细的银叔(图右)之手,非常感谢这位互联网神级 PM 共享的产品思维,受益终身。 1、我高中的时候,同学的哥哥问我,人生最爽的事情是什么?我说,是游戏。他微微一笑说,不,是女人。我大学刚毕业的时候,还是这位哥哥问我,人生最爽的事情是什么?我说,是女人。他微微一笑说,不,是飙车。 2、2010年的时候,很多人,也包括我,都觉得成功的决定性因素是“产品做得好”。 2013年,我改变了看法,产品太容易同质化了,差异化的竞争要点是“产品运营得好”。 2015年,我又改变了看法,设计和运营都没那么重要,决定性因素其实是“产品模型搭得好”。 不知道2017年,我又会怎样看待这个问题…… 3、最近一年,我经常在微博上提到产品模型,但又解释不清楚,像个神棍。 一定要讲出来的话,产品模型=商业模式+产品架构+运营体系。 商业模式指产品的市场潜力,综合了用户与营收价值。产品架构指产品设计上的框架与核心系统。运营体系与产品架构类似,指运营上的组织流程与重点难点。 这么讲,我大约还是像个神棍。 4、上周发微博说,产品模型在理论上决定产品的数据上限,商业潜力,生命周期;而产品与运营团队只能在这个理论值之内,试着走得更远一点。更有趣的事情是,APP的产品模型在前半年就定了下来,以后几乎不可修改。 这也就是我经常说的“产品宿命论”。一款产品的命运,在你发布它的时候几乎已经预定好了,只是那时你还不知道而已。接下来的一年两年三年,都只是一点点去接受既定的那个结果。 信奉这个道理之后,我在2015年更快速地上项目,也更快速地撤出项目。 APP时代已经不存在“总有一天熬出头”这样的事情了,一击不中,抽身而退。 5、为了庆祝即刻将我的产品文章设为推送主题,本周放一个大招,用10款我做过的产品案例,来讲解什么叫做产品模型。 这也是讲清楚产品模型的唯一方法。 对别人家的产品,我也可以分析产品模型,但不知道具体的数据与背景,总免不了隔靴搔痒,所以还是分析自己的产品比较稳妥。 从2009年说起。 6、2009年,我接手了网易相册。上任后一看数据,近期掉得厉害,直接原因是博客相册抢走了大量用户,独立的图片存储平台已无上升空间,我们不妨套用产品模型来分析这个局面。 商业模式2010年前的存储成本还很高,但用户存储相片的重复访问率低,付费意愿也低,每年亏损惊人。如果不能做大图片分享场景,那么既不可能做到500万量级的日活(大众服务的竞争力指标),更不可能实现收支平衡。 然而在博客、QQ空间等平台出现后,相册已无法拓展分享场景,日活做不上去,成本降不下来,服务又不能关停,于是从前台退到后台,变成了内部基础服务,为其他业务提供图片存储支持。比如网易博客,比如冲印业务线上的网易印象派。 产品架构本体是图片存储空间,要求的是存储稳定性与交互易用性。理论上可以拓展边界,去做分享平台,但刚才提到过,绝无可能与个人空间&社交产品争锋。也可以拓展边界,去做摄影产品,这部分我在下一篇文章里再分析。 单纯看存储空间,难度在海量存储管理的后端与运维,前端简洁易用即可,创新拓展的空间并不大。产品团队没得打,只需一年迭代一次交互。 运营体系存储空间主要靠07年“无限量存储”的策略去推广,当时大火一把,但也带来极高的成本。很快丁老板看清楚相册的投入产出比太低,之后不再支持无限量(原图)存储,再加上社交网站崛起,相册数据下落,运营方向也没得打,仅仅在违规内容审核上把好关就行了。 结论相册业务本体的商业模式已经触到了天花板,产品策略以维持为主,可以试试图片衍生业务,但不值得主动追加投入。]]></content>
<categories>
<category>PM</category>
</categories>
<tags>
<tag>产品经理</tag>
</tags>
</entry>
</search>