Skip to content

Commit 70ff237

Browse files
authored
Merge pull request apachecn#233 from mikechengwei/python-2.7
逻辑回归,朴素贝叶斯,FP树 FQA
2 parents c281ffd + 87f669d commit 70ff237

File tree

1 file changed

+11
-9
lines changed

1 file changed

+11
-9
lines changed

faq/直播问题汇总.md

+11-9
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,6 @@
1-
# 直播问题汇总
1+
Number of vcores has to be set by an administrator in yarn-site.xml on each node. The decision of how much it should be set to is driven by the type of workloads running in the cluster and the type of hardware available. The general recommendation is to set it to the number of physical cores on the node, but administrators can bump it up if they wish to run additional containers on nodes with faster CPUs.
2+
3+
# 直播问题汇总
24

35
标签(空格分隔): 机器学习 直播问题
46

@@ -180,12 +182,12 @@ def calcShannonEnt(dataSet):
180182
4. 超萌小宝贝 2017-11-23 21:20:18
181183
问:两种估计就差一个参数?
182184

183-
答:
185+
答:最大似然估计和贝叶斯估计,分母和分子是相差一个参数的,是为了避免概率值为0的情况。但是目的都是为了计算概率。
184186

185187
5. HY Serendipity 2017-11-23 21:21:01
186188
问:分母为什么要加上分子的 s 倍?
187189

188-
答:
190+
答:s倍取决于特征数,因为我要保证所有特征数属于某个类别的概率和为1。
189191

190192
6. 灵魂 2017-11-23 21:30:48
191193
问:拉普拉斯平滑是为了解决什么问题?
@@ -197,22 +199,22 @@ def calcShannonEnt(dataSet):
197199
1. HY Serendipity 2017-11-24 21:06:22
198200
问:我不清楚的是这里怎么引出梯度上升的?
199201

200-
答:
202+
答:因为逻辑回归在使用sigmoid函数的时候要找到每个特征是某个类别的权重,所以通过梯度上升来找到最优的权重比。
201203

202204
2. HY Serendipity 2017-11-24 21:19:25
203205
问:为什么要使用梯度上升求极值呢?
204206

205-
答:
207+
答:梯度上升和梯度下降都可以用来求极值,我们这里用梯度上升来求某条数据是某个类别的最大的可能性。最大的可能性肯定就是求最大值呀。所以求极大值上升,极小值下降。
206208

207209
3. ls 2017-11-24 21:26:32
208210
问:什么时候使用梯度上升,什么时候使用梯度下降?
209211

210-
答:
212+
答:主要看你的数学问题,和二次方程一样,-x^2肯定有最大值,x^2肯定是最小值啊。
211213

212214
4. HY Serendipity 2017-11-24 21:35:11
213215
问:我其实更想知道似然函数,因为这里用到了梯度上升
214216

215-
答:
217+
答:似然函数就一种条件概率,某个数据是某个类别的概率。
216218

217219
5. 为什么 LR 模型要使用 sigmoid 函数,背后的数学原理是什么?
218220
答:https://www.zhihu.com/question/35322351
@@ -322,12 +324,12 @@ def calcShannonEnt(dataSet):
322324
1. HY Serendipity 2017-12-05 20:41:38
323325
问:感觉这里的支持度有点问题啊,应该是出现次数比较妥当?
324326

325-
答:
327+
答:是的,这里我们省略分母,因为我们算支持度=出现次数/总的数目。 分母其实都是一样,所以我们省略了。
326328

327329
2. HY Serendipity 2017-12-05 21:09:45
328330
问:就是想问一下怎么一步步递归得到最后的t的所有频繁项集?
329331

330-
答:
332+
答:就是递归的去构造FP树,然后从FP树中挖掘频繁项集,当FP树节点为空,当前根递归才算结束。
331333

332334
## 13、PCA 简化数据(片刻)
333335

0 commit comments

Comments
 (0)