Learn Reinforcement Learning & Deep Learning & Machine Learning The Experimental Way 《用实体实验法学强化学习, 深度学习和机器学习》
- 输入图像实例的数据和神经网络的代价函数
- 神经网络中用到的变量名和参数名的表示方法
- 第2层中3个神经单元的输入值和输出值
- 第3层中2个神经单元的输入值和输出值
- 用代价函数计算出1个学习实例的代价
- 用偏导数的链式法则求出梯度的1个向量
- 用反向传播算法求出梯度的1个向量
- 输入图像实例的数据和神经网络的代价函数
- 卷积神经网络中用到的变量名和参数名的表示方法
- 过滤器和卷积层中的输入值和输出值
- 池化层中的输入值和输出值
- 输出层3个神经单元的输入值和输出值
- 用代价函数计算出1个学习实例的代价
- 用反向传播算法求出梯度的1个向量
- 马尔可夫决策过程中的“智能体-环境”的交互模型
- 策略的回报和最优策略的最优回报
- 行动值函数(action-value-function)
- 状态值函数(state-value-function)
- Bellman方程
- 定义状态和行动并且设定奖励值的大小
- 设置奖励矩阵R和Q-table矩阵Q
- Q-table中数值的第1个运算过程
- Q-table中数值的第2个运算过程
- Q-table中数值的第3个运算过程
- Q-table中数值的第4个运算过程
- Q-table中数值的第5个运算过程
- 数据集中多个数据的Mean,Median,和Mode
- 数据集中多个数据的Standard Deviation和Variance
- 数据集中多个数据的Percentile
- 数据集中多个数据的(Normal) Data Distribution
- 数据集中多个数据的Scatter Plot
- 用Linear Regression找出不同类型的数据间的相互关系
- 用Polynomial Regression找出不同类型的数据间的相互关系
- 用Multiple Regression找出不同类型的数据间的相互关系
- 用Scale找出不同类型的数据间的相互关系
- 用Train/Test的方法评估机器学习模型
- 体验决策树
-
用NumPy操作矩阵及进行基本运算等
-
用Matplotlib绘出2D和3D图像
-
在线体验导数/正态分布/最小平方法等
-
Sigmoid function
-
其它