Sarsa 1.相关内容分别如下图所示。 2.相关内容分别如下图所示。 参考文献及资料 维基百科 State–action–reward–state–action (SARSA) Temporal difference learning Deep Reinforcement Learning Nanodegree Program