You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
{{ message }}
This repository has been archived by the owner on Nov 4, 2021. It is now read-only.
SEBA finaliza la simulación con un kill del proceso desde el propio sistema operativo (*NIX), lo cual inhibe la funcionalidad de MESA que reproduce la simulación en bucle el nº de veces especificado.
Por tanto, SEBA no está diseñado para resetear el escenario al final de cada iteración. En cambio, reinicia las variables mediante la finalización del proceso (simulación) entero. De ahí, que tampoco funcione la función “reset” en la interfaz de la visualización.
La funcionalidad iterativa (manteniendo una continuidad en el valor de las variables) es importante en entornos de experimentación tales como plataformas multiagentes.
Por ejemplo, para llevar a cabo análisis de sensibilidad de cualquier tipo.
O en mi caso, para que el entrenamiento con aprendizaje por refuerzo sea coherente, es necesario actualizar el valor de epsilon y gamma conforme aumenta el nº de episodios (simulaciones). Además, tener que guardar y cargar en local el valor de los pesos en la variable modelo al finalizar cada episodio (simulación completa) perjudicaría mucho a la complejidad de computación (tiempo y cpu) del algoritmo.
The text was updated successfully, but these errors were encountered:
Ese problema se soluciona cambiando la variable de control de simulación 'self.finishSimulation' por 'self.running'. Esta modificación se debe probablemente a una actualización en MESA. Actualizare los repositorios en cuanto me sea posible.
Un saludo y gracias por su Issue
Sign up for freeto subscribe to this conversation on GitHub.
Already have an account?
Sign in.
SEBA finaliza la simulación con un kill del proceso desde el propio sistema operativo (*NIX), lo cual inhibe la funcionalidad de MESA que reproduce la simulación en bucle el nº de veces especificado.
Por tanto, SEBA no está diseñado para resetear el escenario al final de cada iteración. En cambio, reinicia las variables mediante la finalización del proceso (simulación) entero. De ahí, que tampoco funcione la función “reset” en la interfaz de la visualización.
La funcionalidad iterativa (manteniendo una continuidad en el valor de las variables) es importante en entornos de experimentación tales como plataformas multiagentes.
Por ejemplo, para llevar a cabo análisis de sensibilidad de cualquier tipo.
O en mi caso, para que el entrenamiento con aprendizaje por refuerzo sea coherente, es necesario actualizar el valor de epsilon y gamma conforme aumenta el nº de episodios (simulaciones). Además, tener que guardar y cargar en local el valor de los pesos en la variable modelo al finalizar cada episodio (simulación completa) perjudicaría mucho a la complejidad de computación (tiempo y cpu) del algoritmo.
The text was updated successfully, but these errors were encountered: