Q-value

No Q-learning, um Q-valor é a estimativa da recompensa cumulativa futura que um agente pode esperar receber ao tomar uma determinada ação em um determinado estado. A tabela de Q-valores armazena esses valores.

Política de Privacidade

Copyright © www.programicio.com Todos os direitos reservados

É proibida a reprodução do conteúdo desta página sem autorização prévia do autor.

Contato: programicio@gmail.com