Собрали в одном месте самые важные ссылки
читайте авторский блог
Это перевод статьи Understanding Q-Learning, the Cliff Walking problem Lucas Vazquez
В последнем посте мы представили проблему «Прогулка по скале» и остановились на страшном алгоритме, который не имел смысла. На этот раз мы раскроем секреты этого серого ящика и увидим, что это совсем не так страшно.