11.06.2020 Выпуск 338 (08.06.2020 - 14.06.2020) Статьи

Нейросеть — Обучение без учителя. Метод Policy Gradient

Настоящей статьей открываю цикл статей о том, как обучать нейронные сети без учителя.
(Reinforcement Learning for Neuron Networks)

В цикле планирую сделать три статьи по теории и реализации в коде трех алгоритмов обучения нейронных сетей без учителя. Первая статья будет по Policy Gradient, вторая по Q-learning, третья статья заключительная будет по методу Actor-Critic.

IT-новости про Python, которые стоит знать

Нейросеть — Обучение без учителя. Метод Policy Gradient