Туртуріка Віктор
Науковий керівник: доцент кафедри інформатики, кандидат фізико-математичних наук
Паращук С. Д.
Кіровоградський державний педагогічний університет імені Володимира Винниченка
Анотація: В статті розглядається застосування алгоритму однокрокового Q-навчання для успішного проходження ігор Atari запрограмованим агентом.
Ключові слова: машинне навчання із підкріпленням, нейронні мережі OpenAI Gym.
Список літератури
- Asynchronous Methods for Deep Reinforcement Learning / [V. Mnih, M. Mirza, A. Graves та ін.]. // Nature. – 2016. – №7.
- OpenAIGymDocs [Електронний ресурс] – Режим доступу до ресурсу: https://gym..com/docs.
- Reinforcementlearning [Електронний ресурс] – Режим доступу до ресурсу: https://www.cs..ac.uk/people/nando.defreitas/machinelearning/lecturepdf.
Відомості про авторів:
Туртуріка Віктор Ігорович – студент ІV курсу фізико-математичного факультету Кіровоградського державного педагогічного університету імені Володимира Винниченка.