Туртуріка Віктор

Науковий керівник: доцент кафедри інформатики, кандидат фізико-математичних наук

Паращук С. Д.

Кіровоградський державний педагогічний університет імені Володимира Винниченка

Анотація: В статті розглядається застосування алгоритму однокрокового Q-навчання для успішного проходження ігор Atari запрограмованим агентом.

Ключові слова: машинне навчання із підкріпленням, нейронні мережі OpenAI Gym.

 

Повний текст статті

Список літератури

  1. Asynchronous Methods for Deep Reinforcement Learning / [V. Mnih, M. Mirza, A. Graves та ін.]. // Nature. – 2016. – №7.
  2. OpenAIGymDocs [Електронний ресурс] – Режим доступу до ресурсу: https://gym..com/docs.
  3. Reinforcementlearning [Електронний ресурс] – Режим доступу до ресурсу: https://www.cs..ac.uk/people/nando.defreitas/machinelearning/lecturepdf.

Відомості про авторів:

Туртуріка Віктор Ігорович – студент ІV курсу фізико-математичного факультету Кіровоградського державного педагогічного університету імені Володимира Винниченка.