Глубокое обучение с подкреплением (Deep Reinforcement Learning, DRL) — раздел машинного обучения, в котором ИИ-агент учится взаимодействовать с окружающей средой и получать награду за свои действия. Агент не знает заранее, какие действия приведут к максимальной награде, поэтому он должен исследовать разные варианты и запоминать свой опыт.