Обучение с подкреплением [ Reinforcement learning (RL) ] —
Нахождение оптимальной последовательности действий для максимизации поощрения через взаимодействие с окружением, откликом которого являются сигналы подкрепления [ ГОСТ Р 71476-2024 ].
Подписаться на новости BIS Journal / Медиа группы Авангард