Reinforcement Learning
شماره درس: ۴۰۷۱۶ | تعداد واحد: ۳ |
مقطع: کارشناسی ارشد | نوع درس: نظری |
پیشنیاز: یادگیری ژرف | همنیاز: – |
امروزه در طیف وسیعی از مسائل در دنیای واقعی امکان ارائه بازخورد لحظهای و جزئی برای آموزش عاملهای هوشمند وجود ندارد. رویکرد متداول در این حالات یادگیری تقویتی است. از جمله چالشهای این حوزه، تنک بودن بازخوردها، زمان و تعداد نمونههای بالای مورد نیاز برای آموزش این عاملها، بعد بالای مشاهدات دریافت شده از محیط، و همینطور تطبیقپذیری سریع با محیطهای جدید است. در این درس این موارد را مورد بررسی قرار میدهیم.