یادگیری ماشین پیشرفته
Advanced Machine Learning
شماره درس: ۴۰۹۵۹ | تعداد واحد: ۳ |
مقطع: کارشناسی ارشد | نوع درس: نظری |
پیشنیاز: – | همنیاز: – |
اهداف درس
در سالهای اخیر روشهای یادگیری ماشین در کاربردهای مختلف به موفقیتهای چشمگیری دست یافتهاند. این روشها غالبا برای یک وظیفه (task) که در خصوص آن آموزش دیدهاند تخصصی میشوند و با آنچه که در خصوص یادگیری در هوش عمومی مصنوعی (Artificial General Intelligence) انتظار میرود فاصله زیادی دارند. در چند سال اخیر حوزههای انتقال یادگیری (transfer learning)، یادگیری چندوظیفهای (multi-task)، متایادگیری (meta-learning)، یادگیری مستمر (continual) برای کم کردن این فاصله مورد توجه جدی قرار گرفته است. در این درس دانشجویان توانایی درک و پیادهسازی روشهای یادگیری مذکور را پیدا خواهند کرد.
ریز مواد
- مقدمه و معرفی کلی درس
- انتقال یادگیری و یادگیری چندوظیفهای
- متایادگیری
- متایادگیری جعبه سیاه
- متایادگیری مبتنی بر بهینهسازی
- یادگیری چند-نمونهای (few-shot) از طریق یادگیری متر (metric)
- ساخت وظیفه (task construction)
- یادگیری تقویتی چندوظیفهای و متایادگیری تقویتی
- مقدمه ای بر یادگیری تقویتی و یادگیری تقویتی ژرف
- انواع روشهای یادگیری تقویتی
- یادگیری تقویتی چندوظیفهای و یادگیری تقویتی شرطی شده با هدف (goal conditioned)
- یادگیری تقویتی مبتنی بر مدل (model-based)
- متایادگیری تقویتی و مدلها و سیاستهای قابل تطبیق (adaptable)
- متایادگیری تقویتی و یادگیری کاوش (exploration)
- متایادگیری تقویتی برون خط (offline)
- یادگیری تقویتی سلسلهمراتبی (hierarchical)
- نگاه احتمالاتی
- مدلسازی و استنتاج احتمالاتی
- متایادگیری بیزی (Bayesian)
- رویکرد احتمالاتی به یادگیری تقویتی و متایادگیری تقویتی
- یادگیری مستمر (continual) و تمامعمر
- انتقال جلورو (forward) و عقبرو (backward) مثبت و منفی
- روشهای مبتنی بر بازپخش (replay) نظیر روشهای تمرینی (rehearsal)
- روشهای مبتنی بر منظمسازی (regularization)
- روشهای انزوای پارامتری (parameter isolation)
- سناریوهای یادگیری مستمر و محکها (benchmarks)
- رویکرد بیزی در یادگیری مستمر
- مباحث پیشرفته در متایادگیری و یادگیری مستمر
- متایادگیری و یادگیری مستمر در علوم اعصاب
- تعمیمپذیری خارج از توزیع (out-of-distribution)
- تاثیر ساختار و نحوه بازنمایی در بهبود تعمیمپذیری: ماژولاریتی (modularity) و علیت (causality)
ارزیابی
- تمرین و پروژه: ۴۵ درصد
- آزمون میانترم : ۲۰ درصد
- آزمون پایانترم: ۲۵ درصد
- ارائه مقاله : ۱۰ درصد
مراجع
- Lan Zou. Meta Learning: Theory, Algorithms and Applications. Academic Press, 2023.
- Aske Plaat. Deep Reinforcement Learning. Springer, 2022.