یادگیری ماشین پیشرفته

Advanced Machine Learning

شماره درس: ۴۰۹۵۹ تعداد واحد: ۳
مقطع: کارشناسی ارشد نوع درس: نظری
پیش‌نیاز: – هم‌نیاز: –

اهداف درس

در سال‌های اخیر روش‌های یادگیری ماشین در کاربردهای مختلف به موفقیت‌های چشم‌گیری دست یافته‌اند. این روش‌ها غالبا برای یک وظیفه (task) که در خصوص آن آموزش دیده‌اند تخصصی می‌شوند و با آن‌چه که در خصوص یادگیری در هوش عمومی مصنوعی (Artificial General Intelligence) انتظار می‌رود فاصله زیادی دارند. در چند سال اخیر حوزه‌های انتقال یادگیری (transfer learning)، یادگیری چندوظیفه‌ای (multi-task)، متایادگیری (meta-learning)، یادگیری مستمر (continual) برای کم کردن این فاصله مورد توجه جدی قرار گرفته است. در این درس دانشجویان توانایی درک و پیاده‌سازی روش‌های یادگیری مذکور را پیدا خواهند کرد.

ریز مواد

  1. مقدمه و معرفی کلی درس
  2. انتقال یادگیری و یادگیری چندوظیفه‌ای
  3. متایادگیری
    • متایادگیری جعبه سیاه
    • متایادگیری مبتنی بر بهینه‌سازی
    • یادگیری چند-نمونه‌ای (few-shot) از طریق یادگیری متر (metric)
    • ساخت وظیفه (task construction)
  4. یادگیری تقویتی چندوظیفه‌ای و متایادگیری تقویتی
    • مقدمه ای بر یادگیری تقویتی و یادگیری تقویتی ژرف
    • انواع روشهای یادگیری تقویتی
    • یادگیری تقویتی چندوظیفه‌ای و یادگیری تقویتی شرطی شده با هدف (goal conditioned)
    • یادگیری تقویتی مبتنی بر مدل (model-based)
    • متایادگیری تقویتی و مدلها و سیاستهای قابل تطبیق (adaptable)
    • متایادگیری تقویتی و یادگیری کاوش (exploration)
    • متایادگیری تقویتی برون خط (offline)
    • یادگیری تقویتی سلسله‌مراتبی (hierarchical)
  5. نگاه احتمالاتی
    • مدلسازی و استنتاج احتمالاتی
    • متایادگیری بیزی (Bayesian)
    • رویکرد احتمالاتی به یادگیری تقویتی و متایادگیری تقویتی
  6. یادگیری مستمر (continual) و تمام‌عمر
    • انتقال جلورو (forward) و عقب‌رو (backward) مثبت و منفی
    • روشهای مبتنی بر بازپخش (replay) نظیر روشهای تمرینی (rehearsal)
    • روشهای مبتنی بر منظم‌سازی (regularization)
    • روشهای انزوای پارامتری (parameter isolation)
    • سناریوهای یادگیری مستمر و محک‌ها (benchmarks)
    • رویکرد بیزی در یادگیری مستمر
  7. مباحث پیشرفته در متایادگیری و یادگیری مستمر
  8. متایادگیری و یادگیری مستمر در علوم اعصاب
  9. تعمیم‌پذیری خارج از توزیع (out-of-distribution)
  10. تاثیر ساختار و نحوه بازنمایی در بهبود تعمیم‌پذیری: ماژولاریتی (modularity) و علیت (causality)

ارزیابی

  • تمرین‌ و پروژه: ۴۵ درصد
  • آزمون‌‌ میان‌ترم : ۲۰ درصد
  • آزمون پایان‌ترم: ۲۵ درصد
  • ارائه مقاله : ۱۰ درصد

مراجع

  • Lan Zou. Meta Learning: Theory, Algorithms and Applications. Academic Press, 2023.
  • Aske Plaat. Deep Reinforcement Learning. Springer, 2022.