یادگیری ماشین برای بیوانفورماتیک
Machine Learning for Bioinformatics
شماره درس: ۴۰۵۵۰ | تعداد واحد: ۳ |
مقطع: کارشناسی ارشد | نوع درس: نظری |
پیشنیاز: – | همنیاز: – |
اهداف درس
با توجه به افزایش حجم و پیچیدگی دادهها در بیوانفورماتیک، استفاده از روشهای نوین تحلیل داده، که قابلیت یادگیری و کشف الگوهای موجود در داده را دارند، اجتناب ناپذیر است. هدف از این درس آشنایی با مفاهیم و روشهای یادگیری ماشین از نقطه نظر کاربردی و با تاکید روی حل مسائل بیوانفورماتیک است. به صورت خاص، دانشجو با گذراندن این درس مهارت اعمال روشهای یادگیری برای حل چالشهای موجود در بیوانفورماتیک، به تناسب نوع مسئله و دادهها را کسب میکند.
ریز مواد
- مفاهیم مقدماتی (۳ جلسه)
- معنای یادگیری و انواع مسئلههای یادگیری
- ارزیابی یک سیستم یادگیر (دادههای آموزش، تست، ارزیابی)، معیار صحت و دقت
- قدرت تعمیم، بیش برازش و اعتبار سنجی متقابل k-fold cross validation
- محدودیتهای یادگیری (نرخ خطای بیز)
- روشهای بهینه سازی (نزول گرادیان)
- مصالحه سوگیری/واریانس (bias/variance trade-off)
- روشهای مقدماتی (مانند Naive Bayes، k-NN، خطی و پرسپترون)
- مسئله دسته بندی (۷ جلسه)
- ماشین بردار پشتیبان (support vector machine)
- روشهای یادگیری جمعی (ensemble learning)
- شبکههای چند لایه پرسپترون و پیچشی (convolutional neural networks)
- مسئله کاهش ابعاد (۶ جلسه)
- تحلیل مولفه اساسی (principal component analysis) و فاکتورگیری ماتریس (matrix factorization)
- روشهای انتخاب متغیر (variable selection)
- خود کد کنندهها (autoencoders)
- روش tSNE
- روشهای تعبیه (embedding)
- خوشهبندی (۳ جلسه)
- روش k-means و روشهای سلسله مراتبی (hierarchical)
- بیشینه سازی امید ریاضی (expectation maximization) و مدل ترکیبی گوسی (Gaussian Mixture Model)
- تحلیل دادههای متوالی (۵ جلسه)
- مدل مخفی مارکوف (Hidden Markov Models)
- شبکههای ژرف بازگشتی (recurrent neural networks) و شبکههای transformer
مراجع
- H. Daumé III, A Course in Machine Learning, Self-published, 2017.
- Bishop, Pattern Recognition and Machine Learning, 2nd Edition, Springer, 2006.
- I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning, MIT Press, 2016.