مبانی علم داده
Foundations of Data Science
شماره درس: ۴۰۸۰۲.۶ | تعداد واحد: ۳ |
مقطع: کارشناسی ارشد | نوع درس: نظری |
پیشنیاز: – | همنیاز: – |
اهداف درس
هدف این درس آشنایی با مفاهیم و مبانی نظری علم داده است. این مبانی از جنبه های مختلفی هماند هندسه ابعاد بالا، کاهش بعد داده های با ابعاد بالا، قدم زنی تصادفی و زنجیره مارکوف، گراف های تصادفی همچنین در خصوص جنبههای مهم ارزیابی و تحلیل این سیستمها بحث خواهد شد.
ریز مواد
- مقدمه
- هندسه با ابعاد بالا
- هندسه با ابعاد بالا و ویژگی های آن
- تولید داده در أبعاد بالا
- توزیع گوسی در ابعاد بالا
- تخمین توزیع برای داده های با ابعاد بالا
- تعیین نزدیک ترین همساته برای داده های با ابعاد بالا
- کاهش بعد برای داده های با ابعاد بالا
- داده های با ابعاد بالا و مصیبت ابعاد
- کاهش بعد داده های با ابعاد بالا با کمک روش تحلیل مؤلفه اصلی
- کاهش بعد داده های با ابعاد بالا با کمک روش تجزیه مقادیر تکین
- شیوه پیاده سازی روش های کاهش بعد برای داده های با ابعاد بالا
- زنجیره مارکوف و قدم زنی تصادفی
- زنجیره مارکوف
- قدم زنی تصادفی و همگرایی آن برای گراف های مختلف
- قدم زنی تصادفی در فضاء اقلیدسی
- شبکه وب و زنجیره مارکوف
- روش های مختلف نمونه برداری
- گراف تصادفی و تحلیل شبکه های اجتماعی
- گراف های تصادفی و خواص آنها
- مدل های مختلف تولید گراف های تصادفی
- مسایل مختلف در گراف های تصادفی و شیوه حل آنها
- مدل های مختلف گراف های تصادفی مانند جهان کوچک
- مسایل همام سازی و هم ترازی
- مدل سازی موضوعی
- روش های مختلف تجزیه ماتریس
- روش های طیفی در خوشه بندی و کاربردهای آن در شبکه های اجتماعی
- الگوریتم های تحلیل داده های از قبیل جویبارسازی، نمونه برداری و Sketching
ارزیابی
- تمرینهای نظری: ۳ نمره
- آزمونهای میانترم و پایانی: ۱۵ نمره
- آزمونکها: ۲ نمره
مراجع
- Avrim Blum, John Hopcroft, and Ravindran Kannan, Foundations of Data Science, Cambridge University Press; 1st edition (March 12, 2020)