مبانی علم داده

Foundations of Data Science

شماره درس: ۴۰۸۰۲.۶ تعداد واحد: ۳
مقطع: کارشناسی ارشد نوع درس: نظری
پیش‌نیاز: – هم‌نیاز: –

اهداف درس

هدف این درس آشنایی با مفاهیم و مبانی نظری علم داده است. این مبانی از جنبه های مختلفی هماند هندسه ابعاد بالا، کاهش بعد داده های با ابعاد بالا، قدم زنی تصادفی و زنجیره مارکوف، گراف های تصادفی همچنین در خصوص جنبه​های مهم ارزیابی و تحلیل این سیستم​ها بحث خواهد شد.

ریز مواد

  1. مقدمه
  2. هندسه با ابعاد بالا
    • هندسه با ابعاد بالا و ویژگی های آن
    • تولید داده در أبعاد بالا
    • توزیع گوسی در ابعاد بالا
    • تخمین توزیع برای داده های با ابعاد بالا
    • تعیین نزدیک ترین همساته برای داده های با ابعاد بالا
  3. کاهش بعد برای داده های با ابعاد بالا
    • داده های با ابعاد بالا و مصیبت ابعاد
    • کاهش بعد داده های با ابعاد بالا با کمک روش تحلیل مؤلفه اصلی
    • کاهش بعد داده های با ابعاد بالا با کمک روش تجزیه مقادیر تکین
    • شیوه پیاده سازی روش های کاهش بعد برای داده های با ابعاد بالا
  4. زنجیره مارکوف و قدم زنی تصادفی
    • زنجیره مارکوف
    • قدم زنی تصادفی و همگرایی آن برای گراف های مختلف
    • قدم زنی تصادفی در فضاء اقلیدسی
    • شبکه وب و زنجیره مارکوف
    • روش های مختلف نمونه برداری
  5. گراف تصادفی و تحلیل شبکه های اجتماعی
    • گراف های تصادفی و خواص آن‌ها
    • مدل های مختلف تولید گراف های تصادفی
    • مسایل مختلف در گراف های تصادفی و شیوه حل آن‌ها
    • مدل های مختلف گراف های تصادفی مانند جهان کوچک
  6. مسایل همام سازی و هم ترازی
  7. مدل سازی موضوعی
  8. روش های مختلف تجزیه ماتریس
  9. روش های طیفی در خوشه بندی و کاربردهای آن در شبکه های اجتماعی
  10. الگوریتم های تحلیل داده های از قبیل جویبارسازی، نمونه برداری و Sketching

ارزیابی

  • تمرین‌های نظری: ۳ نمره
  • آزمون‌‌های میان‌ترم و پایانی: ۱۵ نمره
  • آزمونک‌ها: ۲ نمره

مراجع

  1. Avrim Blum, John Hopcroft, and Ravindran Kannan, Foundations of Data Science, Cambridge University Press; 1st edition (March 12, 2020)