ابزار کاربر

ابزار سایت


درس:۴۰۷۱۴

داده‌کاوی

Data Mining

شماره درس: ۴۰۷۱۴ تعداد واحد: ۳
مقطع: کارشناسی ارشد نوع درس: نظری
پیش‌نیاز: – هم‌نیاز: –

اهداف درس

هدف اين درس، آشنا کردن دانشجويان کارشناسي ارشد و دکترا با مفاهيم و مسائل مطرح در کاوش حجم وسيعي از داده‌ها و کشف الگوهاي موجود در آنهاست. در ابتدا مفاهيم پيش-پردازش داده‌ها و انباره داده ارائه شده و سپس به مباحث مربوط به حوزه‌های اصلي در داده‌کاوي پرداخته مي‌شود.

ریز مواد

  • مقدمه - معرفي داده‌کاوي و مدل‌هاي اصلي در آن (۱ جلسه)
  • روشهاي مربوط به پيش پردازش داده‌ها (۲ جلسه)
  • معرفي انباره داده، مکعب داده‌اي و گزارش‌گيري تحليلي (۲ جلسه)
  • مدل نگاشت-کاهش (۳ جلسه)
    • الگوریتم‌های نگاشت-کاهش
    • نظریه پیچیدگی مدل نگاشت-کاهش
    • آشنایی با پشته‌های فناوری مربوطه مانند اسپارک، هادوپ و …
  • کاوش مجموعه‌‌های عناصر در حجم بزرگ (۳ جلسه)
    • پیدا کردن مجموعه عناصر مشابه و توابع درهم‌سازی حساس به محل
    • پیدا کردن مجموعه‌های با تکرر بالا، الگوریتم A-Priori، الگوریتم PCY، الگوریتم SON‌ و تویوونن
  • کاوش جریان داده‌ها (۳ جلسه)
    • نمونه برداری جریان داده‌ها
    • پالایش جریان داده‌ها و فیلتر‌های بلوم
    • الگوریتم‌های جریان داده
  • تحلیل شبکه‌های داده‌ای (۴ جلسه)
    • ویژگی‌های ساختاری شبکه‌ها
    • رتبه صفحه و قدم‌زنی تصادفی
    • الگوریتم‌های کاوش انجمن‌ها
    • الگوریتم‌های شمارش موتیف‌ها در گراف‌ها
    • الگوریتم‌های نمونه‌برداری در گراف‌ها
  • الگوریتم‌های خوشه‌بندی داده (۴ جلسه)
    • الگوریتم‌های سلسله مراتبی
    • الگوریتم K-Means
    • الگوریتم CURE
    • خوشه‌بندی جریان‌های داده
  • الگوریتم‌های کاهش ابعاد (۲ جلسه)
    • الگوریتم SVD‌ و PCA
    • الگوریتم CUR
  • الگوریتم‌های یادگیری ماشین در داده‌های بزرگ (۴ جلسه)
    • مفهوم یادگیری ماشین و الگوریتم‌های رگرسیون
    • شبکه‌های عصبی، معرفی شبکه‌های عصبی عمیق
    • الگوریتم SVM
  • داده‌کاوی در صنعت (۲ جلسه)
    • سیستم‌های توصیه‌گر
    • تبلیغات در وب و مسئله Adwords
    • بازارهای تطابق‌یابی
    • مسئله قیمت‌گذاری
    • داده‌کاوی سلامت

ارزیابی

  • آزمون: آزمون‌هاي ميان‌نیمسال و پايان‌نیمسال (۶۰ درصد نمره)
  • تمرين: سه تمرين پژوهشي، و يک تمرين عملي که در طول نيمسال تحويل داده مي‌شوند (۲۵ درصد نمره).
  • گزارش پژوهشي: موضوع پژوهش قبل از آزمون پايان‌نيمسال تعيين مي‌شود. دانشجو کار پژوهش را با کمک استاد درس آغاز کرده و پس از انجام کار، نتيجه پژوهش را در قالب گزارش ارائه مي‌دهد (۱۵ درصد نمره).

مراجع

  1. J. Leskovec, A. Rajaraman, and J.D. Ullman. Mining of massive datasets. Cambridge University Press, 2014.
  2. J. Han, J. Pei, and M. Kamber. Data mining: Concepts and techniques. Elsevier, 2011.
درس/۴۰۷۱۴.txt · آخرین ویرایش: 2019/12/26 01:59 (ویرایش خارجی)