برنامه‌سازی برای تحلیل داده

شماره درس: ۳۰۱۰ تعداد واحد: ۳
نوع درس: نظری پیش‌نیاز: برنامه‌سازی پایتون

اهداف درس

در این درس هدف تسلط بر برنامه‌نویسی پایتون و استفاده از زبان پایتون برای ذخیره، تحلیل و مصورسازی داده است.

ریز مواد

  1. مرور برنامه‌سازی به زبان پایتون (۲ جلسه)
    • کار با پایتون در محیط‌های تعاملی IPython و Jupyter
    • برنامه‌سازی پیمانه‌ای و استفاده از کتابخانه‌ها
    • تولید اعداد تصادفی و شبیه‌سازی مونت‌کارلو
  2. ذخیره‌سازی و کار با داده (۵ جلسه)
    • ساختارهای ذخیره‌سازی داده
    • سازماندهی داده با استفاده از dataframes
    • پایگاه‌های داده رابطه‌ای و غیررابطه‌ای و انبار داده
    • دستکاری (manipulation) داده با Pandas
  3. آماده‌سازی داده (۲ جلسه)
    • قالب‌دهی (formatting)، نرمال‌سازی و سطل‌بندی (binning) داده
    • پر کردن داده‌های گم (missing)
  4. تحلیل داده (۵ جلسه)
    • درک توزیع داده
    • ایجاد خط‌لوله (pipeline) داده
    • اعمال تکنیک‌های تحلیل روی مجموعه داده‌های واقعی با کتابخانه‌‌های Numpy و Scipy
  5. مصورسازی داده و ترسیم نمودار (۵ جلسه)
    • تحلیل داده اکتشافی (exploratory)
    • ترسیم نمودار در پایتون با کتابخانه‌های Matplotlib و Seaborn و plotly
    • انواع تکنیک‌های مصورسازی داده
    • نکات مهم مرتبط با مصورسازی داده

ارزیابی

  • تمرین‌ها: ۲۰ درصد
  • آزمونک‌ها: ۲۰ درصد
  • آزمون ‌نهایی: ۶۰ درصد

مراجع

  1. Wes McKinney, Python for Data Analysis: Data Wrangling with pandas. NumPy, and Jupyter, 3rd edition, 2022.