برنامهسازی برای تحلیل داده
شماره درس: ۳۰۱۰ | تعداد واحد: ۳ |
نوع درس: نظری | پیشنیاز: برنامهسازی پایتون |
اهداف درس
در این درس هدف تسلط بر برنامهنویسی پایتون و استفاده از زبان پایتون برای ذخیره، تحلیل و مصورسازی داده است.
ریز مواد
- مرور برنامهسازی به زبان پایتون (۲ جلسه)
- کار با پایتون در محیطهای تعاملی IPython و Jupyter
- برنامهسازی پیمانهای و استفاده از کتابخانهها
- تولید اعداد تصادفی و شبیهسازی مونتکارلو
- ذخیرهسازی و کار با داده (۵ جلسه)
- ساختارهای ذخیرهسازی داده
- سازماندهی داده با استفاده از dataframes
- پایگاههای داده رابطهای و غیررابطهای و انبار داده
- دستکاری (manipulation) داده با Pandas
- آمادهسازی داده (۲ جلسه)
- قالبدهی (formatting)، نرمالسازی و سطلبندی (binning) داده
- پر کردن دادههای گم (missing)
- تحلیل داده (۵ جلسه)
- درک توزیع داده
- ایجاد خطلوله (pipeline) داده
- اعمال تکنیکهای تحلیل روی مجموعه دادههای واقعی با کتابخانههای Numpy و Scipy
- مصورسازی داده و ترسیم نمودار (۵ جلسه)
- تحلیل داده اکتشافی (exploratory)
- ترسیم نمودار در پایتون با کتابخانههای Matplotlib و Seaborn و plotly
- انواع تکنیکهای مصورسازی داده
- نکات مهم مرتبط با مصورسازی داده
ارزیابی
- تمرینها: ۲۰ درصد
- آزمونکها: ۲۰ درصد
- آزمون نهایی: ۶۰ درصد
مراجع
- Wes McKinney, Python for Data Analysis: Data Wrangling with pandas. NumPy, and Jupyter, 3rd edition, 2022.