پردازش زبان‌های طبیعی

Natural Language Processing

شماره درس: ۴۰۶۷۷ تعداد واحد: ۳
مقطع: کارشناسی ارشد نوع درس: نظری
پیش‌نیاز: – هم‌نیاز: –

اهداف درس

پردازش زبان طبیعی یکی از شاخه‌های بسیار مهم در پردازش زبان طبیعی به حساب می‌آید. هدف این علم ایجاد یک راه تعامل میان انسان و ماشین از طریق زبان طبیعی انسانی است. در این درس بنا داریم با مفاهیم پردازش زبان طبیعی آشنا شده و روش‌های پایه در حل مسایل موجود در آن را معرفی کنیم. همچنین تا حدی در مورد روشهای به روز در حل مسائل نیز صحبت خواهیم کرد.

ریز مواد

  1. معرفی درس و اهداف آن (۱ جلسه)
    • معرفی با کلیات درس، سیلابس آن و آنچه در درس پوشش داده میشود
  2. آشنایی با پردازش زبان طبیعی (۱ جلسه)
    • معرفی پردازش زبان طبیعی، تاریخچه مختصر، مسائل مختلف موجود در آن و چالش‌های آن
  3. روش‌های پیش‌پردازش متن (۲ جلسه)
    • عبارات منظم، توکنایزر، نرمالسازی، تشخیص ریشه و لما، تشخیص مرز جملات، نحوه محاسبه فاصله با MED
  4. مدل‌های زبانی (۲ جلسه)
    • روش‌های پایه در مدل‌سازی زبانی، ان‌گرام‌ها، perplexity، smoothing
  5. روش‌های پایه در دسته‌بندی مستندات متنی (۳ جلسه)
    • مفهوم دسته‌بندی، نحوه استخراج ویژگی از متن، چند دسته‌بند ساده، معرفی مدل لاجستیک رگرسیون برای دسته‌بندی، تعمیم مدل لاجستیک رگرسیون به شبکه عصبی
  6. روش‌های پایه در خوشه‌بندی مستندات متنی (۲ جلسه)
    • مفهوم خوشه‌بندی و روش‌های پایه k-means و mixture models
  7. بازنمایی کلمات (۴ جلسه)
  8. آشنایی با روش‌های مختلف بازنمایی کلمات: روش‌های پایه‌ای، روش‌های مبتنی بر جبر خطی، روش‌های مبتنی بر شبکه عصبی، چالش‌های مختلف در بازنمایی کلمات و راه‌های حل آن‌ها، بازنمایی‌های مبتنی بر بافت (معرفی ساده)
  9. ترجمه ماشینی (۴ جلسه)
    • معرفی مدل‌های سنتی ترجمه ماشینی، مدل‌هایIBM، مدل‌های مبتنی بر عبارات
  10. شبکه‌های عصبی بازگشتی و مدل مبتنی بر توجه (۳ جلسه)
    • معرفی ساختار شبکه‌های عصبی بازگشتی ساده و ساختارهای معروف مثل LSTM و GRU، معرفی مدل‌های روز ترجمه ماشینی، معرفی مدل توجه
  11. مساله تجزیه در پردازش زبان (۳ جلسه)
    • آشنایی با انواع تجزیه‌های معنایی و نحوی
    • معرفی مدل‌های پایه برای حل مسئله تجزیه
  12. مسائل کاربردی دیگر در پردازش زبان طبیعی (۳ جلسه)
    • معرفی مسایل دیگر در حوزه پردازش زبان طبیعی مانند استخراج اطلاعات، خلاصه‌سازی، برچسب‌زنی ادات سخن و …

ارزیابی

  • تمرین‌های عملی و سمینار پایانی: ۳۰٪
  • آزمون‌‌ میان‌ترم: ۲۰٪
  • آزمون پایانی: ۳۰٪
  • پروژه پایانی: ۲۰٪

مراجع

  1. Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. Draft), 2023
  2. Manning and Schuetze, Foundations of Statistical Natural Language Processing, 1999
  3. Yoav Goldberg. A Primer on Neural Network Models for Natural Language Processing, 2015
  4. Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep Learning, 2016