مبانی بینایی سه‌بعدی کامپیوتری

Fundamentals of 3D Computer Vision

شماره درس: ۴۰۳۴۴ تعداد واحد: ۳
مقطع: کارشناسی نوع درس: نظری
پیش‌نیاز: جبر خطی یا ریاضی مهندسی هم‌نیاز: –

اهداف درس

هدف از این درس، آشنایی دانش‌جویان با مفاهیم و روش‌های تحلیل تصاویر به منظور درک سطح بالای محتوای آن‌ها است. این مفاهیم شامل تشکیل تصویر و نمایش رنگ، مرور مختصر پردازش سیگنال و تصویر، هندسه‌ی سه‌بعدی، استخراج نقاط مورد نظر، برازش مدل مقاوم، خوشه‌بندی و بخش‌بندی، بازشناسی شیء، نزدیک‌ترین همسایه‌ها، و یادگیری ژرف در بینائی کامپیوتری است.

ریز مواد

  • پردازش سیگنال و تصویر
    • برخی مفاهیم مقدماتی پردازش سیگنال
    • مروری مختصر بر سیگنال‌ها و سیستم‌ها
    • تابع پیچش
    • تبدیل فوریه
    • پالایش تصویر
  • مقدمات هندسه سه‌بعدی
    • برخی مفاهیم مقدماتی هندسی
    • مروری مختصر بر جبر خطی
    • پارامتری کردن ماتریس چرخش
    • مختصات مشابه
    • دوربین مدل سوراخ سوزنی
    • از متر به مختصات پیکسل
  • دوربین‌ها و افکنش‌ها
    • افکنش موازی
    • افکنش دورنما
    • چرخش‌های دوربین تک محور
    • ساخت تصویر موزائیکی ساده
    • پارامترهای داخلی و خارجی دوربین
    • حرکت کلی دوربین
    • تخمین نگاشت‌های خطی
    • انتقال کلی دوربین
  • بازسازی سه‌بعدی از دید دوتائی
  • بازسازی سطح و اجرا
    • مثلث‌سازی مجموعه نقاط
    • نکاشت سطح، اجرای تصویرگرا
    • سطوح مسطح، نگاست خطی
  • چند دوربینی
    • دوربین‌های دورنما- تعدیل بسته
    • دوربین‌های افکنشی موازی
    • عامل‌بندی دوربین‌ها و مختصات سه‌بعدی
    • ساختار افاین
  • استخراج نقاط کلیدی
  • برازش مدل مقاوم
  • خوشه‌بندی و بخش‌بندی
  • برش‌های گراف
  • بازشناسی شیء
    • دسته‌بندی قالب
    • نزدیک‌ترین همسایه‌ها، PCA، کاهش بعد
    • بیز غیرپیچیده
    • ترکیب دسته‌بندهای ساده
    • شبکه‌های عصبی
  • نزدیک‌ترین همسایه‌ها
  • یادگیری ژرف در بینائی کامپیوتری
    • شبکه‌های عصبی و پس‌انتشار
    • معماری‌های CNN: ایده‌های جدید، مزایا، و معابب
    • شبکه‌های عصبی ژرف مکانی-زمانی
    • آموزش شبکه‌های عصبی ژرف با پای‌تورچ

ارزیابی

  • امتحان پایان‌ترم: ۴۰٪
  • امتحان میان‌ترم: ۱۵٪
  • آزمونک: ۱۰٪
  • تمرین‌ها: ۱۵٪
  • پروژه نهایی: ۲۰٪

مراجع

  1. Stefan Carlsson. Geometric Computing in Image Analysis and Visualization. Lecture Notes, KTH University, 2007.
  2. Richard Szeliski. Computer Vision: Algorithms and Applications. 1st Edition, Springer, 2010.