مبانی بینایی سهبعدی کامپیوتری
Fundamentals of 3D Computer Vision
شماره درس: ۴۰۳۴۴ | تعداد واحد: ۳ |
مقطع: کارشناسی | نوع درس: نظری |
پیشنیاز: جبر خطی یا ریاضی مهندسی | همنیاز: – |
اهداف درس
هدف از این درس، آشنایی دانشجویان با مفاهیم و روشهای تحلیل تصاویر به منظور درک سطح بالای محتوای آنها است. این مفاهیم شامل تشکیل تصویر و نمایش رنگ، مرور مختصر پردازش سیگنال و تصویر، هندسهی سهبعدی، استخراج نقاط مورد نظر، برازش مدل مقاوم، خوشهبندی و بخشبندی، بازشناسی شیء، نزدیکترین همسایهها، و یادگیری ژرف در بینائی کامپیوتری است.
ریز مواد
- پردازش سیگنال و تصویر
- برخی مفاهیم مقدماتی پردازش سیگنال
- مروری مختصر بر سیگنالها و سیستمها
- تابع پیچش
- تبدیل فوریه
- پالایش تصویر
- مقدمات هندسه سهبعدی
- برخی مفاهیم مقدماتی هندسی
- مروری مختصر بر جبر خطی
- پارامتری کردن ماتریس چرخش
- مختصات مشابه
- دوربین مدل سوراخ سوزنی
- از متر به مختصات پیکسل
- دوربینها و افکنشها
- افکنش موازی
- افکنش دورنما
- چرخشهای دوربین تک محور
- ساخت تصویر موزائیکی ساده
- پارامترهای داخلی و خارجی دوربین
- حرکت کلی دوربین
- تخمین نگاشتهای خطی
- انتقال کلی دوربین
- بازسازی سهبعدی از دید دوتائی
- بازسازی سطح و اجرا
- مثلثسازی مجموعه نقاط
- نکاشت سطح، اجرای تصویرگرا
- سطوح مسطح، نگاست خطی
- چند دوربینی
- دوربینهای دورنما- تعدیل بسته
- دوربینهای افکنشی موازی
- عاملبندی دوربینها و مختصات سهبعدی
- ساختار افاین
- استخراج نقاط کلیدی
- برازش مدل مقاوم
- خوشهبندی و بخشبندی
- برشهای گراف
- بازشناسی شیء
- دستهبندی قالب
- نزدیکترین همسایهها، PCA، کاهش بعد
- بیز غیرپیچیده
- ترکیب دستهبندهای ساده
- شبکههای عصبی
- نزدیکترین همسایهها
- یادگیری ژرف در بینائی کامپیوتری
- شبکههای عصبی و پسانتشار
- معماریهای CNN: ایدههای جدید، مزایا، و معابب
- شبکههای عصبی ژرف مکانی-زمانی
- آموزش شبکههای عصبی ژرف با پایتورچ
ارزیابی
- امتحان پایانترم: ۴۰٪
- امتحان میانترم: ۱۵٪
- آزمونک: ۱۰٪
- تمرینها: ۱۵٪
- پروژه نهایی: ۲۰٪
مراجع
- Stefan Carlsson. Geometric Computing in Image Analysis and Visualization. Lecture Notes, KTH University, 2007.
- Richard Szeliski. Computer Vision: Algorithms and Applications. 1st Edition, Springer, 2010.