You are not allowed to perform this action

بینایی پیشرفته سه‌بعدی کامپیوتر

Advanced 3D Computer Vision

شماره درس: ۴۰۶۱۶ تعداد واحد: ۳
مقطع: کارشناسی ارشد نوع درس: نظری
پیش‌نیاز: – هم‌نیاز: –

اهداف درس

هدف از این درس، آشنایی دانش‌جویان با درک بینایی، هندسه تک‌دیدی و چنددیدی، بازسازی و تجسم سه‌بعدی، توصیف، تطبیق، و تنظیم نقاط کلیدی، ردیابی سه‌بعدی بر مبنای ویژگی‌های طبیعی، بهینه‌سازی عددی و تخمین مقاوم، و یادگیری ژرف در بینائی کامپیوتری است.

ریز مواد

  1. مقدمه
  2. هندسه تک‌دیدی
    • فضای ۳-بعدی اقلیدسی و حرکت جسم صلب
    • مدل‌های هندسی تشکیل تصویر
  3. هندسه دودیدی
    • ابتدائیات تصویر و انطباق‌ها
    • بازسازی به‌وسیله دو دید تنظیم‌شده
  4. هندسه تنظیم‌نشده و مستقیم‌سازی
    • دوربین تنظیم‌نشده
    • هندسه اپیپول تنظیم‌نشده
    • ابهامات و قیود در تشکیل تصویر
    • بازسازی مستقیم‌سازی‌شده
    • تنظیم خودکار با دانش پاره‌ای صحنه
  5. بازسازی چنددیدی از دانش صحنه
    • تشابه و هندسه چنددیدی
    • تنظیم چندشی‌ای چنددیدی
    • الگوریتم‌ها و مثال‌ها
  6. بهینه‌سازی عددی
    • روش‌های عمومی بهینه‌سازی
    • بهینه‌سازی کمترین-مربعات غیرخطی
    • تخمین خطا
    • تخمین مقاوم
  7. مدل‌سازی قدم به قدم ۳-بعدی
    • چارچوب کلی
    • انتخاب ویژگی
    • تطبیق ویژگی
    • بازسازی پروجکتیو و ارتقا اقلیدسی
    • بینائی‌گری
  8. بخش‌بندی صحنه‌های پویا
    • انگیزه و شرح مسئله
    • روش‌های خوشه‌بندی
    • بخش‌بندی حرکت ۳-بعدی
  9. توصیف و انطباق نقاط کلیدی
    • توصیف‌کننده‌های نقاط کلیدی
    • انطباق نقاط کلیدی
    • سنجنده‌های فاصله
  10. ردیابی ۳-بعدی بینائی‌گرا
    • آشکارسازهای فدوشال
    • مدل‌های فعال شکل
    • مدل‌های فعال ظاهر
    • انطباق کلیشه
  11. ردیابی ۳-بعدی بر مبنای ویژگی‌های طبیعی
    • استخراج نقاط ویژگی
    • ردیابی نقاط ویژگی
    • ردیابی نقاط موردنظرگرا
    • ردیابی قاب مرجع‌گرا
    • ردیابی پایدار
    • آشکارسازی شی نقاط ویژگی‌گرا
    • نزدیکترین نقاط تکراری
  12. یادگیری ژرف در بینائی کامپیوتری
    • شبکه‌های عصبی و پس‌انتشار
    • معماری‌های CNN: ایده‌های جدید، مزایا، و معایب
    • شبکه‌های عصبی ژرف مکانی-زمانی
    • آموزش شبکه‌های عصبی ژرف با جریان تنسور

ارزیابی

  • امتحان پایان‌ترم ۴۰٪
  • امتحان میان‌ترم ۱۵٪
  • کوئیز ۱۰٪
  • تکالیف ۱۵٪
  • پروژه نهایی ۱۵٪
  • گزارش پروژه ۲/۵٪
  • ارائه پروژه ۲/۵٪

مراجع

  1. An Invitation to 3-D Vision, from Images to Geometric Models, Yi Ma, Stefano Soatto, Jana Kosecka, & Shankar Sastry, Springer, 2010.
  2. Computer Vision - A Modern Approach, David A. Forsyth & Jean Ponce, Prentice Hall, 2nd edition, 2002.
  3. Probability, Random Variables, & Stochastic Processes, by Athanasios Papoulis, McGraw-Hill, 1991.
  4. Probability, Random Variables, & Random Signal Principles, by Peyton Z. Peebles, JR., McGraw-Hill, 3rd Edition, 1993.