ارائه مدلی کارا بر اساس زیرترکیبهای استخراج شده از ویژگی جهت تشخیص فعالیتهای فیزیکی انسانی
فرمت فایل دانلودی: .docxفرمت فایل اصلی: docx
تعداد صفحات: 147
پایان نامه ارائه مدلی کارا بر اساس زیرترکیبهای استخراج شده از ویژگی جهت تشخیص فعالیتهای فیزیکی انسانی
نوع فایل: word (قابل ویرایش)
تعداد صفحات : 147 صفحه
چکیده
درک و استخراج اطلاعات از تصاویر و فیلم فصل مشترک اکثریت مسایل مربوط به بینایی ماشین است. یافتن قسمتهای اصلی و مفید یک فیلم و مدلسازی کنشهای بین این اجزا از اهداف اصلی آنالیز فیلم به شمار میرود. در دهه اخیر تشخیص فعالیت انسانی با استفاده از تصاویر ویدیویی به عنوان یک بحث چالش برانگیز در بینایی ماشین مطرح شده است. از جمله کاربردهای این موضوع میتوان به مسایل نظارتی و امنیتی، پزشکی و تعامل انسان با کامپیوتر اشاره کرد. در تشخیص فعالیت به دلیل گوناگونی زیاد در نحوه انجام یک فعالیت، استخراج اجزاء اصلی و خلاصه سازی یک فعالیت، مشکل و پیچیده است. در صورتی که شروع آنالیز ویدیو را پردازش روشنایی پیکسلهای تصویر در فریمهای مختلف و هدف نهایی را تشخیص فعالیت انسانی در نظر بگیریم، فاصله زیادی بین سطح آنالیز و هدف نهایی وجود داشته و نیاز مبرم به استخراج ویژگیهای معنادار و سطح بالاتر احساس میشود. در حقیقت چالش اصلی پر کردن فاصله عمیق بین توصیف گرهای سطح پایین تا بیان نوع فعالیت و خلاصه سازی آن است. در دهههای اخیر پژوهشگران در ارائه روشهای موثر خلاصهسازی با استفاده از تکنیکهای بینایی و یادگیری ماشین حتی در سطح تصاویر، زیاد موفق نبودهاند. در این راستا روشهای جداسازی مطرح شدهاند که به مدلسازی مرز افتراقی کلاسهای مختلف پرداختهاند. این مدلها علی رغم موفقیتشان، به دادههای برچسبدار زیاد نیاز داشته و محدود به زمینه خاصی میشوند. به علاوه، خطر بیش برازش نیز آنها را تهدید میکند. از طرف دیگر مدلهای مولد با اضافه کردن قیود اضافی به مدل با استفاده از حجم زیادی از دادههای بدون برچسب در دسترس، به حل این مشکل پرداختند. به عنوان نمونه می توان به روشهای یادگیری ویژگی بدون ناظر اشاره نمود که با اضافه کردن برخی دانشهای اولیه در مورد ساختار کلی داده به کم کردن فاصله بین توصیف گرهای سطح پایین و مدل نهایی پرداختند.
در این پایان نامه با ارائه پنج چارچوب متفاوت به حل مساله تشخیص فعالیت انسانی با رویکرد خلاصه سازی و استخراج ویژگیهای سطح بالاتر پرداخته شده است. مراحل اصلی انجام کار را میتوان به سه قسمت اصلی، ۱- استخراج ویژگی، ۲- کوانتیزه کردن آنها و ۳- دسته بندی تقسیم نمود. در این پژوهش به استخراج ویژگیهای شکل و حرکت مربوط به تصاویر دوبعدی فریمهای ویدیو پرداخته شده است. در قسمت دوم که تقریبا قسمت اصلی این پژوهش محسوب شده جهت کاهش خطای کوانتیزه کردن و بالا بردن سطح ویژگیها (با بهرهگیری از دانش اولیه نهفته در داده) و نیز دستهبندی راحتتر در مراحل بعد، به جای روشهای متداول نظیر K-means، از روشهای کد گذار تنک و نیز برخی نسخههای بهبود یافته آن که جزء متدهای یادگیری ویژگی بدون ناظر محسوب میشوند، استفاده شده است. در اینگونه روشها هدف یافتن توابع پایهای سطح بالاتر و توصیف ویدیو با استفاده از ترکیب خطی از آنهاست. همچنین جهت استخراج اطلاعات مفید توالی زمانی از روش بسیار مفید کد گذار تنک گروهی بهره گرفتهایم. سپس جهت جلوگیری از بیش برازش شدن مدل، ادغام مکانی و زمانی ضرایب پیشنهاد شده است. در نهایت با استفاده از دو الگوریتم مختلف از روشهای کلی دسته بندی مولد و جداساز تشخیص فعالیت را به پایان رساندهایم.
از نقاط برجسته این پایان نامه میتوان به ترکیب چند ویژگی با مودالیتههای مختلف، استخراج اجزای معنادار یک فعالیت و مدلسازی ارتباط آنها با در نظر گرفتن ساختار زمانی داده، کاهش خطای کوانتیزه کردن و نیز کاهش چشمگیر پیچیدگی مکانی و زمانی اشاره نمود. روشهای ارائه شده بر روی چندین پایگاه داده تشخیص فعالیت که متشکل از دادههای مصنوعی و واقعی با چالشهای مختلف بوده، ارزیابی شده و نتایج خوبی به دست آمدهاند.
واژگان کلیدی: تشخیص فعالیت انسانی، دانش اولیه، ساختار داده، سیستم چند دسته بندی، کدگذار تنک، کدگذار تنک گروهی، یادگیری ویژگی بدون ناظر.
۱- مقدمه 2
۱-۱- مقدمه 2
۱-۲- کاربردها 14
۱-۳- چالشها و خصوصیات محیط 6
۱-۴- تعریف کلی مساله 11
۲- مروری بر پژوهشهای گذشته 24
۲-۱- مقدمه 24
۲-۲- روشهای تک لایه 24
۲-۲-۱- معرفی انواع روشهای زمان- مکان 15
۲-۲-۲- جمع بندی و مقایسه روشهای زمان-مکان 23
۲-۲-۳- روشهای متوالی 25
۲-۲-۴- جمع بندی و مقایسه روشهای متوالی 26
۲-۳- روشهای چندلایه (سلسله مراتبی) 26
۲-۳-۱- روشهای آماری 27
۲-۳-۲- روشهای نحوی 27
۲-۳-۳- مدل توصیفی 28
۲-۳-۴- جمع بندی و مقایسه روشهای سلسله مراتبی 28
۳- مطالعه ابزارهای مورد استفاده 31
۳-۱- مقدمه 31
۳-۲- ابزارهای مورد استفاده در استخراج ویژگی 31
۳-۲-۱- هیستوگرام گرادیان جهت دار 31
۳-۲-۲- شار نوری 32
۳-۳- ابزارهای مورد استفاده در یادگیری ویژگیهای سطح بالاتر 44
۳-۳-۱- الگوی کلی در یادگیری ویژگی بدون ناظر 36
۳-۳-۲- روشهای متداول در یادگیری ویژگی بدون ناظر 37
۳-۳-۳- تجزیه تجربی مودی 61
۳-۴- ابزارهای مورد استفاده در دسته بندی 62
۳-۴-۱- مدل مخفی مارکوف 62
۳-۴-۲- ماشین بردار پشتیبان: 56
۴- روش پیشنهادی 61
۴-۱- مقدمه 61
۴-۲- تعریف چارچوب اصلی 61
۴-۳- مراحل انجام کار 62
۴-۳-۱- بیان ویدیو 64
۴-۳-۲- استخراج ویژگی 76
۴-۳-۳- کوانتیزه کردن کلمات و ساخت دیکشنری 68
۴-۳-۴- ادغام 88
۴-۳-۵- دسته بندی 89
۴-۴- چارچوبهای پیشنهادی 92
۴-۴-۱- چارچوب اول: 92
۴-۴-۲- چارچوب دوم: 92
۴-۴-۳- چارچوب سوم: 83
۴-۴-۴- چارچوب چهارم: 84
۴-۴-۵- چارچوب پنجم: 86
۵- نتایج 95
۵-۱- پایگاه دادههای موجود 95
۵-۲- تنظیم پارامترهای مساله 102
۵-۳- نتایج 104
۶- بحث 120
۶-۱- نوآوریها و مزایا و معایب آنها 120
۶-۲- مقایسه چارچوبهای پیشنهادی 113
۶-۳- کارهای پیشنهادی جهت آینده 114
۶-۴- جمع بندی 115
۷- فهرست منابع 116
- ۲۲ نمایش