
شناسايي نوع و مدل خودرو و به طور کلي شناسايي دانه ريز اشيا از موضوعات داغ در دهه اخير است. در اين نوع از شناسايي اشيا، دسته کلي شي مشخص بوده و هدف شناسايي زيردسته شي مي باشد. وجود تعداد کلاس هاي زياد، تفاوت درون کلاسي بسيار و تفاوت بين کلاسي کم اين مسايل را نسبت به مسايل شناسايي عمومي يا دانه درشت، دشوارتر مي گرداند. يکي از چالش هايي که اغلب سيستم هاي تشخيص و شناسايي اشيا هميشه با آن مواجه بوده اند، سرعت پردازش است. هر سيستم پردازش تصويري بسته به نوع آن (تشخيص يا شناسايي) و يا شکل عملکرد آن (برون خط يا برخط) بايد داراي زمان اجراي مشخصي باشد. براي مثال سيستم هاي تشخيص پلاک خودرو که بر روي دوربين هاي مداربسته در بزرگراه ها نصب مي شوند، براي عملکرد ايده آل بايد داراي زمان پردازش بهتر از ۲۰ فريم بر ثانيه باشند. زمان پردازش مورد نياز براي يک سيستم شناسايي شي متغير بوده و بستگي به تعداد کلاس هايي دارد که سيستم قادر به شناسايي آنها است و طبيعتاً هرچه تعداد کلاس ها بيشتر باشد زمان پردازش هر فريم يا تصوير بالاتر خواهد رفت. در چنين سيستم هايي معمولاً يک تقابل بين دقت و سرعت وجود دارد به طوري که با افزايش دقت، سرعت کاهش و با کاهش دقت، سرعت افزايش مي يابد. براي نمونه، يکي از ابزارهاي بسيار قدرتمند دهه اخير، شبکه هاي عصبي عميق هستند که در اغلب حوزه ها بهترين نتايج ممکن را حاصل کرده اند و مهمترين ضعف اين روش ها سرعت آنها است و به همين دليل اغلب از يک مرحله پيش پردازش در اين سيستم ها استفاده مي شود تا از پردازش کل تصوير توسط شبکه عصبي عميق جلوگيري به عمل آيد، مانند الگوريتم هاي پيشنهاد ناحيه که تعدادي بخش نامزد را استخراج کرده و تنها همان بخش ها براي شبکه عصبي ارسال مي شود. معمولا از موازي سازي براي بهبود سرعت چنين سيستم هايي استفاده مي شود.