درک این موضوع ممکن است بهاندازه کافی ساده به نظر برسد، اما در پشت پرده آن، یک زمینه پیچیده و چند رشتهای وجود دارد که با انواع فنآوریهای قدیمی و حتی نوظهور گره خورده است. بینایی کامپیوتری ممکن است بسته به نیاز تصویربرداری با دوربینهای مختلف بهعنوان چشم دستگاه استفاده شود.
برای مثال در یک فناوری تشخیص میوه، از دوربینهای رنگی برای شناسایی میوه از روی درخت استفاده میشود و دوربینهای استریوی اضافی، موقعیت نسبی میوه را (ازنظر میزان رسیدگی) برای برداشت خودکار تشخیص میدهند.
هرچند این تنها مدل بینایی رایانهای نیست و از دوربینهای مادونقرمز، چند طیفی، حرارتی یا حتی سهبعدی نیز برای این کار میتوان استفاده کرد. رایانهها همچنین میتوانند از تشخیص مبتنی بر نقطه یا منحنی استفاده کنند و یا حتی اشیا را بر اساس کنتراست شکل یا بافت تشخیص دهند.
برای کاربرد این فناوری در کشاورزی، صرفاً تشخیص یک شی از پیش تعیینشده کافی نیست چون محصولات بهندرت یکنواختاند و ممکن است ازنظر اندازه و رنگ متفاوت باشند درنتیجه برای شناسایی درست میوه به پردازش بیشتری نیاز است. بهطور خلاصه، جنبه “بینایین” بینایی کامپیوتری فقط شروع کار است و مرحله بعدی، شناسایی یا درک تصویر است.
این “درک” بهطور قابلتوجهی از بینایین یک تصویر پیچیدهتر است و فرایندها به انواع یادگیری ماشینی و یادگیری عمیق تقسیم میشوند. ازنظر عوام، یادگیری ماشینی یک سیستم مبتنی بر الگوریتم است، دادهها را تجزیه میکند، آنها را فرامیگیرد و آنها را برای تصمیمات یا توصیههای بعدی اعمال میکند.
برنامههایی مانند Spotify برای تجزیهوتحلیل سلیقه موسیقی و سفارشها شما از این نوع یادگیری ساده ماشینی استفاده میکنند. آهنگهای موردعلاقه شما بهعنوان دادههای ساختاریافته برای الگوریتم عمل میکنند، سپس آهنگهای مشابه را پیدا کرده و به شما توصیه میکنند.
یادگیری عمیق اساساً زیرمجموعه یادگیری ماشین است، از یک شبکه عصبی مصنوعی لایهای برای جمعآوری اطلاعات و شناسایی الگوها و یادگیری در حین انجام کار استفاده میکند. منظور از تقلید از روش یادگیری مغز انسان، یادگیری عمیق پیچیدهتر است و میتواند برای مسائل پیچیدهتر مانند پردازش زبان طبیعی و تشخیص تصویر استفاده شود.