به گزارش سراج24 به نقل از نیواطلس، بخش تحقیقات یادگیری ماشین اپل یک مدل مبتنی بر هوش مصنوعی برای تخمین عمق تک بعدی تصاویر توسعه داده است. دیپ پرو (Depth Pro) امکان تولید سریع نقشههای عمق سه بعدی دقیق از یک تصویر دو بعدی واحد را فراهم میکند.
مغز ما اطلاعات بصری را از دو منبع تصویر یعنی چشمان ما پردازش میکند. هر کدام از آنها دید نسبتا متفاوتی نسبت به جهان دارند، و اینها در یک تصویر استریوی واحد ترکیب شده اند، با این تفاوتها همچنین به ما کمک میکنند تا میزان نزدیکی یا دور بودن اشیا را بسنجیم.
بسیاری از دوربینها و گوشیهای هوشمند از طریق یک لنز به زندگی نگاه میکنند، اما نقشههای عمق سه بعدی را میتوان با استفاده از اطلاعات پنهان در متادیتای عکسهای دو بعدی (مانند فاصلههای کانونی و اطلاعات سنسور) ایجاد کرد یا با استفاده از چندین تصویر تخمین زد.
با این حال سیستم دیپ پرو این مشکلات را ندارد و قادر است از طریق یک واحد پردازش گرافیکی استاندارد، نقشه عمق سه بعدی دقیق با وضوح ۲.۲۵ مگاپیکسل را از یک تصویر در عرض ۰.۳ ثانیه ایجاد کند.
معماری مدل هوش مصنوعی شامل چیزی به نام یک ترانسفورماتور دید چند مقیاسی است که قابلیت پردازش همزمان زمینه کلی یک تصویر و همچنین تمام جزئیات ظریفتر مانند مو، خز و دیگر ساختارهای ظریف را دارد و میتواند تخمین عمق نسبی و مطلق را تخمین بزند، به این معنی که این مدل میتواند اندازه گیریهای دنیای واقعی را فراهم کند تا برای مثال، به برنامههای واقعیت افزوده اجازه دهد تا اشیا مجازی را به طور دقیق در یک فضای فیزیکی قرار دهند.
هوش مصنوعی قادر است تمام این کارها را بدون نیاز به آموزش منبع محور روی مجموعه دادههای بسیار خاص انجام دهد و از چیزی به نام یادگیری عکس صفر استفاده کند که آی بی ام آن را یک سناریوی یادگیری ماشین توصیف میکند که در آن یک مدل هوش مصنوعی میتواند کلاسهای نادیده را بدون مثالهای برچسب گذاری شده تشخیص داده و دسته بندی کند.
همچنین دیپ پرو میتواند با استفاده از یک دوربین تک لنزی، ویرایش عکس بسیار کارآمدتری انجام دهد یا حتی به تصاویر سه بعدی بلادرنگ منجر شود و برای کمک به ماشینهایی مانند خودروهای خودران و رباتها برای درک بهتر دنیای اطرافشان در زمان واقعی مفید واقع شود.