Корпорация Toshiba разработала искусственный интеллект с 3D-распознаванием, который способен измерять расстояние с точностью стереокамеры, используя изображение, снятое коммерческой камерой, и анализируя размытие изображения, вызванное объективом камеры, с помощью глубокого обучения. Эта технология устранит использование стереокамер, что в конечном итоге снизит стоимость и площадь. Toshiba представит это достижение на международной конференции по компьютерному зрению (ICCV2019), которая состоится в Южной Корее 30 октября 2019 года с 10:00.
Распознавание изображений становится все более важным, и такие приложения, как движущиеся объекты роботов, автономные беспилотные автомобили, дроны с дистанционным управлением для проверки инфраструктуры и т. Д., Требуют большего, чем просто изображения объектов, им требуется небольшое устройство для анализа трехмерных данных, включая форму и расстояние. Следовательно, исследования были увеличены для разработки измерительной технологии с монокулярными камерами (их легко миниатюризировать) с использованием глубокого обучения для лучшего изучения формы, фона и других данных о пейзаже отображаемого объекта.
У этого метода есть недостаток; Точность определения расстояния оценивается с помощью монокулярной камеры в зависимости от полученных данных о пейзаже, что приводит к падению точности из-за снимков, сделанных в разных ландшафтах. Чтобы преодолеть это, Toshiba разработала фотографию с цветным фильтром с диафрагмой, в которой к объективу прикрепляются два цветных фильтра, а цвет и размер получаемого размытия изображения анализируются в соответствии с расстоянием от объекта. Хотя это решает проблему зависимости данных, модификация существующих линз требует времени и денег.
Toshiba преодолела эту проблему, разработав искусственный интеллект с технологией 3D-распознавания, которая использует глубокое обучение для анализа того, как изображение размывается в зависимости от его положения на объективе, чтобы обеспечить измерение расстояния с такой же высокой точностью, как у стереокамер., с обычной монокулярной камерой, но без каких-либо данных о пейзаже. До сих пор считалось, что теоретически невозможно измерить расстояние на основе формы размытия, которая одинакова для объектов, находящихся как на расстоянии, так и на большом расстоянии, когда они находятся на одинаковом расстоянии от точки фокусировки. Но аналитические результаты показали существенную разницу между размытыми формами близких и далеких объектов, даже если они находятся на одинаковом расстоянии от фокальной точки. Благодаря этому Toshiba успешно проанализировала данные размытия из захваченных изображений с помощью модуля глубокого обучения, обученного с помощью модели глубокой нейронной сети.
Известно, что когда свет проходит через линзу, форма создаваемого размытия меняется в зависимости от длины волны света и его положения в линзе. В разработанной сети положение и цвет обрабатываются отдельно, чтобы правильно воспринимать изменения формы размытия, а затем, после прохождения через механизм взвешенного внимания, контролировать, где на градиенте яркости фокусироваться, чтобы правильно измерить расстояние. Затем посредством обучения сеть обновляется, чтобы уменьшить ошибку между измеренным и фактическим расстоянием. Используя этот модуль искусственного интеллекта, Toshiba подтвердила, что одно изображение, снятое с помощью имеющейся в продаже камеры, обеспечивает ту же точность измерения расстояния, что и стереокамеры. Более подробную информацию можно найти на этой официальной странице Toshiba.
Toshiba подтвердит универсальность системы с помощью имеющихся в продаже камер и объективов и ускорит обработку изображений, стремясь к публичному внедрению в 2020 финансовом году.