banner

Блог

Dec 05, 2023

Обработка в 1000 раз быстрее: инновационный детектор для больших

Оптика, 26 августа 2023 г.

Исследователи использовали SNPD для повышения скорости и эффективности оптических нейронных сетей, продемонстрировав потенциальное 1000-кратное увеличение скорости обработки по сравнению с традиционными датчиками камеры. Это достижение знаменует новую эру систем машинного зрения на основе искусственного интеллекта.

Более быстрый и энергоэффективный дифракционный ONN можно использовать для обработки изображений и видео.

Впервые исследователи использовали мощность нелинейного фотодетектора с нормальными поверхностями (SNPD) для повышения скорости и энергоэффективности дифракционной оптической нейронной сети (ONN). Это инновационное устройство открывает путь для разработки крупномасштабных ONN, которые могут выполнять высокоскоростную обработку со скоростью света чрезвычайно энергоэффективным способом.

Фаршид Аштиани из Nokia Bell Labs представит это исследование на конференции Frontiers in Optics + Laser Science (FiO LS), которая пройдет 9–12 октября 2023 года в конференц-центре Greater Tacoma в Такоме (район Большого Сиэтла), Вашингтон.

«Искусственный интеллект (ИИ) играет все более важную роль в нашей жизни. От больших языковых моделей до автономных автомобилей мы видим значительные улучшения, обеспечиваемые искусственным интеллектом», — объясняет Аштиани. «Нейронные сети, вдохновленные тем, как человеческий мозг обучается и выполняет различные задачи, лежат в основе прогресса в области искусственного интеллекта. Одним из распространенных применений нейронных сетей является распознавание закономерностей и объектов, что дает машинам зрение. Например, каждый автономный автомобиль или даже полуавтономный автомобиль должен понимать свое окружение, имея возможность видеть вещи».

Массив детекторов. Фото: Фаршид Аштиани, Nokia Bell Labs

«Обычно изображения снимаются камерами, преобразуются в электрические сигналы и обрабатываются с помощью электронных процессоров, таких как центральные или графические процессоры, для распознавания объектов», — сказал Мохамад Хоссейн Иджади из Nokia Bell Labs.

«Однако, поскольку изображения изначально находятся в оптической области (т. е. в свете), их оптическая обработка с использованием ONN может оказаться быстрее и более энергоэффективной. Среди различных технологий ОНН на основе пространственных модуляторов света позволяют осуществлять оптическую обработку изображений и видео высокого разрешения. Для этой обработки требуются нелинейные модули, и для обеспечения необходимой нелинейности обычно используются датчики камеры, что занимает несколько миллисекунд.

«Наше новое детекторное устройство делает эту нелинейную обработку в 1000 раз быстрее и более энергоэффективной, чем такие камеры. Это имеет решающее значение для следующего поколения систем машинного зрения, поскольку нам всем нужны еще более быстрые интеллектуальные гаджеты, которые не потребляют много энергии».

Дифракционные ОНН в свободном пространстве используют пространственные модуляторы света и особенно многообещающи для создания крупномасштабных сетей нейронов, необходимых для обработки изображений и видео. Однако скорость и энергоэффективность этого типа ONN обычно ограничены датчиком изображения, используемым для реализации нелинейной функции активации, которая реализует несколько слоев нейронов для создания глубокой нейронной сети.

Одиночный детектор. Фото: Фаршид Аштиани, Nokia Bell Labs

В новой работе исследователи предложили использовать SNPD, который они ранее продемонстрировали в качестве высокоскоростного электрооптического модулятора, в дифракционных ONN высокого разрешения. Тестирование показало, что SNPD имеет полосу пропускания 3 дБ 61 кГц, что соответствует менее 6 микросекундам — примерно в 1000 раз быстрее, чем типичное время отклика датчиков камеры, обычно используемых в таких ONN. Датчик также потребляет всего около 10 нВт/пиксель, что на три порядка эффективнее обычной камеры.

To gauge the sensor’s efficacy within an ONN, the researchers input images into the convolution layer – the primary building block of the neural network. The convolution layer had 32 parallel 3 × 3 kernels with a stride of one and used the actually measured SNPD response as its activation function instead of the standard rectified linear activation function. With this simulation setup, the network achieved a test classification accuracyHow close the measured value conforms to the correct value." data-gt-translate-attributes="[{"attribute":"data-cmtooltip", "format":"html"}]"accuracy of about 97%, which is the same performance as using an ideal rectified linear activation function in the same network./p>

ДЕЛИТЬСЯ