Cómo la fotónica está revolucionando las redes neuronales convolucionales

Cómo la fotónica está revolucionando las redes neuronales convolucionales

Las primeras capas neuronales se implementan utilizando un acelerador analógico (electrónico, fotónico, etc.) con bajo consumo de energía y alto rendimiento de procesamiento, mientras que las últimas capas se implementan digitalmente con alta precisión y baja complejidad. Fuente: Aris Tsirigotis et al.

La era moderna ha sido testigo de un rápido aumento en la demanda de poder de cómputo para el procesamiento cognitivo de imágenes y videos. Si bien las redes neuronales convolucionales ofrecen un mejor rendimiento de procesamiento de imágenes, también conllevan un aumento significativo en el consumo de energía y los requisitos de memoria.

Según una encuesta realizada por OpenAI, entre 2012 y 2018, hubo un aumento asombroso en la cantidad de cálculos por un factor de más de 300 000. En contraste, durante el mismo período, la ley de Moore fue responsable de solo un aumento de siete veces en el poder de cómputo. .

Para satisfacer esta creciente demanda de poder de cómputo, los investigadores han recurrido a la fotónica como una forma de mejorar las redes neuronales convolucionales. Un equipo de investigadores de la Universidad del Egeo, la Universidad de West Attica y la Universidad Técnica Nacional de Atenas ha proporcionado una descripción general completa del panorama en rápida evolución de las arquitecturas neuromórficas fotónicas integradas para implementar redes neuronales convolucionales.

Su artículo de revisión apareció en Procesamiento inteligente.

¿Por qué es necesaria la computación fotónica en las redes neuronales convolucionales?

Las redes neuronales convolucionales son una clase de redes neuronales artificiales que han revolucionado varios campos, en particular las tareas de procesamiento de imágenes por computadora, como el reconocimiento de imágenes, la detección de objetos y la segmentación de imágenes. Las redes neuronales convolucionales se inspiran en el mecanismo de procesamiento visual del cerebro humano y están diseñadas para aprender automáticamente representaciones jerárquicas a partir de datos de entrada.

Cuando las redes neuronales convolucionales se profundizan y tienen más parámetros enseñables, su rendimiento tiende a mejorar. Sin embargo, esta mejora tiene un precio. El consumo de energía y los requisitos de memoria también aumentan significativamente. En el campo del procesamiento de imágenes, las etapas de convolución de las redes neuronales convolucionales consumen alrededor del 80% de la energía total consumida.

Para mantenerse al día con la creciente demanda, las empresas y los investigadores intentan utilizar múltiples chips y aprovechar el procesamiento paralelo. Sin embargo, este enfoque conduce a un aumento significativo en el consumo de energía, lo que plantea preocupaciones tanto en términos de costos financieros como del impacto ambiental de la ampliación de los sistemas.

¿Cómo funciona la computación fotónica?

La fotónica utiliza las propiedades únicas de la luz para transmitir y procesar información, revolucionando aplicaciones como la comunicación de datos. Las redes neuronales convolucionales fotónicas integradas son una forma de acelerar el cálculo en las redes neuronales convolucionales utilizando dispositivos ópticos especiales.

El truco consiste en convertir el paso de convolución en una red neuronal convolucional en una serie de multiplicaciones de matrices. En este método, la imagen se divide en áreas pequeñas y cada área se convierte en una fila en la matriz. Los filtros o núcleos utilizados en la convolución se representan como columnas en una matriz diferente, y cada columna contiene los pesos de los núcleos. El resultado de la convolución se obtiene realizando una multiplicación de matrices entre estas dos matrices.

En la fotónica integrada se utiliza un proceso similar, pero con luz. Los parches de la imagen se convierten en una señal óptica y los pesos del núcleo se almacenan en un chip especial. La señal óptica se envía al chip y dentro del chip pasa por un proceso de multiplicación de matriz con luz. Este chip fue diseñado específicamente para estos cálculos y es como una minicomputadora para la luz. Hay diferentes tipos de estos chips, pero todos usan luz para realizar cálculos.

Estos chips se denominan circuitos integrados fotónicos. Algunos circuitos integrados fotónicos son reprogramables, lo que significa que se pueden cambiar para realizar diferentes cálculos. Otros son permanentes y están diseñados para tareas específicas.

¿Cómo acelera la computación fotónica las redes neuronales convolucionales?

Una forma de acelerar el procesamiento de imágenes con luz es el enfoque de corte de espectro óptico. Imagine una máquina que pueda analizar imágenes muy rápidamente, descomponiéndolas en diferentes colores y patrones. Esta máquina no necesita circuitos complejos ni preprocesamiento de imágenes antes de analizarlas. El método utiliza filtros especiales que dividen la imagen en diferentes partes según sus colores y patrones. Estos filtros trabajan juntos para extraer características importantes de la imagen.

Al usar este enfoque, la máquina se vuelve escalable, lo que significa que puede manejar imágenes más grandes y complejas. Este método usa muy poca energía porque solo necesita una pequeña cantidad de energía para detectar la luz y procesar las señales. También funciona instantáneamente sin demoras, por lo que puede procesar imágenes en tiempo real.

Otro acelerador fotónico adopta un enfoque bioisomórfico que utiliza neuronas láser con púas miniaturizadas y entrenamiento bioinspirado sin supervisión. Esta arquitectura profunda proporciona una solución resistente al ruido y energéticamente eficiente. Las neuronas láser simulan el comportamiento impulsivo de las neuronas biológicas, proporcionando inmunidad al ruido. El entrenamiento bioinspirado sin supervisión extrae de forma autónoma características destacadas de los datos, lo que permite el reconocimiento de patrones sin etiquetas claras.

El procesamiento de la información basado en la fotónica garantiza la eficiencia energética. Usando estas tecnologías, el acelerador logra inmunidad al ruido y reduce el consumo de energía. En conclusión, un enfoque alternativo combina neuronas láser miniaturizadas, entrenamiento bioinspirado no supervisado y fotónica para crear una solución resistente al ruido y de bajo consumo para el aprendizaje profundo.

Más información:
Aris Tsirigotis et al., Aceleradores fotónicos integrados no convencionales para redes neuronales convolucionales de alto rendimiento, Procesamiento inteligente (2023). DOI: 10.34133/icomputación.0032

Proporcionado por Computación Inteligente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *