Red neuronal Convolucional CNN

Definición

Las redes neuronales convolucionales son similares a las redes neuronales multicanal, su principal ventaja es que cada parte de la red se le entrena para realizar una tarea, esto reduce significativamente el número de capas ocultas, por lo que el entrenamiento es más rápido. Además, presenta invarianza a la traslación de los patrones a identificar.

Arquitectura

Una red neuronal convolucional es una red multicapa que consta de capas  convolucionales  y de  submuestreo alternadas, y al final tiene capas de conexión total como una red perceptrón multicapa.
Arquitectura de red neuronal convolucional

Convolución – convolution

En la convolución se realizan operaciones de productos y sumas entre la capa de partida y los n filtros (o kernel) que genera un mapa de características. Los características extraídas corresponden a cada posible ubicación del filtro en la imagen original.

La ventaja es que el mismo filtro (= neurona) sirve para extraer la misma característica en cualquier parte de la entrada, con esto que consigue reducir el número de conexiones y el número de parámetros a entrenar en comparación con una red multicapa de conexión total.

Convolución

Después de aplicar la convolución se le aplica a los mapas de características una función de activación.

La función de activación recomendada es signoide ReLU, seleccionando una tasa de aprendizaje adecuada y monitorizar la fracción de neuronas muertas, también se puede podría probar con Leaky ReLu o Maxout, pero nunca utilizar sigmoide logística. 

Reducción – pooling

En la reducción se disminuye la cantidad de parámetros al quedarse con las características más comunes.

La forma de reducir parámetros se realiza mediante la extracción de estadísticas como el promedio o el máximo de una región fija del mapa de características, al reducir características el método pierde precisión aunque mejora su compatibilidad.

Reducción

Clasificador – red perceptron multicapa

El final de las capas convolucional y de reducción, se suele utilizar capas completamente conectadas en la que cada pixel se considera como una neurona separada al igual que en un perceptrón multicapa.

La última capa de esta red es una capa clasificadora que tendrá tantas neuronas como el número de clases a predecir.

 

Otros artículos que pueden ser de interés:

Autor: Diego Calvo