MultiONoticias

Por Johanna Pingel | MathWorks

Todo sobre arquitecturas de deep learning: Cómo elegir una configuración de red

-A
+A

¿Cómo se hace el entrenamiento de aprendizaje profundo con una pequeña muestra de datos? Johanna Pingel responde a esta y otras preguntas pragmáticas para ayudarle a seleccionar la mejor arquitectura de deep learning.

Estos artículos analizarán un tema, explicarán algunos de los antecedentes y responderán algunas preguntas que han hecho en la comunidad de MATLAB®.
El tema de esta columna trata sobre arquitecturas de red de aprendizaje profundo. Se eligieron preguntas que reflejan el uso común en lugar de casos de uso académico:
 
  • 1. ¿Qué arquitectura debo utilizar para clasificar imágenes?
  • 2. ¿Puedo tomar una CNN previamente entrenada (entrenada para la salida de clasificación) y entrenarla para un problema de regresión?
  • 3. ¿Cómo sé qué técnica elegir para la regresión de series de tiempo?
  • 4. ¿Existe una arquitectura de red que deba usar para un conjunto de datos pequeño?
Una arquitectura de red define la forma en que se estructura un modelo de aprendizaje profundo y, lo que es más importante, para qué está diseñado. La arquitectura determinará:
  1. La precisión del modelo (una arquitectura de red es uno de los muchos factores que afectan la precisión)
  2. Qué puede predecir el modelo
  3. Lo que espera el modelo como entrada y salida
  4. La combinación de capas y cómo fluyen los datos a través de las capas
La mayoría de las personas comienzan con la combinación de capas de otra persona para comenzar a entrenar. Al iniciar algo por primera vez, puede ser una buena idea buscar a los expertos. Los investigadores de aprendizaje profundo han estado explorando diferentes arquitecturas de red y combinaciones de capas durante bastante tiempo. Los resultados que han obtenido con arquitecturas como GoogLeNet, ResNet o SqueezeNet (por nombrar algunas redes populares) son bastante impresionantes. Al comenzar, puede aprovechar este éxito de una arquitectura publicada que aborde un problema similar en lugar de comenzar desde cero.
 
Antes de elegir una arquitectura de red, es importante comprender qué tipo de caso de uso tiene y las redes comunes disponibles para usted.
 
Es probable que encuentre estas arquitecturas comunes al comenzar con el aprendizaje profundo:
 
• Red neuronal convolucional (CNN): las CNN se asocian comúnmente con imágenes como datos de entrada, pero también se pueden usar para otros datos de entrada.
• Red neuronal recurrente (RNN): los RNN tienen conexiones que realizan un seguimiento de la información anterior para realizar predicciones futuras. A diferencia de las CNN, donde se supone que cada entrada es un evento independiente, las RNN pueden procesar secuencias de datos que podrían afectarse entre sí. Un ejemplo es el procesamiento del lenguaje natural, donde las palabras anteriores influyen en la probabilidad de lo que sigue.
• Memoria a largo-corto plazo (LSTM): las redes LSTM son un RNN de uso común para datos de secuencia y señal. 
• Red generativa de confrontación (GAN): aunque no las cubro en las preguntas siguientes, las GAN se han vuelto más populares recientemente. Las GAN pueden generar nuevos datos basados ​​en datos existentes (piense en imágenes de personas que en realidad no son personas reales).  Puede obtener más información sobre las GAN en el video Cómo diseñar y capacitar redes generativas de confrontación (GAN) y el ejemplo de Capacitación de redes generativas de confrontación (GAN).
 
Acceda al artículo original aquí.