Información

Identificación de sistemas en una pequeña red neuronal


Al analizar los datos de la corteza, a menudo tratamos de comprender qué hace cada neurona en términos de sus entradas de otras neuronas, un tipo específico de estrategia de identificación de sistemas. La mayoría de los enfoques actuales utilizan modelos lineales generalizados para ese propósito (artículo de revisión).

Para sistemas muy pequeños como el gusano c. Órganos debe ser posible registrar desde todas las neuronas al mismo tiempo, al menos ópticamente. ¿Qué tan bien podemos entender la salida de cada neurona en función de sus entradas en sistemas tan simples? ¿Cuáles son las mejores bases de datos para hacer estas preguntas?

La razón por la que hago esta pregunta ahora es porque el proyecto del cerebro humano que acaba de recibir aproximadamente mil millones de dólares en fondos básicamente necesita esos datos para cada célula de todo el cerebro.


Para sistemas muy pequeños como el gusano c. Órganos debe ser posible registrar desde todas las neuronas al mismo tiempo, al menos ópticamente.

Si bien es cierto que la grabación óptica de todo el organismo es técnicamente posible en C. elegans, no conozco ningún trabajo publicado en el que todas las neuronas se hayan identificado y registrado simultáneamente y luego se hayan combinado con datos de conectividad de forma sistemática.

Debo señalar que esto no se limita a C. elegans. El laboratorio de Florian Engert también ha publicado grabaciones de organismos completos de peces cebra. Sin embargo, por el momento, todavía hay desafíos técnicos que resolver antes de que obtengamos las relaciones de entrada y salida que desea en todo el organismo. En primer lugar, las grabaciones no son realmente simultáneas, en el sentido de que todavía se necesita tiempo para crear imágenes en 3D a partir de pilas z. En segundo lugar, el procesamiento de imágenes para etiquetar neuronas aún no es sólido. Y finalmente, los indicadores ópticos más populares se basan en los niveles de calcio y, por lo tanto, proporcionan solo una aproximación del potencial de membrana y, además, tienen limitaciones en la resolución, el rango y la precisión en el tiempo.

Sin embargo, el campo está progresando rápidamente y sospecho que estos desafíos se superarán en los próximos años.

¿Cuáles son las mejores bases de datos para hacer estas preguntas?

Todavía no hay una base de datos para la actividad neuronal de C. elegans, probablemente porque el número de grupos que publican grabaciones ópticas en C. elegans es todavía bastante pequeño. Pero a medida que más laboratorios aprendan la técnica, creo que el valor de una base de datos se volverá más obvio para la comunidad y el proyecto OpenWorm proporcionará un liderazgo muy necesario en esta área.

Finalmente, debo señalar que al final podemos encontrar que la actividad neuronal y la conectividad proporcionan solo una parte de la historia. Es probable que en C. elegans los neuromoduladores y otras conexiones "no cableadas" entre neuronas también puedan desempeñar papeles muy importantes.


Las redes pequeñas codifican la toma de decisiones en la corteza auditiva primaria

Las tareas de detección sensorial mejoran las representaciones de estímulos conductualmente significativos en la corteza auditiva primaria (A1). Sin embargo, no está claro cómo A1 codifica la toma de decisiones. Las neuronas en la capa A1 2/3 (L2 / 3) muestran una selectividad de estímulo heterogénea y una conectividad anatómica compleja, y reciben información de la corteza prefrontal. Por lo tanto, la modulación de la actividad relacionada con la tarea en A1 L2 / 3 podría diferir entre las subpoblaciones. Para estudiar la codificación neuronal de la toma de decisiones, utilizamos imágenes de dos fotones en A1 L2 / 3 de ratones que realizaban una tarea de detección de tonos. Las respuestas neuronales a los objetivos mostraron una ganancia de atención y una elección de comportamiento codificada. Para caracterizar la representación en red de la elección conductual, analizamos la conectividad funcional utilizando la causalidad de Granger, correlaciones de ruido por pares y decodificación neuronal. Durante el desempeño de la tarea, pequeños grupos de cuatro a cinco neuronas se vincularon escasamente, se agruparon localmente y se orientaron rostro-caudalmente, mientras que las correlaciones de ruido aumentaron y disminuyeron. Nuestros resultados sugieren que la toma de decisiones basada en los sentidos involucra pequeñas redes neuronales impulsadas por la suma de información sensorial, ganancia de atención y elección de comportamiento.

Palabras clave: Granger de 2 fotones, atención, comportamiento auditivo, corteza, toma de decisiones, decodificación de imágenes, ratón.

Copyright © 2018 Elsevier Inc. Todos los derechos reservados.

Declaracion de conflicto de interes

Los autores declaran no tener conflictos de intereses.

Cifras

Imágenes de 2 fotones (2P) en estado despierto ...

Imágenes de 2 fotones (2P) en ratones que se comportan despiertos. UNA. Los ratones con la cabeza fija fueron entrenados para ...

60–70% de tasa de aciertos en el rango de frecuencia objetivo (4–32 kHz). D. Función de distribución acumulativa (CDF) para la latencia de respuesta (oscuridad: conjunto total de experimentos, luz: ratones). MI. Tasas de rendimiento para cada tipo de respuesta conductual para experimentos (oscuro) y animales (claro), respectivamente. Las barras de error muestran 2 errores estándar de la media (SEM). Tasa de aciertos total: 65,2% ± 18,8% y 61,5% ± 13,9%, en experimentos y animales, respectivamente. Tasa de aciertos recompensada: 40,2% ± 12,2% y 39,6% ± 6,7% en experimentos y animales, respectivamente. Tasa de aciertos castigados: 25% ± 17,7% y 28% ± 15,2% en experimentos y animales, respectivamente. Tasas de fallos: 35% ± 18,8% y 32,5% ± 15,5% en experimentos y animales, respectivamente. Las estrellas indican diferencias significativas entre los pares de grupos indicados por las barras: aciertos frente a fallos (prueba t de arranque, experimentos: p & lt0.001 animales: p = 0,0011) y aciertos castigados frente a aciertos recompensados ​​(prueba t de arranque, experimentos: p & lt0 0,001 animales: p = 0,04).

Respuestas neuronales evocadas por tonos captadas en ...

Las respuestas neuronales evocadas por tonos obtenidas en imágenes en la capa 2/3 de la corteza auditiva primaria (A1) muestran tonos puros ...

La actividad evocada por tonos en A1 es ...

La actividad evocada por tonos en A1 está modulada por la elección del comportamiento. UNA. Mapa de calor del individuo ...

Las neuronas en A1 codifican la decisión ...

Las neuronas en A1 codifican el tiempo de decisión y el costo. UNA. Izquierda: Actividad promediada en el tiempo…

La atención auditiva modula el ruido por pares ...

La atención auditiva modula las correlaciones de ruido por pares en A1 L2 / 3. UNA. CDF de media ...

Estructura de subred de causalidad de Granger (GC)…

La estructura de subred de causalidad de Granger (GC) fue modulada por el desempeño de la tarea. UNA. Análisis de GC ...

La detección de tonos controla las subredes de GC ...

La detección de tonos convierte las subredes de GC en grupos pequeños y localizados de 4 a 5 neuronas ...

Las subredes de GC tienen codificación mejorada…

Las subredes de GC tienen una codificación mejorada de la elección de comportamiento. UNA. Precisión de predicción (PA) de…


Vladimir Braverman
Departamento: Ciencias de la Computación | Centros: IDIES, MENTES
Intereses de investigación: Reducción de dimensionalidad, algoritmos sublineales, agrupamiento, álgebra lineal aleatoria
Aplicaciones: Cosmología, Redes programables

Kevin Duh
Departamento: Centro de Excelencia en Tecnología del Lenguaje Humano | Centros: HLTCOE, CLSP
Intereses de investigación: Redes neuronales, predicción estructurada, aprendizaje semi-supervisado, optimización multiobjetivo
Aplicaciones: Lenguaje natural, habla

Abhinav K. Jha
Dpto: Radiología y Ciencias Radiológicas
Intereses de investigación: Procesamiento estadístico de señales, agrupamiento no supervisado, métodos de evaluación sin estándar de oro
Aplicaciones: Salud

Jim Liew
Departamento: Finanzas (Carey Business School) | Centros: IDIES
Intereses de investigación: Aprendizaje automático, Bosque aleatorio, Impulso, Predicción de series temporales, Lenguaje natural
Aplicaciones: Finanzas, Salud


Introducción

Al igual que con muchos animales, la visión juega un papel clave en una serie de comportamientos realizados por la mosca de la fruta. Drosophila melanogaster, incluido el reconocimiento de compañero [1], la posición de referencia [2], el control visual del rumbo [3], la evitación de colisiones [4], el aterrizaje [4] y el escape de un objeto que se avecina (como un periódico enrollado, por ejemplo) [5] . El beneficio de estudiar estos comportamientos guiados visualmente en Drosophila es la gama de técnicas neurogenéticas que brindan una posibilidad realista de comprender los circuitos neuronales que las sustentan. Con ese objetivo en mente, nos centramos en el trabajo de Seelig y Jayaraman [6] que mapearon los campos receptivos (RF) de un conjunto de neuronas visualmente sensibles: las neuronas anulares del cuerpo elipsoide. Estas neuronas son necesarias y suficientes para una variedad de comportamientos complejos, incluida la memoria espacial a corto plazo, la discriminación de patrones y la memoria de lugar [2, 7-9], y sin embargo son sorprendentemente pequeñas en número. Para comprender su papel en estos comportamientos, utilizamos modelos para cerrar la brecha entre los datos neurogenéticos y el comportamiento mediante la evaluación de las respuestas de las neuronas en anillo durante las simulaciones de experimentos con moscas. De esta manera investigamos cómo pequeñas poblaciones de neuronas visuales en Drosophila, que podría representar un cuello de botella sensorial, aún puede proporcionar información relevante para el comportamiento.

En ensayos de laboratorio, las moscas muestran comportamientos visuales espontáneos interesantes. Por ejemplo, las moscas se orientan hacia los estímulos de las barras [10, 11] y en una arena circular con dos barras diametralmente opuestas caminarán entre ellas hasta el agotamiento [12]. La atracción por las barras verticales disminuye a medida que la barra se acorta y las moscas son fuertemente repelidas por pequeñas manchas [13]. Además, varios estudios han investigado el proceso de reconocimiento de patrones y sus fundamentos neurales [7, 14, 15]. Las moscas parecen poseer una forma de memoria de patrones análoga a la memoria de patrones mejor estudiada de las abejas [16-18]. Curiosamente, tanto las abejas [19] como las moscas [14] fallan sistemáticamente en discriminar ciertos pares de patrones.

Estos comportamientos visuales requieren el complejo central, un neurópilo principal que comprende el cuerpo elipsoide, el cuerpo en forma de abanico, los nódulos emparejados y el puente protocerebral [20]. Se cree que el complejo central está involucrado principalmente en la representación espacial, la selección de acciones y la mediación entre la entrada visual y la salida motora [21]. Una clase de neuronas con proyecciones en el cuerpo elipsoide son las 'neuronas de anillo', que se sabe que están involucradas en ciertos comportamientos visuales (R1: place homing [2, 22, 23] R2 / R4m: reconocimiento de patrones [7, 14, 15] R3 / R4: memoria de dirección de barra [8]). Aquí investigamos cómo las neuronas del anillo podrían contribuir al comportamiento, simulando la entrada visual tal como sería procesada por esta pequeña población de células visualmente sensibles. En particular, podemos abordar por qué las moscas no pueden discriminar ciertos pares de patrones, si estas subpoblaciones de neuronas están optimizadas para el reconocimiento de patrones y, de no ser así, para qué comportamientos guiados visualmente se adaptan estas células.

Para hacer esto, aprovechamos la investigación que ha descrito las propiedades de RF de dos clases de neuronas en anillo en el Drosophila cuerpo elipsoide [6]. Los dos subtipos de neuronas investigados fueron las neuronas del anillo R2 y R4d, de las cuales solo 28 y 14, respectivamente, respondieron a los estímulos visuales. Se encontró que las células poseían RF grandes, centrados en la porción ipsilateral del campo visual y con formas similares a las de las células simples de mamíferos [24] (para obtener detalles sobre cómo se estimaron los RF, consulte Materiales y métodos). Al igual que las células simples, muchas de estas neuronas mostraron un fuerte ajuste de orientación y algunas eran sensibles a la dirección del movimiento de los estímulos. Sin embargo, las RF de las neuronas en anillo son mucho más burdas que las de las células simples, mucho más grandes y menos uniformemente distribuidas a través del campo visual y responden principalmente a orientaciones cercanas a la vertical. Esto sugiere que las neuronas en anillo podrían tener una función menos general que las células simples [25]. En los mamíferos, la gran población de células simples significa que se detectan límites pequeños de alto contraste de cualquier orientación en todos los puntos del campo visual. Por lo tanto, la codificación proporcionada por las células simples conserva la información visual y actúa como una red de percepción de "propósito general" que puede alimentar una gran cantidad de comportamientos. Por el contrario, la tosquedad de las RF de las neuronas en anillo, unida a la estrecha relación entre comportamientos específicos y subpoblaciones específicas de neuronas en anillo, sugiere en cambio que estas células están proporcionando información visual económica que probablemente esté ajustada para comportamientos específicos [25].

Para investigar estos problemas, utilizamos un enfoque sintético mediante el cual las investigaciones, en simulación, de la información proporcionada por estas poblaciones de neuronas pueden relacionarse con los requisitos del comportamiento, "cerrando el ciclo" entre el cerebro y el comportamiento. Mostramos cómo el código de población se adapta bien a los comportamientos espontáneos de orientación de barras que muestran las moscas. De manera similar, verificamos que nuestra población de neuronas en anillo simuladas es capaz de explicar el éxito y el fracaso de la mosca para discriminar pares de patrones. Tras un análisis más profundo, demostramos que ciertos parámetros de forma (orientación, tamaño y posición) están implícitos en las salidas de las neuronas del anillo con una alta precisión, proporcionando así la información necesaria para un conjunto de comportamientos básicos de moscas. Esto contrasta con la capacidad bastante limitada de las poblaciones de neuronas en anillo (y moscas) para discriminar entre formas abstractas, lo que arroja dudas sobre las explicaciones cognitivas del comportamiento de las moscas en los ensayos de discriminación de patrones.


Referencias

Bianconi, E. et al. Una estimación del número de células del cuerpo humano. Ana. Tararear. Biol. 40, 463–471 (2013).

Cano-Gamez, E. & amp Trynka, G. De GWAS a funcionar: usando genómica funcional para identificar los mecanismos subyacentes a enfermedades complejas. Front Genet. 11, 424 (2020).

McKinnon, K. M. Citometría de flujo: una descripción general. Curr. Protocolos. Immunol. 120, 5 1 1–5 1 11 (2018).

Papalexi, E. & amp Satija, R. Secuenciación de ARN unicelular para explorar la heterogeneidad de las células inmunes. Nat. Rev. Immunol. 18, 35–45 (2018).

Kolodziejczyk, A. A., Kim, J. K., Svensson, V., Marioni, J. C. & amp Teichmann, S. A. La tecnología y biología de la secuenciación de ARN unicelular. Mol. Celda 58, 610–620 (2015).

Luecken, M. D. & amp Theis, F. J. Mejores prácticas actuales en el análisis de secuencia de ARN de una sola célula: un tutorial. Mol. Syst. Biol. 15, e8746 (2019).

Hwang, B., Lee, J. H. & amp Bang, D. Tecnologías de secuenciación de ARN unicelular y tuberías bioinformáticas. Exp. Mol. Medicina. 50, 96 (2018).

Ding, J. y col. Comparación sistemática de métodos de secuenciación de ARN de un solo núcleo y de un solo núcleo. Nat. Biotechnol. 38, 737–746 (2020).

Mereu, E. et al. Evaluación comparativa de protocolos de secuenciación de ARN unicelular para proyectos de atlas de células. Nat. Biotechnol. 38, 747–755 (2020).

Kachroo, A. H. et al. La humanización sistemática de genes de levadura revela funciones conservadas y modularidad genética. Ciencias 348, 921–925 (2015).

Sahni, N. et al. Perturbaciones generalizadas de interacción macromolecular en trastornos genéticos humanos. Celda 161, 647–660 (2015).

Barabasi, A. L. & amp Oltvai, Z. N. Biología de redes: comprensión de la organización funcional de la célula. Nat. Rev. Genet. 5, 101–113 (2004).

Emmert-Streib, F., Dehmer, M. & amp Haibe-Kains, B. Redes reguladoras de genes y sus aplicaciones: comprensión de los problemas biológicos y médicos en términos de redes. Desarrollo de celda frontal Biol. 2, 38 (2014).

Chang, W. y col. Identificación de nuevos genes hub asociados con la metástasis hepática del cáncer gástrico. Int J. Cancer 125, 2844–2853 (2009).

Vlaic, S. et al. ModuleDiscoverer: identificación de módulos reguladores en redes de interacción proteína-proteína. Sci. Reps. 8, 433 (2018).

Farahbod, M. & amp Pavlidis, P. Desenredar los efectos de la composición celular en el análisis de coexpresión. Res del genoma. 30, 849–859 (2020).

Zhang, Y., Cuerdo, J., Halushka, M. K. & amp McCall, M. N. El efecto de la composición tisular en la coexpresión génica. Breve bioinformática. bbz135 (2019).

Lee, W. P. & amp Tzou, W. S. Métodos computacionales para descubrir redes de genes a partir de datos de expresión. Breve. Bioinformar 10, 408–423 (2009).

Delgado, F. M. & amp Gomez-Vela, F. Métodos computacionales para la reconstrucción y análisis de redes reguladoras de genes: una revisión. Artif. Intell. Medicina 95, 133–145 (2019).

Marbach, D. et al. Sabiduría de las multitudes para una inferencia robusta de redes de genes. Nat. Métodos 9, 796–804 (2012).

Ocone, A., Haghverdi, L., Mueller, N. S. & amp Theis, F. J. Reconstrucción de la dinámica reguladora de genes a partir de datos instantáneos unicelulares de alta dimensión. Bioinformática 31, i89 – i96 (2015).

Papili Gao, N., Ud-Dean, S. M. M., Gandrillon, O. & amp Gunawan, R. SINCERIDADES: inferir redes reguladoras de genes a partir de perfiles de expresión transcripcional de células individuales con marca de tiempo. Bioinformática 34, 258–266 (2018).

Specht, A. T. & amp Li, J. LEAP: construcción de redes de coexpresión de genes para datos de secuenciación de ARN de una sola célula utilizando el orden de pseudotiempo. Bioinformática 33, 764–766 (2017).

Hamey, F. K. y col. Reconstrucción de modelos de redes reguladoras de células madre sanguíneas a partir de perfiles moleculares unicelulares. Proc. Natl Acad. Sci. Estados Unidos 114, 5822–5829 (2017).

Pratapa, A., Jalihal, A. P., Law, J. N., Bharadwaj, A. & amp Murali, T. M. Algoritmos de evaluación comparativa para la inferencia de redes reguladoras de genes a partir de datos transcriptómicos de una sola célula. Nat. Métodos 17, 147–154 (2020).

Skinnider, M. A., Squair, J. W. & amp Foster, L. J. Evaluación de medidas de asociación para transcriptómica unicelular. Nat. Métodos 16, 381–386 (2019).

Chen, S. & amp Mar, J. C. La evaluación de métodos para inferir redes reguladoras de genes destaca su falta de rendimiento para los datos de expresión génica de una sola célula. BMC Bioinforma. 19, 232 (2018).

Fiers, M. y col. Mapeo de redes reguladoras de genes a partir de datos ómicos unicelulares. Breve. Funct. Genómica 17, 246–254 (2018).

Blencowe, M. et al. Modelado de red de datos ómicos unicelulares: desafíos, oportunidades y avances. Emerg. Cima. Life Sci. 3, 379–398 (2019).

Akutsu, T., Miyano, S. & amp Kuhara, S. Identificación de redes genéticas a partir de un pequeño número de patrones de expresión génica bajo el modelo de red booleana. Pac Symp Biocomput. 17–28. (1999).

Lahdesmaki, H., Shmulevich, I. & amp Yli-Harja, O. Sobre el aprendizaje de redes reguladoras de genes bajo el modelo de red booleana. Mach. Aprender 52, 147–167 (2003).

Saadatpour, A. & amp Albert, R. Modelado booleano de redes reguladoras biológicas: un tutorial de metodología. Métodos 62, 3–12 (2013).

Lim, C. Y. et al. BTR: entrenamiento de modelos booleanos asincrónicos utilizando datos de expresión de una sola celda. Bmc Bioinforma. 17, 355 (2016).

Moignard, V. et al. Decodificación de la red reguladora del desarrollo sanguíneo temprano a partir de mediciones de expresión génica unicelular. Nat. Biotechnol. 33, 269–276 (2015).

Chen, H. y col. Análisis transcripcional de una sola célula para descubrir circuitos reguladores que impulsan las decisiones sobre el destino de las células en el desarrollo temprano del ratón. Bioinformática 31, 1060–1066 (2015).

Bahadorinejad, A., Imani, M. & amp Braga-Neto, U. Filtrado de partículas adaptativo para la detección de fallas en sistemas dinámicos booleanos parcialmente observados. IEEE / ACM Trans Comput Biol Bioinform. 17, 1105–1114 (2018).

Chai, L. E. y col. Una revisión de los enfoques computacionales para la construcción de redes reguladoras de genes. Comput Biol. Medicina. 48, 55–65 (2014).

Matsumoto, H. et al. SCODE: un algoritmo de inferencia de red reguladora eficiente a partir de RNA-Seq de una sola célula durante la diferenciación. Bioinformática 33, 2314–2321 (2017).

Gardner, T. S., di Bernardo, D., Lorenz, D. y Collins, J. J.Inferir redes genéticas e identificar el modo de acción compuesto a través del perfil de expresión. Ciencias 301, 102–105 (2003).

Polynikis, A., Hogan, S. J. & amp di Bernardo, M. Comparación de diferentes enfoques de modelado de ODE para redes reguladoras de genes. J. Theor. Biol. 261, 511–530 (2009).

Huynh-Thu, V. A., Irrthum, A., Wehenkel, L. & amp Geurts, P. Inferir redes reguladoras a partir de datos de expresión utilizando métodos basados ​​en árboles. Más uno 5, e12776 (2010).

Aibar, S. et al. ESCÉNICO: inferencia y agrupación de redes reguladoras unicelulares. Nat. Métodos 14, 1083–1086 (2017).

Moerman, T. et al. GRNBoost2 y Arboreto: inferencia eficiente y escalable de redes reguladoras de genes. Bioinformática 35, 2159–2161 (2019).

Stuart, J. M., Segal, E., Koller, D. & amp Kim, S. K. Una red de coexpresión de genes para el descubrimiento global de módulos genéticos conservados. Ciencias 302, 249–255 (2003).

Crow, M., Paul, A., Ballouz, S., Huang, Z. J. & amp Gillis, J. Explotación de la expresión de una sola célula para caracterizar la replicabilidad de la coexpresión. Genome Biol. 17, 101 (2016).

Song, L., Langfelder, P. & amp Horvath, S. Comparación de medidas de coexpresión: información mutua, correlación e índices basados ​​en modelos. BMC Bioinforma. 13, 328 (2012).

Chan, T. E., Stumpf, M. P. H. & amp Babtie, A. C. Inferencia de la red reguladora de genes a partir de datos de una sola célula utilizando medidas de información multivariante. Cell Syst. 5, 251–267 e253 (2017).

Quinn, T. P., Richardson, M. F., Lovell, D. y Crowley, T. M. propr: un paquete R para identificar características proporcionalmente abundantes mediante el análisis de datos de composición. Sci. Reps. 7, 16252 (2017).

Iacono, G., Massoni-Badosa, R. & amp Heyn, H. La transcriptómica unicelular revela la plasticidad de la red reguladora de genes. Genome Biol. 20, 110 (2019).

Szklarczyk, D. et al. STRING v10: redes de interacción proteína-proteína, integradas sobre el árbol de la vida. Ácidos nucleicos Res. 43, D447-D452 (2015).

Hwang, S. y col. HumanNet v2: redes de genes humanos para la investigación de enfermedades. Ácidos nucleicos Res. 47, D573 – D580 (2019).

Huang, J. K. y col. Evaluación sistemática de redes moleculares para el descubrimiento de genes de enfermedades. Cell Syst. 6, 484–495 e485 (2018).

Yuan, X. y col. Biomarcadores de red construidos a partir de la expresión génica y los datos de interacción proteína-proteína para una predicción precisa de la leucemia. J. Cáncer 8, 278–286 (2017).

Liu, X., Wang, Y., Ji, H., Aihara, K. & amp Chen, L. Caracterización personalizada de enfermedades utilizando redes de muestras específicas. Res de ácidos nucleicos 44, e164 (2016).

Guo, W. F. y col. Descubrimiento de perfiles de mutación de controladores personalizados de muestras individuales en cáncer mediante la estrategia de control de red. Bioinformática 34, 1893–1903 (2018).

Mohammadi, S., Davila-Velderrain, J. & amp Kellis, M. Reconstrucción de interactomas específicos de tipo celular en resolución unicelular. Cell Syst. 9, 559–568 e554 (2019).

Shim, J. E., Lee, T. & amp Lee, I. De la secuenciación de datos a funciones genéticas: enfoques de redes co-funcionales. Anim. Cells Syst. 21, 77–83 (2017).

Langfelder, P. & amp Horvath, S. WGCNA: un paquete R para el análisis de redes de correlación ponderada. BMC Bioinforma. 9, 559 (2008).

Xue, Z. et al. Programas genéticos en embriones tempranos humanos y de ratón revelados por secuenciación de ARN unicelular. Naturaleza 500, 593–597 (2013).

Luo, Y. et al. Los análisis de transcriptomas unicelulares revelan señales para activar las células madre neuronales inactivas. Celda 161, 1175–1186 (2015).

Wu, H. y col. Los análisis de transcriptomas unicelulares revelan señales moleculares de la resistencia al paclitaxel intrínseca y adquirida en las células cancerosas escamosas de esófago. Cáncer Lett. 420, 156–167 (2018).

Chen, X., Hu, L., Wang, Y., Sun, W. & amp Yang, C.La red de coexpresión de genes unicelulares revela la firma FECH / CROT como marcador de pronóstico. Células 8, 698 (2019).

Wouters, J. y col. El análisis de la red reguladora de genes unicelulares revela nuevos estados de células de melanoma y trayectorias de transición durante el cambio de fenotipo. bioRxiv 715995 (2019)

Sahni, N. et al. Edgotype: un vínculo fundamental entre genotipo y fenotipo. Curr. Opin. Genet Dev. 23, 649–657 (2013).

Pina, C. et al. El análisis de redes unicelulares identifica al DDIT3 como un regulador del linaje nodal en la hematopoyesis. Rep. Celular 11, 1503–1510 (2015).

Pang, K. y col. El análisis de enriquecimiento de coexpresión a nivel de una sola célula revela defectos convergentes en las células progenitoras neurales y sus transiciones de tipo celular en los trastornos del neurodesarrollo. Genome Res. 30, 835–548 (2020).

Schork, N. J. Medicina personalizada: tiempo para ensayos con una sola persona. Naturaleza 520, 609–611 (2015).

Nica, A. C. & amp Dermitzakis, E. T. Loci de rasgos cuantitativos de expresión: presente y futuro. Philos. Trans. R. Soc. Lond. B Biol. Sci. 368, 20120362 (2013).

Altshuler, D., Daly, M. J. & amp Lander, E. S. Mapeo genético en enfermedades humanas. Ciencias 322, 881–888 (2008).

Brown, C. D., Mangravite, L. M. & amp Engelhardt, B. E. El modelado integrador de los eQTL y los elementos reguladores en cis sugiere mecanismos que subyacen a la especificidad del tipo celular de los eQTL. PLoS Genet. 9, e1003649 (2013).

Fairfax, B. P. et al. La genética de la expresión génica en las células inmunitarias primarias identifica los reguladores maestros específicos del tipo celular y las funciones de los alelos HLA. Nat. Gineta. 44, 502–510 (2012).

Kang, H. M. y col. Secuenciación de ARN unicelular de gotitas multiplexadas utilizando variación genética natural. Nat. Biotechnol. 36, 89–94 (2018).

van der Wijst, M. y col. El consorcio monocelular eQTLGen. Elife 9, e52155 (2020).

Sarkar, A. K. y col. Descubrimiento y caracterización de la varianza de QTL en células madre pluripotentes inducidas por humanos. PLoS Genet. 15, e1008045 (2019).

Cuomo, A. S. E. et al. La secuenciación de ARN unicelular de células iPS diferenciadoras revela efectos genéticos dinámicos sobre la expresión génica. Nat. Comun. 11, 810 (2020).

Zhernakova, D. V. et al. Identificación de loci de rasgos cuantitativos de expresión dependiente del contexto en sangre completa. Nat. Gineta. 49, 139–145 (2017).

van der Wijst, M. G. P. y col. La secuenciación de ARN de una sola célula identifica los QTL cis-eQTL específicos del tipo celular y los QTL de coexpresión. Nat. Gineta. 50, 493–497 (2018).

van der Wijst, M. G. P., de Vries, D. H., Brugge, H., Westra, H. J. & amp Franke, L. Un enfoque integrador para la construcción de redes reguladoras genéticas personalizadas para la medicina de precisión. Genome Med. 10, 96 (2018).

Andrews, T. S. & amp Hemberg, M. Señales falsas inducidas por imputación unicelular. F1000Res. 7, 1740 (2018).

Stuart, T. & amp Satija, R. Análisis integrativo unicelular. Nat. Rev. Genet. 20, 257–272 (2019).

Jung, G. T., Kim, K. P. & amp Kim, K. Cómo interpretar e integrar datos multiómicos a nivel de sistemas. Anim. Cells Syst. 24, 1–7 (2020).


Una breve revisión del aprendizaje y control basados ​​en redes neuronales y sus aplicaciones para robots

Como imitación de los sistemas nerviosos biológicos, las redes neuronales (NN), que se han caracterizado como poderosas herramientas de aprendizaje, se emplean en una amplia gama de aplicaciones, como el control de sistemas complejos no lineales, la optimización, la identificación de sistemas y el reconocimiento de patrones. Este artículo tiene como objetivo traer una breve revisión de las NN de última generación para los sistemas no lineales complejos al resumir el progreso reciente de las NN tanto en teoría como en aplicaciones prácticas. Específicamente, esta encuesta también revisa una serie de algoritmos de control de robots basados ​​en NN, incluido el control de manipulador basado en NN, la interacción humano-robot basada en NN y el control cognitivo basado en NN.

1. Introducción

En los últimos años, la investigación de las redes neuronales (NN) ha atraído una gran atención. Es bien sabido que el cerebro de los mamíferos, que consta de miles de millones de neuronas interconectadas, tiene la capacidad de lidiar con tareas complejas y exigentes desde el punto de vista informático, como el reconocimiento facial, la planificación del movimiento corporal y el control de las actividades de los músculos. La figura 1 muestra una estructura celular de una neurona de mamífero. Inspirado por la estructura de la neurona, NN artificial (ANN) fue desarrollado para emular la capacidad de aprendizaje del sistema de neuronas biológicas [1-3]. El concepto de NN artificiales fue investigado inicialmente por McCulloch y Pitts en la década de 1940 [3], donde la red se establece con una estructura paralela. El modelo básicamente matemático de NN consta de tres capas, es decir, capa de entrada, capa oculta y capa de salida, que son de estructura computacional paralela simple pero con una atractiva capacidad de aprendizaje y poder computacional para predecir patrones dinámicos no lineales.

En las últimas décadas, la técnica NN se ha estudiado ampliamente en áreas como la ingeniería de control, aeroespacial, medicina, automoción, psicología, economía, ciencias de la energía y muchos otros campos [4-7]. Se ha informado que NN puede aproximarse a cualquier función no lineal continua desconocida superponiendo las salidas de cada neurona. Además, los errores de aproximación podrían hacerse arbitrariamente pequeños eligiendo suficientes neuronas. Esto nos permite lidiar con problemas de control para sistemas no lineales complejos [8-13]. Además del modelado y control de sistemas, NN también se ha aplicado con éxito en varios campos como el aprendizaje [14-17], el reconocimiento de patrones [18] y el procesamiento de señales [19]. Y NN se ha utilizado ampliamente para la aproximación de funciones, como para compensar el efecto de la dinámica desconocida en sistemas no lineales [20-31]. Se ha demostrado que el control NN es eficaz para controlar sistemas no lineales inciertos y ha demostrado superioridad en muchos aspectos.

Recientemente, los investigadores se han centrado en el estudio de la robótica por su creciente importancia tanto en las aplicaciones industriales como en la vida diaria [33-38]. Muchos robots avanzados como YuMi fabricado por ABB, Baxter fabricado por Rethink y Justin de Rolins desarrollado por la Agencia Aeroespacial Alemana (DLR) también han sido ampliamente asignados. El sistema manipulador de robots se caracteriza por una alta no linealidad, un fuerte acoplamiento y una dinámica variable en el tiempo, por lo que controlar un robot no solo con precisión de posicionamiento, sino también con la flexibilidad suficiente para completar una tarea compleja se convirtió en un trabajo interesante pero desafiante. Para lograr un control de alto rendimiento, la dinámica del robot debe conocerse de antemano. Sin embargo, en la práctica, el modelo dinámico del robot rara vez se conoce debido al complejo mecanismo del robot, y mucho menos a las diversas incertidumbres, como las incertidumbres paramétricas o los errores de modelado que existen en la dinámica del robot. Por lo tanto, el algoritmo de control avanzado es imperativo para los robots de próxima generación. Gracias a la aproximación universal y la capacidad de aprendizaje, el NN se ha aplicado ampliamente en el control de robots con diversas aplicaciones. La combinación de NN y controlador de robot puede proporcionar posibles soluciones para tareas de manipulación complejas, por ejemplo, control de robot con dinámica desconocida y control de robot con entorno no estructurado. En este artículo presentamos una breve revisión del control de robots mediante redes neuronales. El resto del artículo está organizado de la siguiente manera.

Después de la introducción, en la Sección 2, presentamos los preliminares de varias estructuras de redes neuronales populares, como RBFNN y CMAC NN. La Sección 3 presenta una serie de desarrollos teóricos de NN en los campos del control adaptativo, la optimización y la computación evolutiva. Además, la Sección 4 revisa el control de la red neuronal del robot con las aplicaciones de manipulación, interacción humano-robot y control cognitivo del robot. La sección 5 ofrece una breve discusión sobre el control de la red neuronal y su investigación futura.

2. Preliminares de las redes neuronales

En esta sección, presentaremos varios tipos de estructura NN, que se emplean popularmente en la ingeniería de control.

2.1. Red neuronal de función de base radial (RBFNN) [14, 15]

En la Figura 2 se muestra una arquitectura básica de la red RBFNN, que consta de tres capas, a saber, capa de entrada, capa oculta y capa de salida. En la capa de entrada, se aplican las entradas NN. En la capa oculta, los datos se transforman de espacio de entrada a espacio oculto, que siempre tiene una dimensión superior. El RBFNN se puede utilizar para aproximar cualquier función vectorial continua, por ejemplo,

donde es la estimación de y es NN vector de entradas.

es la estimación del peso óptimo NN,

denota el número de NN nodos. Generalmente, el regresor podría elegirse como una función de base radical de Gauss de la siguiente manera:

son puntos distintos en el espacio de estados y es el ancho de la función de pertenencia gaussiana. Se ha reconocido que, utilizando la poderosa capacidad aproximada del RBFNN, podemos aproximar cualquier función no lineal continua en un conjunto compacto como

donde es el vector de peso óptimo y es el error aproximado.

2.2. Controlador de articulación modelo cerebeloso (CMAC) NN [39]

Ha habido una tendencia predominante a estudiar las técnicas de aprendizaje y control de los robots explorando los principios de los sistemas biológicos. Esto se debe a que es probable que las criaturas biológicas, los mecanismos y los principios subyacentes aporten ideas novedosas para mejorar el rendimiento del control del robot en un entorno complejo. En 1972, Albus propuso un mecanismo de aprendizaje que imita la estructura y función del cerebelo, llamado controlador de articulación modelo cerebeloso (CMAC), que está diseñado sobre la base de un modelo neurofisiológico del cerebelo [40]. En comparación con la red neuronal de retropropagación, el CMAC NN se adoptó ampliamente en el modelado y control de sistemas de robots por su rápida velocidad de aprendizaje, estructura simple, insensibilidad de la secuencia de datos y fácil implementación [39, 41].

La Figura 3 muestra la estructura básica de la red neuronal CMAC. El CMAC podría usarse para aproximar la función continua desconocida,

espacio de entradas dimensionales. Como se muestra en la Figura 3, dos componentes están involucrados en la red neuronal CMAC para determinar el valor de la función no lineal aproximada:

dónde está metro-espacio de entrada dimensional F es norte-espacio de salida dimensional C es

-espacio de asociación dimensional

denota el mapeo del vector de entrada al espacio de asociación, es decir,

. Las salidas se calculan mediante el uso de una proyección del vector de asociación α en un vector de pesos, tal que

Cabe señalar que puede representarse mediante una función de campo receptiva multidimensional de modo que a cada punto de entrada se le asigne un valor de activación. Las funciones de base del campo receptivo del vector de asociación podrían elegirse como funciones gaussianas de la siguiente manera:

dónde l es el número de bloques del espacio asociado, denota el kEl bloque asociado con la entrada, denota el centro del campo receptivo y es la varianza de la función gaussiana. Entonces, la función multidimensional del campo receptivo se puede describir como

, , y . La siguiente propiedad muestra la capacidad de aproximación proporcionada por la red neuronal CMAC.

Lema 1. Para una función no lineal continua, existe un valor de peso ideal, tal que podría ser aproximado uniformemente por un CMAC con la multiplicación de los pesos óptimos y el vector asociado como

donde están los errores de construcción NN y satisfecho

y es un pequeño valor positivo acotado.

3. Desarrollos teóricos

3.1. Control neuronal adaptativo

Durante las últimas dos décadas, se han incorporado varias redes neuronales al control adaptativo para sistemas no lineales con dinámicas desconocidas. En [42], se construyó un controlador de red neuronal multijugador en tiempo discreto para una clase de sistemas dinámicos de múltiples entradas y múltiples salidas (MIMO), donde se entrenaron pesos NN utilizando un algoritmo de ajuste en línea mejorado. Se propuso un control de retroalimentación de salida NN adaptativo para controlar dos clases de sistemas de tiempo discreto en presencia de direcciones de control desconocidas [4]. Se desarrolló un controlador neuronal adaptativo robusto para una clase de sistemas de retroalimentación estricta en [43], donde se empleó una técnica de ganancia de Nussbaum para tratar con coeficientes de control virtual desconocidos. Se empleó un NN dinámico recurrente para la construcción de un observador adaptativo con parámetros de pesos convertidos en línea en [44] y para tratar el retardo de tiempo de una clase de sistemas dinámicos no lineales en [45]. El retardo de tiempo de los sistemas no lineales de retroalimentación estricta también se abordó mediante el uso de control NN con funciones de Lyapunov-Krasovskii diseñadas correctamente en [46]. Para una clase de sistemas de retardo de tiempo afines no lineales desconocidos, se propuso un esquema de control adaptativo mediante la construcción de dos NN de orden superior para identificar las incertidumbres del sistema [47]. Esta idea se ha extendido aún más a sistemas no lineales afines con retardo de tiempo de entrada en [48].

Cabe señalar que las funciones continuas por partes, como las fricciones, el juego y la zona muerta, existen ampliamente en las plantas industriales. Aparte de la función no lineal continua, la aproximación de estas funciones por partes es más desafiante ya que la aproximación universal de NN solo es válida para funciones continuas. Para aproximar estas funciones continuas por partes, se diseñó una estructura NN novedosa mediante la participación de una función de activación estándar y una función de base de aproximación de salto [49]. En [47], se empleó un CMAC NN para el control de circuito cerrado de sistemas dinámicos no lineales con análisis de estabilidad riguroso, y en [50] se desarrolló un esquema de control de red neuronal adaptable robusto para el control de seguimiento cooperativo de sistemas no lineales de orden superior.

El esquema de control NN adaptativo también se propuso para sistemas de retroalimentación pura. En [51], se propuso un observador de modo deslizante de orden superior para estimar los estados desconocidos del sistema, mientras que se construyeron dos NN para tratar los errores de aproximación y las no linealidades desconocidas, respectivamente. En comparación con el diseño de control convencional para sistemas de retroalimentación pura, el control de retroalimentación de estado se logró sin utilizar la técnica de retroceso. En [52], se propuso un marco de control neuronal para el servo mecanismo no lineal para garantizar el rendimiento de seguimiento tanto en estado estable como transitorio. En este trabajo, se empleó una función de rendimiento prescrita en una transformación de error de salida, de modo que el rendimiento de seguimiento puede garantizarse mediante el control de regulación de las salidas. En [53], también se diseñó un control neuronal adaptativo para una clase de sistemas no lineales en presencia de retardos de tiempo y zona muerta de entrada, y se emplearon redes neuronales de alto orden para hacer frente a las incertidumbres desconocidas. En este trabajo, una característica destacada radica en el hecho de que solo la norma de los pesos de las NN (un escalar) necesita actualizarse en línea, de modo que la eficiencia computacional en la implementación en línea podría mejorarse significativamente. En [54], los autores desarrollaron un control de retroalimentación basado en redes neuronales para compensar las no linealidades e incertidumbres de un sistema subestructurado dinámicamente que consta de subestructuras numéricas y físicas, donde se desarrolló una ley adaptativa con un nuevo término de fuga de información de error de ponderaciones NN. para lograr una mejor convergencia. Un experimento en una plataforma de pruebas de cuasi motocicleta validó la eficacia de esta estrategia de control. En [55], se incorporó un control dinámico neuronal en el control de retroalimentación estricta de una clase de sistemas no lineales desconocidos mediante el uso de la técnica de control dinámico de superficie.Para una clase de sistemas no lineales inciertos con histéresis desconocida, se utilizó NN para la compensación de las no linealidades [56]. En [57], para tratar con saturaciones de entrada no simétricas desconocidas de sistemas no afines desconocidos, se utilizaron NN en el control de retroalimentación de estado / salida basado en el teorema del valor medio y la función implícita. Para evitar el uso de la síntesis de retroceso, se diseñó un esquema de control de superficie dinámico combinando el NN con un observador de perturbación no lineal [58].

3.2. Programación dinámica adaptativa basada en NN

Además del control adaptativo, también se han adoptado redes neuronales para resolver el problema de optimización de los sistemas no lineales. En el control óptimo de la convención, el método de programación dinámica se utilizó ampliamente. Su objetivo es minimizar una función de costo predefinida, de modo que se pueda derivar una secuencia de entradas de control óptimas. Sin embargo, la función de costo suele ser difícil de calcular en línea debido a la complejidad del cálculo para obtener la solución de la ecuación de Hamilton-Jacobi-Bellman (HJB). Por lo tanto, se desarrolló una técnica de programación dinámica aproximada / adaptativa (ADP) en [59], donde se entrenó a un NN para estimar la función de costo y luego derivar soluciones para el ADP. Generalmente, el ADP tiene varios sinónimos diferentes, incluida la programación dinámica aproximada, la programación dinámica heurística (HDP), la red crítica y el aprendizaje por refuerzo (RL) [60-62]. La Figura 4 muestra el marco básico del HDP con una estructura crítico-actor. En [63], se resolvió una ecuación HJB de tiempo discreto utilizando un algoritmo HDP basado en NN para derivar el control óptimo de sistemas de tiempo discreto no lineales. En [64], se construyeron tres redes neuronales para un ADP iterativo, de modo que se pudiera realizar un control de retroalimentación óptimo de un sistema no lineal afín en tiempo discreto. En [65], se presentó una programación heurística dual globalizada para abordar el control óptimo de los sistemas de tiempo discreto. En cada iteración, se utilizaron tres redes neuronales para aprender la función de costo y los sistemas no lineales desconocidos. En [66], se introdujo una red de referencia combinada con una red de acción y una red crítica en la arquitectura de ADP para derivar una representación interna de objetivos, de modo que se pudiera facilitar el proceso de aprendizaje y optimización. La red de referencia también se ha introducido en la programación dinámica heurística dependiente de la acción en línea mediante el empleo de un marco de red de doble crítica. Se introdujo un algoritmo de iteración de políticas para un control óptimo de horizonte infinito de sistemas no lineales utilizando ADP en [67]. En [68], se introdujo un método de aprendizaje por refuerzo para el control estabilizador de sistemas no lineales inciertos en presencia de restricciones de entrada. Mediante el uso de este controlador basado en RL, se resolvió un problema de control óptimo restringido con la construcción de una sola red neuronal crítica. En [69], se investigó una técnica ADP para el control y el aprendizaje en línea de un sistema generalizado de múltiples entradas y múltiples salidas (MIMO). En [70], se presentó un esquema de control de ADP adaptativo basado en NN para una clase de sistemas no lineales con dinámicas desconocidas. La ley de control óptimo se calculó utilizando un esquema de red neuronal dual con un NN crítico y un NN identificador. En particular, se utilizó el error de estimación de parámetros para identificar en línea los pesos de aprendizaje para lograr la convergencia en tiempo finito. El control de seguimiento óptimo para una clase de sistemas no lineales se investigó en [71], donde se propuso un nuevo marco ADP basado en “identificador-crítico”.

3.3. Computación evolutiva

Además de la capacidad de aproximación y optimización de las NN, también ha habido un gran interés en utilizar los enfoques evolutivos para entrenar las redes neuronales. Con la evolución de las arquitecturas NN, las reglas de aprendizaje, los pesos de conexión y las características de entrada, se diseñó una red neuronal artificial evolutiva (EANN) para proporcionar un rendimiento superior en comparación con los enfoques de entrenamiento convencionales [72]. En [73] se realizó una revisión de la literatura de la EANN, donde se han introducido estrategias de evolución tales como NN artificial de alimentación anticipada y algoritmos genéticos (GA) para las EANN. En [72], se introdujeron varios marcos de EANN incorporando los algoritmos de evolución (EA) para desarrollar la estructura NN. En [74], se propuso un sistema de evolución EPNet para desarrollar el NN feedforward basado en el método de programación evolutiva (EP) de Fogel, que podría mejorar los pesos y arquitecturas de conexión del NN al mismo tiempo, así como disminuir el ruido en la evaluación de aptitud. En los experimentos se ha construido y verificado una buena capacidad de generalización del NN evolucionado. En [75], se ha empleado una técnica basada en GA para entrenar a los NN en sistemas de control neural directo de manera que las arquitecturas NN puedan optimizarse. Una deficiencia de la EANN es que el proceso de optimización a menudo da como resultado una velocidad de entrenamiento baja. Para superar este problema y facilitar los procesos de adaptación, se desarrolló un método evolutivo híbrido multiobjetivo en [76], donde se empleó la técnica de descomposición de valores singulares (SVD) para elegir el número de neuronas necesario en el entrenamiento de un NN feedforward. El enfoque evolutivo se aplicó para identificar un modelo de caja gris con una optimización multiobjetivo entre los sistemas prácticos claramente conocidos y los sistemas no lineales aproximados [77]. Las aplicaciones de algoritmos evolutivos para la navegación robótica se han introducido e investigado en [78]. En [79] se informó sobre una encuesta sobre la técnica de aprendizaje automático, donde se revisaron varios métodos para mejorar la computación evolutiva.

Los algoritmos de evolución se han empleado en muchos aspectos para la evolución de las NN, como para entrenar los pesos de conexión de las NN o para obtener arquitecturas NN casi óptimas, así como para adaptar las reglas de aprendizaje de las NN a su entorno. En una palabra, los algoritmos de evolución proporcionan a las NN la capacidad de aprender a aprender y también a construir la relación entre la evolución y el aprendizaje, de manera que la EANN podría realizar una capacidad favorable para adaptarse a los cambios del entorno dinámico.

4. Aplicaciones en robots

4.1. Control de manipulador robótico basado en NN

En términos generales, los métodos de control para manipuladores de robots se pueden dividir aproximadamente en dos grupos, control sin modelo y control basado en modelo. Para los enfoques de control sin modelo, como el control proporcional-integral-derivado (PID), es posible que no se garantice un rendimiento de control satisfactorio. Por el contrario, los enfoques de control basados ​​en modelos exhiben un mejor comportamiento de control, pero dependen en gran medida de la validez del modelo de robot. En la práctica, sin embargo, un modelo dinámico robótico perfecto no siempre está disponible debido a los complejos mecanismos e incertidumbres. Además, la carga útil puede variar de acuerdo con las diferentes tareas, lo que hace que sea difícil obtener el modelo de dinámica preciso por adelantado. Para resolver estos problemas, los métodos de control basados ​​en aproximaciones NN se han utilizado ampliamente en aplicaciones de control de manipuladores de robots. En la Figura 5 se muestra una estructura básica del control de la red neuronal adaptativa para el manipulador de robot. Considere un modelo dinámico de un manipulador de robot dado como sigue [80]:

donde, y son la matriz inercial, la matriz de Coriolis y el vector de gravedad, respectivamente. Entonces el diseño de control NN podría darse de la siguiente manera:

donde es el error de seguimiento, es el error de seguimiento de la velocidad, es el controlador NN siendo la matriz de pesos y el vector regresor NN, y son las ganancias de control especificadas por el diseñador.

De (10), podemos ver que el controlador del robot consta de un controlador tipo PD y un controlador NN. En los controladores tradicionales basados ​​en modelos, el modelo dinámico del robot podría considerarse como un avance para abordar el efecto causado por el movimiento del robot. En la práctica, sin embargo,, y pueden no conocerse. Por lo tanto, los NN se utilizan para aproximar la dinámica desconocida y mejorar el rendimiento del sistema a través de la estimación en línea. Para adaptar los pesos NN, las leyes de adaptación se diseñan de la siguiente manera:

donde y son parámetros positivos especificados. El último término del lado derecho de (11) es la modificación sigma, que se utiliza para mejorar la convergencia y la robustez de la adaptación de los parámetros.

En [80], se desarrolló un método de control de acciones basado en NN para controlar un robot teleoperado con incertidumbres ambientales. En este trabajo, el RBFNN se construyó para compensar la dinámica desconocida del robot teleoperado. En particular, se desarrolló una estrategia de control compartido en el controlador para lograr la evasión automática de obstáculos combinándola con la información de la cámara visual y el cuerpo del robot, de modo que el obstáculo pudiera evitarse con éxito y el operador pudiera concentrarse más en la tarea operada que en la Entorno para garantizar la estabilidad y manipulación. Además, se integraron transformaciones de error en el control NN adaptativo para garantizar el rendimiento del control transitorio. Se demostró que, mediante el uso de la técnica NN, se mejoró el rendimiento de control tanto en el nivel cinemático como en el nivel dinámico del robot teleoperado. En [81], se propuso una estrategia de control basada en una máquina de aprendizaje extremo (ELM) para manipuladores de robots inciertos para identificar tanto la elasticidad como la geometría de un objeto. Este ELM se aplicó para hacer frente a la no linealidad desconocida del manipulador del robot para mejorar el rendimiento del control. En particular, al utilizar ELM, el controlador propuesto podría garantizar que la dinámica del robot siga un modelo de referencia, de modo que el punto de ajuste deseado y la fuerza de avance podrían actualizarse para estimar la geometría y la rigidez del objeto. Como resultado, el modelo de referencia podría coincidir exactamente con un número limitado de iteraciones.

En [82], el controlador NN también se empleó para controlar un péndulo invertido de rueda, que se ha descompuesto en dos subsistemas, un subsistema móvil plano de segundo orden totalmente accionado y un subsistema de péndulo pasivo de primer orden. Luego, se empleó el RBFNN para compensar la dinámica incierta de los dos subsistemas mediante el uso de su poderosa capacidad de aprendizaje, de modo que el rendimiento de control mejorado podría realizarse mediante el aprendizaje de NN. En [83], se propuso un control neuronal adaptativo global para una clase de manipuladores de robots con rendimiento de aprendizaje de convergencia en tiempo finito. Este esquema de control empleó un mecanismo de conmutación suave que se combinaba con un controlador de red neuronal nominal y un controlador robusto para garantizar una estabilidad global uniforme en última instancia limitada. Las ponderaciones óptimas se obtuvieron mediante el algoritmo de estimación de tiempo finito de modo que, después del proceso de aprendizaje, las ponderaciones de aprendizaje pudieran reutilizarse la próxima vez para tareas repetidas. El mecanismo de control global NN se ha extendido aún más al control del manipulador de robot de brazo doble en [84], donde el conocimiento tanto del manipulador del robot como del objeto de agarre no está disponible de antemano. Al integrar las funciones prescritas en el diseño del controlador, se garantizaba regularmente el rendimiento transitorio del control del robot de doble brazo. El NN también se empleó para tratar el problema de sincronización de múltiples manipuladores de robots en [85], donde las trayectorias de referencia solo están disponibles para una parte de los miembros del equipo. Al utilizar el controlador de aproximación NN, el robot ha demostrado un mejor rendimiento de control con un rendimiento transitorio mejorado y una mayor robustez. Se construyó un RBFNN para compensar los términos no lineales de un manipulador de cinco barras basado en una función de transformación de error [86]. El control NN también se aplicó en el control de teleoperación del robot [87, 88]. Además, se empleó una técnica de aproximación NN para tratar la dinámica desconocida, la cinemática y las propiedades del actuador en el control de seguimiento del manipulador [89].

4.2. Control de robot basado en NN con no linealidades de entrada

Otro desafío del manipulador del robot es que las no linealidades de entrada como la fricción, la zona muerta y la saturación del actuador pueden existir inevitablemente en los sistemas del robot. Estas no linealidades de entrada pueden dar lugar a errores de seguimiento más grandes y a la degeneración del rendimiento del control. Por lo tanto, se han propuesto varios trabajos para manejar las no linealidades utilizando el diseño de redes neuronales. Se diseñó un controlador adaptativo neuronal para tratar el efecto de la saturación de entrada del manipulador del robot en [90] de la siguiente manera:

donde es el error de seguimiento de la posición del robot, es el error de seguimiento de la velocidad y es un controlador auxiliar. ,, y son los NN pesos,,, y son los NN vectores regresores, y y son las ganancias de control especificadas por el diseñador. es un sistema auxiliar diseñado para reducir el efecto de la saturación que se define de la siguiente manera.

donde es el error de torque causado por la saturación, y es un pequeño valor positivo. Para actualizar los pesos NN, las leyes adaptativas se diseñan de la siguiente manera: donde,, y son parámetros positivos especificados y, y son parámetros positivos.

En [91], se construyó un controlador de red neuronal adaptativa para aproximar la zona muerta de entrada y la dinámica incierta del manipulador robótico, mientras que la restricción de salida también se consideró en el control de retroalimentación. En [92], el NN se aplicó para la estimación de los parámetros desconocidos del modelo de un buque de superficie marina y en [93] la restricción de estado completo de un norteEl manipulador robótico de enlace se logró utilizando el control NN. El controlador NN también fue construido para manipuladores robóticos flexibles para lidiar con la supresión de vibraciones basado en un modelo de masa de resorte agrupado [94] mientras que en [95], se construyeron dos RBFNN para manipuladores robóticos flexibles para compensar la dinámica desconocida y los muertos. -Efecto de zona, respectivamente.

El NN también se ha utilizado en muchos campos industriales importantes, como los vehículos submarinos autónomos (AUV) y los vehículos de vuelo hipersónicos (HFV). En [96], la NN se ha construido para hacer frente a la actitud de los AUV en presencia de una zona muerta de entrada y parámetros de modelo inciertos. En [97], el control neuronal adaptativo se empleó para tratar el control de vehículos submarinos en el dominio de tiempo discreto encontrado con las no linealidades de entrada desconocidas, la perturbación externa y las incertidumbres del modelo. Luego, se aplicó el aprendizaje por refuerzo para abordar estas incertidumbres mediante el uso de un NN crítico y un NN de acción. El control del vehículo de vuelo hipersónico se investigó en [98] donde las incertidumbres aerodinámicas y las perturbaciones desconocidas fueron abordadas por un observador de perturbaciones basado en NN. En [99], se incorporó un control de aprendizaje neuronal en el controlador HFV para lograr la estabilidad global a través de un mecanismo de conmutación y un controlador robusto.

4.3. Control de interacción humano-robot basado en NN

Recientemente, existe una tendencia predominante a emplear robots en el entorno rodeado de humanos, como los servicios domésticos o las aplicaciones industriales, donde los humanos y los robots pueden interactuar entre sí directamente. Por lo tanto, el control de interacciones se ha convertido en un campo de investigación prometedor y ha sido ampliamente estudiado. En [100], se desarrolló un método de aprendizaje tal que la dinámica de un brazo de robot podría seguir un modelo de impedancia objetivo con solo conocimiento de la estructura robótica (ver Figura 6).

El NN se empleó además en el control de robots en interacción con un entorno [101], donde el control de impedancia se logró con la dinámica robótica completamente desconocida. En [102], se desarrolló un método de aprendizaje para que el robot fuera capaz de ajustar los parámetros de impedancia cuando interactuaba con entornos desconocidos. Para aprender los parámetros óptimos de impedancia en el control del manipulador del robot, se empleó un método de programación dinámica adaptativa (ADP) cuando el robot interactuaba con entornos desconocidos que varían en el tiempo, donde los NN se utilizaron para redes tanto de críticos como de actores [103]. El ADP también se empleó para la coordinación de multirobots [104], en el que se manejó un posible desacuerdo entre diferentes manipuladores y no se requirió conocer la dinámica de ambos robots y del objeto manipulado.

En este trabajo, el controlador consta de dos partes, una red crítica que se usó para aproximar la función de costo y un NN real que fue diseñado para controlar el robot. El crítico NN está diseñado de la siguiente manera [104]:

siendo la posición del objeto y el error de seguimiento, es el peso NN y es el vector regresor.

El crítico NN se usa para aproximar una función de costo

, donde denota la entrada de control y y son una matriz definida positiva. Dado que el objetivo del control es minimizar el esfuerzo de control, la ley de adaptación está diseñada como

donde es la tasa de aprendizaje y.

Por otro lado, el control NN real está diseñado para controlar el robot como

donde se pudo aprender la dinámica del robot, siendo el peso NN y el vector regresor. y son los errores de seguimiento de posición y velocidad, respectivamente, y es la ganancia de control.

Dado que el objetivo de control es garantizar la estimación tanto de la dinámica del robot como de la función de costo, la ley adaptativa se selecciona de la siguiente manera:

donde y son constantes positivas.

Por otro lado, como elemento fundamental de los robots de próxima generación, la colaboración humano-robot (HRC) ha sido ampliamente estudiada por los roboticistas y NN se emplea en HRC con su poderosa capacidad de aprendizaje. En [105], los NN se emplearon para estimar la intención de movimiento del compañero humano en la colaboración humano-robot, de modo que el robot pudiera seguir activamente a su compañero humano. Para ajustar el papel del robot para dirigir o seguir de acuerdo con la intención del ser humano, se empleó la teoría de juegos para el análisis fundamental de la interacción humano-robot y se desarrolló una ley de adaptación en [106]. Se adoptó la iteración de políticas combinadas con NN para proporcionar una solución rigurosa al problema del equilibrio del sistema en la interacción humano-robot [107].

4.4. Control cognitivo de robot basado en NN

Según la teoría del procesamiento predictivo [108], el cerebro humano siempre está anticipando activamente la información sensoriomotora entrante. Este proceso existe porque los seres vivos exhiben latencias debido a retrasos en el procesamiento neuronal y un ancho de banda limitado en su procesamiento sensoriomotor. Para compensar este retraso, en el cerebro humano, las señales de retroalimentación neuronal (incluidas las conexiones laterales y de arriba hacia abajo) modulan las actividades neuronales a través de conexiones inhibidoras o excitadoras al influir en la codificación de la población neuronal de las señales de abajo hacia arriba impulsadas por los sentidos en la percepción. -sistema de acción. De manera similar, en los sistemas robóticos, se afirma que tal retraso y un ancho de banda limitado también pueden compensarse mediante las funciones predictivas aprendidas por modelos neuronales recurrentes. Este proceso de aprendizaje se puede realizar únicamente mediante el procesamiento visual [109] o en el ciclo de percepción y acción [110].

Basado en la teoría de la integración sensoriomotora jerárquica, que defiende que la acción y la percepción se entrelazan al compartir la misma base representacional [111], la representación en diferentes niveles de percepción sensorial no representa explícitamente acciones, sino que existe una codificación de la posible percepción futura. que se aprende del conocimiento sensoriomotor previo.

En el bayesiano, una vez establecidos estos vínculos de percepción y acción después del aprendizaje, estas asociaciones percepción-acción en esta arquitectura permiten las siguientes operaciones.

Primero, estas asociaciones permiten predecir el resultado perceptual de acciones dadas por medio de modelos directos (por ejemplo, modelo bayesiano). Puede escribirse como

dónde mi estima la próxima evidencia de percepción dada una acción ejecutada A y otra información previa que ya conozca. El término sugiere que un modelo preaprendido que representa la posibilidad de una acción motora A se ejecutará dado que se percibe una (posible) evidencia sensorial resultante (cómputo hacia atrás).

En segundo lugar, estas asociaciones permiten seleccionar un movimiento apropiado dada una representación perceptiva deseada. A partir de los cálculos hacia atrás introducidos en la siguiente ecuación, se produce una integración sensoriomotora predictiva: donde A indica una acción particular seleccionada dada la información sensorial (prevista) y un objetivo GRAMO. Aquí asumimos que la acción de uno solo está determinada por la entrada sensorial actual y el objetivo.

En cuanto a su organización jerárquica, también permite esta operación: con vías de información bidireccionales, una representación de percepción de bajo nivel se puede expresar en un nivel superior, con un campo receptivo más complejo, y viceversa.

. Esto se puede realizar mediante arquitecturas bidireccionales profundas como [112]. Conceptualmente, estas operaciones se pueden lograr extrayendo la regularidad estadística que se muestra en la Figura 7.

Dado que tanto los procesos de percepción como los de acción pueden verse como secuencias temporales, desde la perspectiva matemática, las redes recurrentes son Turing-Completas y tienen una capacidad de aprendizaje para aprender secuencias de tiempo de duración arbitraria [113], si se entrena adecuadamente. Además, estas conexiones recurrentes se pueden colocar de forma jerárquica en la que las funciones de predicción en diferentes capas intentan predecir las series de tiempo no lineales en diferentes escalas de tiempo [114]. A partir de este punto, la red neuronal recurrente con unidades de sesgo paramétrico (RNNPB) [115] y las redes neuronales recurrentes de múltiples escalas de tiempo (MTRNN) [116] se aplicaron para predecir secuencias entendiéndolas en varios niveles temporales.

La diferencia de los niveles temporales controla las propiedades de los diferentes niveles de presentación en la red recurrente profunda. Por ejemplo, en la red MTRNN [112], el aprendizaje de cada neurona sigue la regla de actualización de los modelos clásicos de tasa de activación, en los que la actividad de una neurona está determinada por la tasa de activación promedio de todas las neuronas conectadas. Además, la actividad neuronal también está decayendo con el tiempo siguiendo una regla de actualización del modelo de integrador con fugas. Asumiendo el I-th neurona MTRNN tiene el número de norte conexiones, el estado actual del potencial de membrana de una neurona se puede definir tanto por la activación previa como por las entradas sinápticas actuales:

donde representa el peso sináptico de la j-th neurona a la I-th neurona, es la actividad de j-th neurona en t-ésimo paso de tiempo, y τ es el parámetro de escala de tiempo que determina la tasa de desintegración de esta neurona: una mayor τ significa que sus actividades cambian lentamente con el tiempo en comparación con aquellas con un parámetro de escala de tiempo más pequeño τ.

En [117] se discutieron en detalle los conceptos de codificación predictiva, donde el aprendizaje, generación y reconocimiento de acciones se puede realizar mediante el principio de minimización de errores de predicción. Al usar la codificación predictiva, el RNNPB y el MTRNN son capaces tanto de generar acciones propias como de reconocer las mismas acciones realizadas por otros. Recientemente, el estudio sobre experimentos de neurorobótica ha demostrado que el esquema de codificación predictiva dinámica se puede utilizar para abordar las fluctuaciones en los patrones temporales al entrenar un modelo de red neuronal recurrente (RNN) [118]. Este esquema de codificación predictiva permite a los organismos predecir los resultados perceptivos basados ​​en las intenciones actuales de acciones para el entorno externo y pronosticar las secuencias perceptivas correspondientes a estados de intención dados [118].

Sobre la base de esta arquitectura, se utilizaron modelos RNN de dos capas para extraer información visual [119] y para comprender las intenciones [120] o el estado de las emociones [121] en robótica social. Se utilizaron modelos RNN de tres capas para integrar y comprender la información multimodal para un robot iCub humanoide [112, 122]. Además, el marco de codificación predictiva se ha extendido a MTRNN de codificación predictiva de Bayes variacional, que puede arbitrar entre el modelo determinista y el modelo probabilístico estableciendo un metaparámetro [123]. Dicha extensión podría proporcionar una mejora significativa en el tratamiento de entradas sensoriales fluctuantes ruidosas que se espera que experimenten los robots en entornos más reales. En [124], se empleó un MTRNN para controlar un robot humanoide y los resultados experimentales han demostrado que, utilizando sólo datos de entrenamiento parciales, el modelo de control puede lograr la generalización mediante el aprendizaje en un nivel de percepción de características más bajo.

La estructura jerárquica de RNN exhibe una gran capacidad de aprendizaje para almacenar información multimodal que es beneficiosa para que los sistemas robóticos comprendan y predigan en un entorno complejo. Como modelos y aplicaciones futuros, las técnicas de aprendizaje profundo de vanguardia o las acciones motoras de los sistemas robóticos pueden integrarse aún más en esta arquitectura predictiva.

5. Conclusión

En resumen, en las últimas dos décadas se han obtenido grandes logros para el diseño de control de sistemas no lineales mediante redes neuronales. A pesar de la imposibilidad de identificar o enumerar todas las contribuciones relacionadas en esta breve reseña, se han realizado esfuerzos para resumir los avances recientes en el área de control NN y sus aplicaciones particulares en el control de aprendizaje de robots, el control de interacción de robots y el reconocimiento de robots. control. En este artículo, hemos demostrado que se ha logrado un progreso significativo de NN en el control de los sistemas no lineales, en la resolución del problema de optimización, en la aproximación de la dinámica del sistema, en el tratamiento de las no linealidades de entrada, en la interacción humano-robot y en la reconocimiento de patrones. Todos estos desarrollos acompañan no solo al desarrollo de técnicas de control y manufacturas avanzadas, sino también al progreso teatral en la construcción y desarrollo de las redes neuronales. Aunque se han realizado grandes esfuerzos para integrar la NN en los sistemas de control prácticos, todavía existe una gran brecha entre la teoría y la práctica. Para mejorar la viabilidad y usabilidad, se ha propuesto la teoría de la computación evolutiva para entrenar a las NN. Puede encontrar automáticamente una arquitectura NN casi óptima y permitir que una NN adapte su regla de aprendizaje a su entorno. Sin embargo, el complejo y largo proceso de formación de los algoritmos evolutivos disuade sus aplicaciones prácticas. Es necesario realizar más esfuerzos para desarrollar la arquitectura NN y la técnica de aprendizaje NN en el diseño de control. Por otro lado, en el cerebro humano, las actividades neuronales se modulan a través de conexiones inhibidoras o excitadoras al influir en la codificación de la población neuronal de las señales ascendentes impulsadas por los sentidos en el sistema de percepción-acción. En este sentido, cómo integrar la información sensor-motor en la red para hacer que las NN sean más factibles de adaptarse al entorno y asemejarse a la capacidad del cerebro humano, merece más investigaciones.

En conclusión, se proporciona una breve revisión sobre redes neuronales para los sistemas no lineales complejos con control neuronal adaptativo, programación dinámica basada en NN, computación evolutiva y sus aplicaciones prácticas en los campos robóticos. Creemos que esta área puede promover cada vez más investigaciones tanto en teorías como en aplicaciones. Y temas emergentes, como aprendizaje profundo [125-128], big data [129-131] y computación en la nube, pueden incorporarse al control de redes neuronales para sistemas complejos, por ejemplo, las redes neuronales profundas podrían usarse para procesar cantidades masivas de datos no supervisados ​​en escenarios complejos, las redes neuronales pueden ser útiles para reducir la dimensionalidad de los datos, y la optimización del entrenamiento NN puede emplearse para mejorar el rendimiento de aprendizaje y adaptación de los robots.

Conflictos de interés

Los autores declaran no tener ningún conflicto de intereses.

Expresiones de gratitud

Este trabajo fue parcialmente financiado por la National Nature Science Foundation (NSFC) bajo la subvención 61473120, Guangdong Provincial Natural Science Foundation, 2014A030313266, International Science and Technology Collaboration, Grant 2015A050502017, Science and Technology Planning Project of Guangzhou, 201607010006, State Key Laboratory of Robotics and System (HIT) Grant SKLRS-2017-KF-13, y los Fondos de Investigación Fundamental para las Universidades Centrales.

Referencias

  1. F. Gruau, D. Whitley y L. Pyeatt, "Una comparación entre la codificación celular y la codificación directa para redes neuronales genéticas", en Actas de la primera conferencia anual sobre programación genética, págs. 81–89, 1996. Ver en: Google Scholar
  2. H. de Garis, "El proyecto CAM-Brain de un cerebro artificial de ATR tiene como objetivo construir / desarrollar un cerebro artificial con un millón de módulos de red neuronal dentro de una máquina de autómatas celulares de un billón de células". Computación de nueva generación, vol. 12, no. 2, págs. 215–221, 1994. Ver en: Sitio del editor | Google Académico
  3. W. S. McCulloch y W. Pitts, "Un cálculo lógico de las ideas inmanentes en la actividad nerviosa", Boletín de Biología Matemática, vol. 5, no. 4, págs. 115-133, 1943. Ver en: Sitio del editor | Google Académico
  4. C. Yang, S. S. Ge, C. Xiang, T. Chai y T. H. Lee, "Control NN de retroalimentación de salida para dos clases de sistemas de tiempo discreto con direcciones de control desconocidas en un enfoque unificado", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 19, no. 11, págs. 1873–1886, 2008. Ver en: Sitio del editor | Google Académico
  5. R. Kumar, R. K. Aggarwal y J. D. Sharma, "Análisis energético de un edificio utilizando una red neuronal artificial: una revisión", Energía y Edificación, vol. 65, págs. 352–358, 2013. Ver en: Sitio del editor | Google Académico
  6. C. Alippi, C. De Russis y V. Piuri, "Una solución de control basada en redes neuronales para el control de la relación aire-combustible para sistemas de inyección de combustible de automóviles", Transacciones IEEE sobre sistemas, hombre y cibernética, Parte C: Aplicaciones y revisiones, vol. 33, no. 2, págs. 259–268, 2003. Ver en: Sitio del editor | Google Académico
  7. E. M. Azoff, Predicción de series de tiempo de redes neuronales de los mercados financieros, John Wiley & amp Sons, Inc, 1994.
  8. I. Fister, P. N. Suganthan, J. Fister et al., "Regresión de red neuronal artificial como heurística de búsqueda local para estrategias de conjunto en evolución diferencial", Dinámica no lineal, vol. 84, no. 2, págs. 895–914, 2016. Ver en: Sitio del editor | Académico de Google | MathSciNet
  9. Y. Zhang, S. Li y H. Guo, "Un tipo de red neuronal distribuida basada en consenso sesgada para la planificación de rutas", Dinámica no lineal, vol. 89, no. 3, págs. 1803–1815, 2017. Ver en: Sitio del editor | Académico de Google | MathSciNet
  10. X. Shi, Z. Wang y L. Han, "Sincronización estocástica en tiempo finito de redes neuronales de retardo de tiempo con perturbación de ruido", Dinámica no lineal, vol. 88, no. 4, págs. 2747–2755, 2017. Ver en: Sitio del editor | Académico de Google | MathSciNet
  11. P. He y Y. Li, "Sincronización H∞ de redes neuronales de reacción-difusión acopladas con retardos mixtos", Complejidad, vol. 21, no. S2, págs. 42–53, 2016. Ver en: Sitio del editor | Académico de Google | MathSciNet
  12. Z. Tu, J. Cao, A. Alsaedi, F. E. Alsaadi y T. Hayat, "Estabilidad global de Lagrange de redes neuronales de valor complejo de tipo neutral con retrasos variables en el tiempo", Complejidad, vol. 21, no. S2, págs. 438–450, 2016. Ver en: Sitio del editor | Académico de Google | MathSciNet
  13. C. Wang, S. Guo e Y. Xu, "Formación de autapsis conectada a la neurona y su función biológica", Complejidad, vol. 2017, ID de artículo 5436737, 9 páginas, 2017. Ver en: Sitio del editor | Google Académico
  14. J. D. J. Rubio, I. Elias, D. R. Cruz y J. Pacheco, "Red neuronal de función de base radial estable uniforme para la predicción en dos procesos mecatrónicos", Neurocomputación, vol. 227, págs. 122–130, 2017. Ver en: Sitio para editores | Google Académico
  15. J. d. Rubio, "USNFIS: Sistema de inferencia neuro difuso estable uniforme", Neurocomputación, vol. 262, págs. 57–66, 2017. Ver en: Sitio del editor | Google Académico
  16. Q. Liu, J. Yin, V. C. M. Leung, J.-H. Zhai, Z. Cai y J. Lin, "Aplicación de un nuevo modelo de error de generalización localizado para diseñar redes neuronales entrenadas con una máquina de aprendizaje extrema", Computación neuronal y aplicaciones, págs. 1–8, 2014. Ver en: Sitio del editor | Google Académico
  17. R. J. de Jesús, “Modelo de red neuronal de interpolación de un aerogenerador fabricado”, Computación neuronal y aplicaciones, págs. 1–12, 2016. Ver en: Sitio del editor | Google Académico
  18. C. Mu y D. Wang, "Control de costos garantizado adaptativo basado en redes neuronales de sistemas dinámicos no lineales con incertidumbres coincidentes", Neurocomputación, vol. 245, págs. 46–54, 2017. Ver en: Sitio para editores | Google Académico
  19. Z. Lin, D. Ma, J. Meng y L. Chen, "Aprendizaje de ordenamiento relativo en redes neuronales de picos para el reconocimiento de patrones", Neurocomputación, 2017. Ver en: Sitio del editor | Google Académico
  20. J. Yu, J. Sang y X. Gao, "Aprendizaje automático y procesamiento de señales para grandes análisis multimedia" Neurocomputación, vol. 257, págs. 1–4, 2017. Ver en: Sitio para editores | Google Académico
  21. T. Zhang, S. S. Ge y C. C. Hang, "Control adaptativo de redes neuronales para sistemas no lineales de retroalimentación estricta que utilizan un diseño retroactivo", Automatica, vol. 36, no. 12, págs. 1835–1846, 2000. Ver en: Sitio del editor | Google Académico
  22. S. S. Ge y T. Zhang, "Control de red neuronal de un sistema no lineal no fino con dinámica cero por estado y retroalimentación de salida", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 14, no. 4, págs. 900–918, 2003. Ver en: Sitio del editor | Google Académico
  23. S. S. Ge, C. Yang y T. H. Lee, "Control predictivo adaptativo utilizando una red neuronal para una clase de sistemas de retroalimentación pura en tiempo discreto", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 19, no. 9, págs. 1599–1614, 2008. Ver en: Sitio del editor | Google Académico
  24. F. W. Lewis, S. Jagannathan y A. Yesildirak, Control de redes neuronales de manipuladores de robots y sistemas no lineales, CRC Press, 1998.
  25. S. Jagannathan y F. L. Lewis, "Identificación de sistemas dinámicos no lineales mediante redes neuronales multicapa", Automatica, vol. 32, no. 12, págs. 1707–1712, 1996. Ver en: Sitio del editor | Académico de Google | MathSciNet
  26. D. Vrabie y F. Lewis, "Enfoque de red neuronal para el control óptimo adaptativo directo en tiempo continuo para sistemas no lineales parcialmente desconocidos", Redes neuronales, vol. 22, no. 3, págs. 237–246, 2009. Ver en: Sitio del editor | Google Académico
  27. C. Yang, S. S. Ge y T. H. Lee, "Control adaptativo de retroalimentación de salida de una clase de sistemas de tiempo discreto no lineales con direcciones de control desconocidas", Automatica, vol. 45, no. 1, págs. 270–276, 2009. Ver en: Sitio del editor | Académico de Google | MathSciNet
  28. C. Yang, Z. Li y J. Li, "Planificación de trayectorias y control adaptativo optimizado para una clase de modelos de vehículos de péndulo invertido con ruedas", Transacciones IEEE sobre cibernética, vol. 43, no. 1, págs. 24–36, 2013. Ver en: Sitio del editor | Google Académico
  29. Y. Jiang, C. Yang y H. Ma, "Una revisión de la lógica difusa y el diseño de control inteligente basado en redes neuronales para sistemas de tiempo discreto", Dinámica discreta en la naturaleza y la sociedad, Número de artículo 7217364, Art. ID 7217364, 11 páginas, 2016. Ver en: Sitio del editor | Académico de Google | MathSciNet
  30. Y. Jiang, C. Yang, S.-L. Dai y B. Ren, "El aprendizaje determinista mejoró el control de la red neutral de helicópteros no tripulados", Revista internacional de sistemas robóticos avanzados, vol. 13, no. 6, págs. 1–12, 2016. Ver en: Sitio del editor | Google Académico
  31. Y. Jiang, Z. Liu, C. Chen e Y. Zhang, "Control difuso robusto adaptativo para robot de brazo doble con no linealidad de zona muerta de entrada desconocida", Dinámica no lineal, vol. 81, no. 3, págs. 1301–1314, 2015. Ver en: Sitio del editor | Académico de Google | MathSciNet.
  32. M. Defoort, T. Floquet, A. Kökösy y W. Perruquetti, "Control de formación en modo deslizante para robots móviles autónomos cooperativos", Transacciones IEEE sobre electrónica industrial, vol. 55, no. 11, págs. 3944–3953, 2008. Ver en: Sitio del editor | Google Académico
  33. X. Liu, C. Yang, Z. Chen, M. Wang y C. Su, "Control basado en un observador neuroadaptativo de un robot de articulaciones flexibles", Neurocomputación, 2017. Ver en: Sitio del editor | Google Académico
  34. F. Hamerlain, T. Floquet y W. Perruquetti, "Pruebas experimentales de un controlador de modo deslizante para el seguimiento de la trayectoria de un robot móvil similar a un automóvil", Robotica, vol. 32, no. 1, págs. 63–76, 2014. Ver en: Sitio del editor | Google Académico
  35. R. J. de Jesús, “Control de tiempo discreto basado en redes neuronales para péndulos”, Computación blanda aplicada, 2017. Ver en: Sitio del editor | Google Académico
  36. Y. Pan, M. J. Er, T. Sun, B. Xu y H. Yu, "Control de DP difuso adaptativo con garantía de seguimiento estable de H∞", Neurocomputación, vol. 237, págs. 71–78, 2017. Ver en: Sitio para editores | Google Académico
  37. R. J. de Jesús, “Control adaptativo de mínimos cuadrados en tiempo discreto de brazos robóticos”, Computación blanda, vol. 19, no. 12, págs. 3665–3676, 2015. Ver en: Sitio del editor | Google Académico
  38. S. Commuri, S. Jagannathan y F. L. Lewis, "CMAC control de la red neuronal de los manipuladores de robots", Revista de sistemas robóticos, vol. 14, no. 6, págs. 465–482, 1997. Ver en: Sitio del editor | Google Académico
  39. J. S. Albus, "Aspectos teóricos y experimentales de un modelo cerebeloso", Revisiones de investigaciones sobre discapacidades del desarrollo, vol. 17, págs. 93–101, 1972. Ver en: Google Scholar
  40. B. Yang, R. Bao y H. Han, "Control híbrido robusto basado en PD y CMAC novedoso con arquitectura mejorada y esquema de aprendizaje para simulador de carga eléctrica" Transacciones IEEE sobre electrónica industrial, vol. 61, no. 10, págs. 5271–5279, 2014. Ver en: Sitio del editor | Google Académico
  41. S. Jagannathan y F. L. Lewis, "Controlador de red neuronal de tiempo discreto multicapa con rendimiento garantizado", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 7, no. 1, págs. 107–130, 1996. Ver en: Sitio del editor | Google Académico
  42. S. S. Ge y J. Wang, "Robusto control neuronal adaptativo para una clase de sistemas no lineales de retroalimentación estricta perturbados", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 13, no. 6, págs. 1409–1419, 2002. Ver en: Sitio del editor | Google Académico
  43. Y. H. Kim, F. L. Lewis y C. T. Abdallah, "Un observador adaptativo dinámico recurrente basado en redes neuronales para una clase de sistemas no lineales", Automatica, vol. 33, no. 8, págs. 1539–1543, 1997. Ver en: Sitio del editor | Académico de Google | MathSciNet
  44. J.-Q. Huang y F. L. Lewis, "Control predictivo de redes neuronales para sistemas dinámicos no lineales con retardo de tiempo", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 14, no. 2, págs. 377–389, 2003. Ver en: Sitio del editor | Google Académico
  45. S. S. Ge, F. Hong y T. H.Lee, "Control neuronal adaptativo de sistemas de retardo de tiempo no lineales con coeficientes de control virtual desconocidos", Transacciones IEEE sobre sistemas, hombre y cibernética, Parte B: Cibernética, vol. 34, no. 1, págs. 499–516, 2004. Ver en: Sitio del editor | Google Académico
  46. J. Na, X. M. Ren y H. Huang, "Control de retroalimentación positiva de retardo de tiempo para sistemas de retardo de tiempo no lineales con compensación de red neuronal", Zidonghua Xuebao / Acta Automatica Sinica, vol. 34, no. 9, págs. 1196–1202, 2008. Ver en: Sitio del editor | Académico de Google | MathSciNet
  47. J. Na, X. Ren, C. Shang e Y. Guo, "Control predictivo de redes neuronales adaptativas para sistemas de retroalimentación pura no lineal con retardo de entrada", Diario de control de procesos, vol. 22, no. 1, págs. 194–206, 2012. Ver en: Sitio del editor | Google Académico
  48. R. R. Selmic y F. L. Lewis, "Aproximación de redes neuronales de funciones continuas por partes: aplicación a la compensación de fricción", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 13, no. 3, págs. 745–751, 2002. Ver en: Sitio del editor | Google Académico
  49. H. Zhang y F. L. Lewis, "Control de seguimiento cooperativo adaptativo de sistemas no lineales de orden superior con dinámica desconocida", Automatica, vol. 48, no. 7, págs. 1432–1439, 2012. Ver en: Sitio del editor | Académico de Google | MathSciNet
  50. J. Na, X. Ren y D. Zheng, "Control adaptativo para sistemas no lineales de retroalimentación pura con observador de modo deslizante de orden superior", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 24, no. 3, págs. 370–382, 2013. Ver en: Sitio del editor | Google Académico
  51. J. Na, Q. Chen, X. Ren e Y. Guo, "Control de movimiento de rendimiento prescrito adaptativo de servo mecanismos con compensación de fricción", Transacciones IEEE sobre electrónica industrial, vol. 61, no. 1, págs. 486–494, 2014. Ver en: Sitio del editor | Google Académico
  52. J. Na, X. Ren, G. Herrmann y Z. Qiao, "Control de superficie dinámico neuronal adaptativo para servosistemas con zona muerta desconocida", Práctica de ingeniería de control, vol. 19, no. 11, págs. 1328–1343, 2011. Ver en: Sitio del editor | Google Académico
  53. G. Li, J. Na, D. P. Stoten y X. Ren, "Adaptive neural network feedforward control for dynamically subestructurated systems", Transacciones IEEE sobre tecnología de sistemas de control, vol. 22, no. 3, págs. 944–954, 2014. Ver en: Sitio del editor | Google Académico
  54. B. Xu, Z. Shi, C. Yang y F. Sun, "Control de superficie dinámico neuronal compuesto de una clase de sistemas no lineales inciertos en forma de retroalimentación estricta", Transacciones IEEE sobre cibernética, 2014. Ver en: Sitio del editor | Google Académico
  55. M. Chen y S. Ge, "Control de retroalimentación de salida neuronal adaptativa de sistemas no lineales inciertos con histéresis desconocida utilizando un observador de perturbaciones", Transacciones IEEE sobre electrónica industrial, 2015. Ver en: Sitio del editor | Google Académico
  56. M. Chen y S. S. Ge, "Control neural adaptativo directo para una clase de sistemas no lineales no finos inciertos basados ​​en el observador de perturbaciones", Transacciones IEEE sobre cibernética, vol. 43, no. 4, págs. 1213–1225, 2013. Ver en: Sitio del editor | Google Académico
  57. M. Chen, G. Tao y B. Jiang, "Control dinámico de superficies mediante redes neuronales para una clase de sistemas no lineales inciertos con saturación de entrada", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 26, no. 9, págs. 2086–2097, 2015. Ver en: Sitio del editor | Académico de Google | MathSciNet
  58. P. J. Werbos, "Programación dinámica aproximada para control en tiempo real y modelado neuronal", en Manual de control inteligente, 1992. Ver en: Google Scholar
  59. F.-Y. Wang, H. Zhang y D. Liu, "Programación dinámica adaptativa: una introducción", Revista IEEE Computational Intelligence, vol. 4, no. 2, págs. 39–47, 2009. Ver en: Sitio del editor | Google Académico
  60. F. L. Lewis, D. Vrabie y K.. Vamvoudakis, "Aprendizaje por refuerzo y control de retroalimentación: uso de métodos de decisión naturales para diseñar controladores adaptativos óptimos" Revista IEEE Control Systems, vol. 32, no. 6, págs. 76–105, 2012. Ver en: Sitio del editor | Académico de Google | MathSciNet
  61. F. L. Lewis y D. Vrabie, "Aprendizaje por refuerzo y programación dinámica adaptativa para el control de la retroalimentación", Revista de circuitos y sistemas IEEE, vol. 9, no. 3, págs. 32–50, 2009. Ver en: Sitio del editor | Google Académico
  62. A. Al-Tamimi, F. L. Lewis y M. Abu-Khalaf, "Solución HJB no lineal en tiempo discreto que utiliza programación dinámica aproximada: prueba de convergencia", Transacciones IEEE sobre sistemas, hombre y cibernética, Parte B: Cibernética, vol. 38, no. 4, págs. 943–949, 2008. Ver en: Sitio del editor | Google Académico
  63. H. Zhang, Y. Luo y D. Liu, "Control casi óptimo basado en redes neuronales para una clase de sistemas no lineales afines en tiempo discreto con restricciones de control", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 20, no. 9, págs. 1490–1503, 2009. Ver en: Sitio del editor | Google Académico
  64. D. Wang, D. Liu, Q. Wei, D. Zhao y N. Jin, "Control óptimo de sistemas de tiempo discreto no lineales no-finos desconocidos basados ​​en la programación dinámica adaptativa", Automatica, vol. 48, no. 8, págs. 1825–1832, 2012. Ver en: Sitio del editor | Académico de Google | MathSciNet
  65. H. He, Z. Ni y J. Fu, "Una arquitectura de tres redes para el aprendizaje en línea y la optimización basada en la programación dinámica adaptativa" Neurocomputación, vol. 78, no. 1, págs. 3–13, 2012. Ver en: Sitio del editor | Google Académico
  66. D. Liu y Q. Wei, "Algoritmo de programación dinámica adaptativa de iteración de políticas para sistemas no lineales de tiempo discreto", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 25, no. 3, págs. 621–634, 2014. Ver en: Sitio del editor | Google Académico
  67. D. Liu, X. Yang, D. Wang y Q. Wei, "Diseño de controlador robusto basado en aprendizaje reforzado para sistemas no lineales inciertos en tiempo continuo sujetos a restricciones de entrada", Transacciones IEEE sobre cibernética, vol. 45, no. 7, págs. 1372–1385, 2015. Ver en: Sitio del editor | Google Académico
  68. J. Fu, H. He y X. Zhou, "Control y aprendizaje adaptativo para el sistema MIMO basado en la programación dinámica adaptativa" Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 22, no. 7, págs. 1133–1148, 2011. Ver en: Sitio del editor | Google Académico
  69. Y. Lv, J. Na, Q. Yang, X. Wu e Y. Guo, "Control óptimo adaptativo en línea para sistemas no lineales de tiempo continuo con dinámicas completamente desconocidas", Revista Internacional de Control, vol. 89, no. 1, págs. 99–112, 2016. Ver en: Sitio del editor | Académico de Google | MathSciNet
  70. J. Na y G. Herrmann, "Control de seguimiento óptimo aproximado y adaptativo en línea con estructura de aproximación dual simplificada para sistemas no lineales desconocidos en tiempo continuo", IEEE / CAA Journal of Automatica Sinica, vol. 1, no. 4, págs. 412–422, 2014. Ver en: Sitio del editor | Google Académico
  71. X. Yao, "Evolución de las redes neuronales artificiales", Actas del IEEE, vol. 87, no. 9, págs. 1423–1447, 1999. Ver en: Sitio del editor | Google Académico
  72. S. F. Ding, H. Li, C. Y. Su, J. Z. Yu y F. X. Jin, "Redes neuronales artificiales evolutivas: una revisión", Revisión de inteligencia artificial, vol. 39, no. 3, págs. 251–260, 2013. Ver en: Sitio del editor | Google Académico
  73. X. Yao e Y. Liu, "Un nuevo sistema evolutivo para la evolución de redes neuronales artificiales", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 8, no. 3, págs. 694–713, 1997. Ver en: Sitio del editor | Google Académico
  74. Y. Li y A. Häußler, "Evolución artificial de redes neuronales y su aplicación al control de retroalimentación", Inteligencia artificial en ingeniería, vol. 10, no. 2, págs. 143-152, 1996. Ver en: Sitio del editor | Google Académico
  75. C.-K. Goh, E.-J. Teoh y K. C. Tan, "Diseño evolutivo híbrido multiobjetivo para redes neuronales artificiales", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 19, no. 9, págs. 1531–1548, 2008. Ver en: Sitio del editor | Google Académico
  76. K. C. Tan y Y. Li, "Identificación del modelo de caja gris a través de la computación evolutiva", Práctica de ingeniería de control, vol. 10, no. 7, págs. 673–684, 2002. Ver en: Sitio del editor | Google Académico
  77. L. Wang, C. K. Tan y C. M. Chew, Robótica evolutiva: de los algoritmos a las implementaciones, Chew C M. Robótica evolutiva, desde algoritmos hasta implementaciones [M]. Nueva Jersey, 2006.
  78. J. Zhang, Z.-H. Zhang, Y. Lin et al., "La computación evolutiva se une al aprendizaje automático: una encuesta", Revista IEEE Computational Intelligence, vol. 6, no. 4, págs. 68–75, 2011. Ver en: Sitio del editor | Google Académico
  79. C. Yang, X. Wang, L. Cheng y H. Ma, "Control de telerobot basado en el aprendizaje neuronal con rendimiento garantizado", Transacciones IEEE sobre cibernética, 2017. Ver en: Sitio del editor | Google Académico
  80. C. Yang, K. Huang, H. Cheng, Y. Li y C. Su, "Identificación háptica por manipulador incierto controlado por ELM", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, vol. 47, no. 8, 2017. Ver en: Sitio del editor | Google Académico
  81. C. Yang, Z. Li, R. Cui y B. Xu, "Control de movimiento basado en redes neuronales de un modelo de péndulo invertido con ruedas poco activado", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, 2014. Ver en: Sitio del editor | Google Académico
  82. C. Yang, T. Teng, B. Xu, Z. Li, J. Na y C. Su, "Control de seguimiento adaptativo global de manipuladores de robots que utilizan redes neuronales con convergencia de aprendizaje en tiempo finito", Revista internacional de control, automatización y sistemas, vol. 15, no. 4, págs. 1916-1924, 2017. Ver en: Sitio del editor | Google Académico
  83. C. Yang, Y. Jiang, Z. Li, W. He y C.-Y. Su, "Control neuronal de robots bimanuales con estabilidad global garantizada y precisión de movimiento", Transacciones IEEE sobre informática industrial, 2017. Ver en: Sitio del editor | Google Académico
  84. R. Cui y W. Yan, "Sincronización mutua de múltiples manipuladores de robots con dinámica desconocida", Revista de sistemas robóticos inteligentes y amp, vol. 68, no. 2, págs. 105–119, 2012. Ver en: Sitio del editor | Google Académico
  85. L. Cheng, Z.-G. Hou, M. Tan y W. J. Zhang, "Control de seguimiento de un robot de cinco barras de cadena cerrada con dos grados de libertad mediante la integración de un enfoque basado en aproximaciones y un diseño mecánico", Transacciones IEEE sobre sistemas, hombre y cibernética, Parte B: Cibernética, vol. 42, no. 5, págs. 1470–1479, 2012. Ver en: Sitio del editor | Google Académico
  86. C. Yang, X. Wang, Z. Li, Y. Li y C. Su, "Control de teleoperación basado en la combinación de redes neuronales y variables de onda", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, 2017. Ver en: Sitio del editor | Google Académico
  87. C. Yang, J. Luo, Y. Pan, Z. Liu y C. Su, "Control de ganancia variable personalizado con atenuación de temblores para teleoperación de robots", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, págs. 1–12, 2017. Ver en: Sitio del editor | Google Académico
  88. L. Cheng, Z.-G. Hou y M. Tan, "Control de seguimiento de red neuronal adaptable para manipuladores con cinemática, dinámica y modelo de actuador inciertos", Automatica, vol. 45, no. 10, págs. 2312–2318, 2009. Ver en: Sitio del editor | Académico de Google | MathSciNet
  89. W. He, Y. Dong y C. Sun, "Control adaptativo de impedancia neuronal de un manipulador robótico con saturación de entrada", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, vol. 46, no. 3, págs. 334–344, 2016. Ver en: Sitio del editor | Google Académico
  90. W. He, A. O. David, Z. Yin y C. Sun, "Control de red neuronal de un manipulador robótico con zona muerta de entrada y restricción de salida", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, 2015. Ver en: Sitio del editor | Google Académico
  91. W. He, Z. Yin y C. Sun, "Control de red neuronal adaptable de un buque marino con restricciones mediante la función de barrera asimétrica de Lyapunov", Transacciones IEEE sobre cibernética, 2016. Ver en: Sitio del editor | Google Académico
  92. W. He, Y. Chen y Z. Yin, "Control de red neuronal adaptable de un robot incierto con restricciones de estado completo", Transacciones IEEE sobre cibernética, vol. 46, no. 3, págs. 620–629, 2016. Ver en: Sitio del editor | Google Académico
  93. C. Sun, W. He y J. Hong, "Control de red neuronal de un manipulador robótico flexible utilizando el modelo de masa de resorte", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, vol. 47, no. 8, págs. 1863–1874, 2017. Ver en: Sitio del editor | Google Académico
  94. W. He, Y. Ouyang y J. Hong, "Control de vibración de un manipulador robótico flexible en presencia de una zona muerta de entrada", Transacciones IEEE sobre informática industrial, vol. 13, no. 1, págs. 48–59, 2017. Ver en: Sitio del editor | Google Académico
  95. R. Cui, X. Zhang y D. Cui, "Control de actitud de modo deslizante adaptativo para vehículos submarinos autónomos con no linealidades de entrada", Ingeniería Oceánica, vol. 123, págs. 45–54, 2016. Ver en: Sitio del editor | Google Académico
  96. R. Cui, C. Yang, Y. Li y S. Sharma, "Control de red neuronal adaptable de AUV con no linealidades de entrada de control mediante aprendizaje por refuerzo", Transacciones IEEE sobre sistemas, hombre y cibernética: sistemas, vol. 47, no. 6, págs. 1019–1029, 2017. Ver en: Sitio para editores | Google Académico
  97. B. Xu, D. Wang, Y. Zhang y Z. Shi, "Control neuronal basado en DOB de un vehículo de vuelo hipersónico flexible que considera los efectos del viento", Transacciones IEEE sobre electrónica industrial, vol. PP, no. 99, pág. 1, 2017. Ver en: Sitio del editor | Google Académico
  98. B. Xu, C. Yang y Y. Pan, "Control de seguimiento de superficie dinámico neuronal global de sistemas de retroalimentación estricta con aplicación a vehículos de vuelo hipersónicos", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 26, no. 10, págs. 2563–2575, 2015. Ver en: Sitio del editor | Académico de Google | MathSciNet
  99. Y. Li, S. S. Ge y C. Yang, "Control de impedancia de aprendizaje para la interacción física entre el robot y el entorno", Revista Internacional de Control, vol. 85, no. 2, págs. 182–193, 2012. Ver en: Sitio del editor | Académico de Google | MathSciNet
  100. Y. Li, S. S. Ge, Q. Zhang y T.. Lee, "Control de impedancia de redes neuronales de robots que interactúan con entornos", Teoría de control IET y aplicaciones de amplificador, vol. 7, no. 11, págs. 1509–1519, 2013. Ver en: Sitio del editor | Académico de Google | MathSciNet
  101. Y. Li y S. S. Ge, "Aprendizaje de impedancia para robots que interactúan con entornos desconocidos", Transacciones IEEE sobre tecnología de sistemas de control, vol. 22, no. 4, págs. 1422–1432, 2014. Ver en: Sitio del editor | Google Académico
  102. C. Wang, Y. Li, S. S. Ge y T.. Lee, "Aprendizaje crítico óptimo para el control de robots en entornos que varían en el tiempo", Transacciones IEEE en redes neuronales y sistemas de aprendizaje, vol. 26, no. 10, págs. 2301–2310, 2015. Ver en: Sitio del editor | Académico de Google | MathSciNet
  103. Y. Li, L. Chen, K. P. Tee y Q. Li, "Control de aprendizaje por refuerzo para la manipulación coordinada de múltiples robots", Neurocomputación, vol. 170, págs. 168–175, 2015. Ver en: Sitio del editor | Google Académico
  104. Y. Li y S. S. Ge, "Colaboración entre humanos y robots basada en la estimación de la intención de movimiento", Transacciones IEEE / ASME sobre mecatrónica, vol. 19, no. 3, págs. 1007–1014, 2013. Ver en: Sitio del editor | Google Académico
  105. Y. Li, K. P. Tee, W. L. Chan, R. Yan, Y. Chua y D. K. Limbu, "Adaptación continua de roles para el control compartido humano-robot", Transacciones IEEE sobre robótica, vol. 31, no. 3, págs. 672–681, 2015. Ver en: Sitio del editor | Google Académico
  106. Y. Li, K. P. Tee, R. Yan, W. L. Chan e Y. Wu, "Un marco de coordinación humano-robot basado en la teoría de juegos y la iteración de políticas", Transacciones IEEE sobre robótica, vol. 32, no. 6, págs. 1408–1418, 2016. Ver en: Sitio del editor | Google Académico
  107. A. Clark, Surfeando la incertidumbre: predicción, acción y la mente encarnada, Oxford University Press, 2015.
  108. J. Zhong, C. Weber y S. Wermter, "Funciones de aprendizaje y codificación de transformación predictiva basada en un modelo de producto horizontal" Redes neuronales y aprendizaje automáticoICANN, págs. 539–546, 2012. Ver en: Google Scholar
  109. J. Zhong, C. Weber y S. Wermter, "Una arquitectura de red predictiva para un comportamiento de acoplamiento robusto y fluido", Revista de robótica conductual, vol. 3, no. 4, págs. 172–180, 2012. Ver en: Google Scholar
  110. W. Prinz, "Planificación de la percepción y la acción", Revista europea de psicología cognitiva, vol. 9, no. 2, págs. 129-154, 1997. Ver en: Sitio del editor | Google Académico
  111. J. Zhong, M. Peniak, J. Tani, T. Ogata y A. Cangelosi, “Entrada sensoriomotora como herramienta de generalización del lenguaje: un modelo neurorobótico para la generación y generalización de combinaciones de sustantivo-verbo con entradas sensoriomotoras”, Tech. Rep., ArXiv, 1605.03261, 2016, arXiv: 1605.03261. Ver en: Google Scholar
  112. H. T.Siegelmann y E. D. Sontag, "Sobre el poder computacional de las redes neuronales", Revista de Ciencias de la Computación y Sistemas, vol. 50, no. 1, págs. 132–150, 1995. Ver en: Sitio del editor | Académico de Google | MathSciNet
  113. J. Zhong, Modelos neuronales artificiales para vías de retroalimentación para la integración sensoriomotora.
  114. J. Tani, M. Ito e Y. Sugita, "Autoorganización de esquemas de comportamiento múltiple representados de forma distribuida en un sistema espejo: revisiones de experimentos con robots utilizando RNNPB", Redes neuronales, vol. 17, no. 8-9, págs. 1273–1289, 2004. Ver en: Sitio del editor | Google Académico
  115. W. Hinoshita, H. Arie, J. Tani, H. G. Okuno y T. Ogata, "Emergencia de la estructura jerárquica que refleja la composición lingüística en una red neuronal recurrente", Redes neuronales, vol. 24, no. 4, págs. 311–320, 2011. Ver en: Sitio del editor | Google Académico
  116. J. Tani, Explorando mentes robóticas: acciones, símbolos y conciencia como fenómenos dinámicos autoorganizados, Oxford University Press, 2016. Ver en: Sitio del editor
  117. A. Ahmadi y J. Tani, “¿Cómo puede un modelo de codificación predictiva neurodinámica recurrente hacer frente a la fluctuación en los patrones temporales? Experimentos robóticos sobre interacción imitativa " Redes neuronales, vol. 92, págs. 3–16, 2017. Ver en: Sitio para editores | Google Académico
  118. J. Zhong, A. Cangelosi y S. Wermter, "Hacia un modelo neural pre-simbólico autoorganizado que representa primitivas sensoriomotoras", Fronteras en neurociencia del comportamiento, vol. 8, artículo no. 22, 2014. Ver en: Sitio del editor | Google Académico
  119. H. K. Abbas, R. M. Zablotowicz y H. A. Bruns, “Modelización de la colonización del maíz por toxigénicos y no toxigénicos Aspergillus flavus cepas: implicaciones para el control biológico ", Diario mundial de micotoxinas, vol. 1, no. 3, págs. 333–340, 2008. Ver en: Sitio del editor | Google Académico
  120. J. Zhong y L. Canamero, “Del espacio afectivo continuo al espacio de expresión continuo: reconocimiento y generación de conductas no verbales”, en Actas de la 4a Conferencia Internacional Conjunta de IEEE sobre Desarrollo y Aprendizaje y sobre Robótica Epigenética, IEEE ICDL-EPIROB 2014, págs. 75–80, ita, octubre de 2014. Ver en: Sitio del editor | Google Académico
  121. J. Zhong, A. Cangelosi y T. Ogata, "Toward Abstraction from Multi-modal Data: Empirical Studies on Multiple Time-scale Recurrent Models", en Actas de la Conferencia conjunta internacional sobre redes neuronales artificiales (IJCNN), 2017. Ver en: Google Scholar
  122. G. Park y J. Tani, "Desarrollo de la congruencia comunicable contextual y composicional en robots mediante el uso de modelos dinámicos de redes neuronales", Redes neuronales, vol. 72, págs. 109-122, 2015. Ver en: Sitio del editor | Google Académico
  123. A. Ahmadi y J. Tani, “Reduciendo la brecha entre modelos probabilísticos y deterministas: un estudio de simulación sobre un modelo de red neuronal recurrente de codificación predictiva de Bayes variacional”, 2017, https://arxiv.org/abs/1706.10240. Ver en: Google Scholar
  124. Y. LeCun, Y. Bengio y G. Hinton, "Deep learning", Naturaleza, vol. 521, no. 7553, págs. 436–444, 2015. Ver en: Sitio del editor | Google Académico
  125. J. Schmidhuber, "Aprendizaje profundo en redes neuronales: una descripción general", Redes neuronales, vol. 61, págs. 85-117, 2015. Ver en: Sitio del editor | Google Académico
  126. A. Krizhevsky, I. Sutskever y G. E. Hinton, "Clasificación de Imagenet con redes neuronales convolucionales profundas", en Actas de la 26a Conferencia Anual sobre Sistemas de Procesamiento de Información Neural (NIPS '12), págs. 1097–1105, Lake Tahoe, Nev, EE. UU., diciembre de 2012. Ver en: Google Scholar
  127. W. Liu, Z. Wang, X. Liu, N. Zeng, Y. Liu y F. E. Alsaadi, "Un estudio de las arquitecturas de redes neuronales profundas y sus aplicaciones", Neurocomputación, vol. 234, págs. 11–26, 2017. Ver en: Sitio para editores | Google Académico
  128. G. E. Hinton y R. R. Salakhutdinov, "Reducir la dimensionalidad de los datos con redes neuronales", Asociación Estadounidense para el Avance de la Ciencia: Ciencia, vol. 313, no. 5786, págs. 504–507, 2006. Ver en: Sitio del editor | Académico de Google | MathSciNet
  129. BC Pijanowski, A. Tayyebi, J. Doucette, BK Pekin, D. Braun y J. Plourde, “Una simulación de crecimiento urbano de big data a escala nacional: configurar el modelo de transformación de la tierra basado en redes neuronales y GIS para que se ejecute en un nivel alto Entorno de Performance Computing (HPC) ” Software de modelado ambiental y amplificador, vol. 51, págs. 250–268, 2014. Ver en: Sitio del editor | Google Académico
  130. D. C. Cireşan, U. Meier, L. M. Gambardella y J. Schmidhuber, "Redes neuronales simples, grandes y profundas para el reconocimiento de dígitos escritos a mano", Computación neuronal, vol. 22, no. 12, págs. 3207–3220, 2010. Ver en: Sitio del editor | Google Académico

Derechos de autor

Copyright & # xa9 2017 Yiming Jiang et al. Este es un artículo de acceso abierto distribuido bajo la licencia de atribución de Creative Commons, que permite el uso, distribución y reproducción sin restricciones en cualquier medio, siempre que el trabajo original se cite correctamente.


Vea cómo Smartsheet puede ayudarlo a ser más efectivo

Vea la demostración para ver cómo puede administrar de manera más efectiva su equipo, proyectos y procesos con la administración del trabajo en tiempo real en Smartsheet.

Cómo funciona el modelo biológico de redes neuronales

¿Qué están emulando las redes neuronales en la estructura del cerebro humano y cómo funciona el entrenamiento?

Todos los cerebros de los mamíferos están formados por neuronas interconectadas que transmiten señales electroquímicas. Las neuronas tienen varios componentes: el cuerpo, que incluye un núcleo y dendritas axones, que se conectan a otras células y axones terminales o sinapsis, que transmiten información o estímulos de una neurona a otra. Combinada, esta unidad realiza funciones de comunicación e integración en el sistema nervioso. El cerebro humano tiene una gran cantidad de unidades de procesamiento (86 mil millones de neuronas) que permiten el desempeño de funciones altamente complejas.

Cómo funcionan las redes neuronales artificiales

Las RNA son modelos estadísticos diseñados para adaptarse y autoprogramarse mediante el uso de algoritmos de aprendizaje para comprender y clasificar conceptos, imágenes y fotografías. Para que los procesadores hagan su trabajo, los desarrolladores los organizan en capas que operan en paralelo. los capa de entrada es análogo a las dendritas en la red neuronal del cerebro humano. los capa oculta es comparable al cuerpo de la celda y se encuentra entre la capa de entrada y capa de salida (que es similar a las salidas sinápticas en el cerebro). La capa oculta es donde las neuronas artificiales reciben un conjunto de entradas basadas en peso sináptico, que es la amplitud o fuerza de una conexión entre nodos. Estas entradas ponderadas generan una salida a través de una función de transferencia a la capa de salida.

¿Cómo se entrena una red neuronal?

Una vez que haya estructurado una red para una aplicación en particular, comienza la capacitación (es decir, el aprendizaje). Hay dos enfoques para la formación. Aprendizaje supervisado proporciona a la red los resultados deseados mediante la clasificación manual del rendimiento de la red o mediante la entrega de los resultados y las entradas deseados. Aprendizaje sin supervisión ocurre cuando la red da sentido a las entradas sin asistencia o instrucción externa.

Todavía queda un largo camino por recorrer en el ámbito del aprendizaje no supervisado. “Obtener información de datos no etiquetados, [un proceso] que llamamos aprendizaje no supervisado, es un tema muy candente en este momento, pero claramente no es algo que hayamos descifrado todavía. Es algo que todavía cae en la columna del desafío ", observa Yoshua Bengio de la Universidad de Montreal en el artículo" El auge de las redes neuronales y el aprendizaje profundo en nuestra vida cotidiana ".

Bengio se refiere al hecho de que la cantidad de redes neuronales no puede coincidir con la cantidad de conexiones en el cerebro humano, pero la capacidad de la primera para ponerse al día puede estar en el horizonte. La Ley de Moore, que establece que la potencia de procesamiento general de las computadoras se duplicará cada dos años, nos da una pista sobre la dirección en la que se dirigen las redes neuronales y la inteligencia artificial. El director ejecutivo de Intel, Brian Krzanich, afirmó en el Computer Electronics Show de 2017 que "la ley de Moore está viva y floreciente". Desde sus inicios a mediados del siglo XX, la capacidad de "pensar" de las redes neuronales ha estado cambiando nuestro mundo a un ritmo increíble.

Una breve historia de las redes neuronales

Las redes neuronales se remontan a principios de la década de 1940, cuando los matemáticos Warren McCulloch y Walter Pitts construyeron un sistema simple basado en algoritmos diseñado para emular la función del cerebro humano. El trabajo en el campo se aceleró en 1957 cuando Frank Rosenblatt de la Universidad de Cornell concibió la perceptrón, el algoritmo innovador desarrollado para realizar tareas de reconocimiento complejas. Durante las cuatro décadas que siguieron, la falta de potencia informática necesaria para procesar grandes cantidades de datos frenó los avances. En la década de 2000, gracias al advenimiento de una mayor potencia informática y hardware más sofisticado, así como a la existencia de vastos conjuntos de datos para extraer, los científicos informáticos finalmente tuvieron lo que necesitaban, y las redes neuronales y la inteligencia artificial despegaron, sin fin. conocimiento. Para comprender cuánto se ha expandido el campo en el nuevo milenio, considere que el noventa por ciento de los datos de Internet se han creado desde 2016. Ese ritmo seguirá acelerándose, gracias al crecimiento de Internet de las cosas (IoT).

¿Por qué utilizamos redes neuronales?

Los atributos humanos de las redes neuronales y la capacidad para completar tareas en infinitas permutaciones y combinaciones las hacen especialmente adecuadas para las aplicaciones actuales basadas en big data. Debido a que las redes neuronales también tienen la capacidad única (conocida como lógica difusa) para dar sentido a datos ambiguos, contradictorios o incompletos, pueden utilizar procesos controlados cuando no se dispone de modelos exactos.

Según un informe publicado por Statista, en 2017, los volúmenes de datos globales alcanzaron cerca de 100,000 petabytes (es decir, un millón de gigabytes) por mes y se prevé que alcancen los 232,655 petabytes para 2021. Con empresas, individuos y dispositivos generando grandes cantidades de información , todos esos macrodatos son valiosos y las redes neuronales pueden encontrarle sentido.

Atributos de las redes neuronales

Con la capacidad similar a la humana para resolver problemas, y aplicar esa habilidad a enormes conjuntos de datos, las redes neuronales poseen los siguientes atributos poderosos:

Aprendizaje adaptativo: Al igual que los humanos, las redes neuronales modelan relaciones complejas y no lineales y se basan en conocimientos previos. Por ejemplo, el software utiliza el aprendizaje adaptativo para enseñar matemáticas y artes del lenguaje.

Autoorganización: La capacidad de agrupar y clasificar grandes cantidades de datos hace que las redes neuronales sean especialmente adecuadas para organizar los complicados problemas visuales que plantea el análisis de imágenes médicas.

Operación en tiempo real: Las redes neuronales pueden (a veces) proporcionar respuestas en tiempo real, como es el caso de los vehículos autónomos y la navegación con drones.

Pronóstico: La capacidad de NN para predecir basándose en modelos tiene una amplia gama de aplicaciones, incluso para el clima y el tráfico.

Tolerancia a fallos: Cuando se pierden o faltan partes importantes de una red, las redes neuronales pueden llenar los espacios en blanco. Esta capacidad es especialmente útil en la exploración espacial, donde siempre existe la posibilidad de que fallen los dispositivos electrónicos.

Tareas que realizan las redes neuronales

Las redes neuronales son muy valiosas porque pueden realizar tareas para dar sentido a los datos mientras conservan todos sus otros atributos. Estas son las tareas críticas que realizan las redes neuronales:

Clasificación: Los NN organizan patrones o conjuntos de datos en clases predefinidas.

Predicción: Producen la salida esperada a partir de una entrada determinada.

Agrupación: Identifican una característica única de los datos y la clasifican sin ningún conocimiento de datos previos.

Asociar: Puede entrenar redes neuronales para "recordar" patrones. Cuando muestra una versión desconocida de un patrón, la red la asocia con la versión más comparable en su memoria y vuelve a la última.

Las redes neuronales son fundamentales para aprendizaje profundo, un conjunto sólido de técnicas de NN que se presta para resolver problemas abstractos, como bioinformática, diseño de fármacos, filtrado de redes sociales y traducción de lenguaje natural. El aprendizaje profundo es donde resolveremos los problemas más complicados en ciencia e ingeniería, incluida la robótica avanzada. A medida que las redes neuronales se vuelven más inteligentes y rápidas, avanzamos a diario.

Aplicaciones industriales y del mundo real de las redes neuronales

Como señala un artículo del New York Times de agosto de 2018, “Las empresas y agencias gubernamentales que han comenzado a incorporar el software de automatización abarcan toda la gama. Entre ellos se incluyen General Motors, BMW, General Electric, Unilever, MasterCard, Manpower, FedEx, Cisco, Google, el Departamento de Defensa y la NASA ". Estamos viendo el comienzo de las aplicaciones de redes neuronales / IA que cambian la forma en que funciona nuestro mundo.

H3: Aplicaciones de ingeniería de redes neuronales

La ingeniería es donde las aplicaciones de redes neuronales son esenciales, particularmente en los "sistemas de alta seguridad que han surgido en varios campos, incluido el control de vuelo, la ingeniería química, las centrales eléctricas, el control automotriz, los sistemas médicos y otros sistemas que requieren autonomía". (Fuente: Aplicación de redes neuronales en sistemas de alta seguridad: una encuesta).

Preguntamos a dos expertos del sector de la ingeniería cómo sus aplicaciones mejoran el comercio minorista, la fabricación, el petróleo y el gas, la navegación y la recuperación de información en entornos de oficina.

Las personas usan tecnología inalámbrica, que permite que los dispositivos se conecten a Internet o se comuniquen entre sí dentro de un área en particular, en muchos campos diferentes para reducir costos y mejorar la eficiencia. Huw Rees, vicepresidente de ventas y marketing de amplificador de KodaCloud, una aplicación diseñada para optimizar el rendimiento de Wi-Fi, describe solo algunos usos.

Rees ofrece algunos ejemplos cotidianos del uso de Wi-Fi: “Las cadenas de supermercados utilizan escáneres Wi-Fi para escanear productos dentro y fuera de sus centros de distribución y mercados individuales. Si el Wi-Fi no funciona bien, se interrumpen empresas enteras. Las preocupaciones sobre la fabricación y el petróleo y el gas también son buenos ejemplos de negocios en los que el Wi-Fi es fundamental para la misión, porque garantizar la confiabilidad y la optimización es un requisito absoluto ”, dice.

El Wi-Fi es excelente, pero requiere mucha supervisión para hacer su trabajo. “La mayoría de las soluciones de redes de área local inalámbricas empresariales o de gran escala requieren un monitoreo y ajuste casi constante por parte de expertos en Wi-Fi altamente capacitados, una forma costosa de garantizar que la red funcione de manera óptima”, señala Rees. “KodaCloud resuelve ese problema a través de un sistema inteligente que utiliza algoritmos y mediante el aprendizaje adaptativo, que genera un ciclo de auto-mejora”, agrega.

Rees comparte cómo la tecnología KodaCloud aprovecha las redes neuronales para mejorar continuamente: “La red aprende y se cura a sí misma basándose en el aprendizaje tanto global como local. A continuación, se muestra un ejemplo global: el sistema descubre que se ha implementado un nuevo sistema operativo Android y requiere cambios de configuración y de umbral adicionales para funcionar de manera óptima. Una vez que el sistema ha realizado los ajustes y las mejoras de medición necesarias para esta actualización, aplica este conocimiento a todos los demás clientes de KodaCloud instantáneamente, por lo que el sistema reconoce inmediatamente cualquier dispositivo similar y resuelve problemas. Para un ejemplo local, digamos que el sistema aprende el entorno de radiofrecuencia local para cada punto de acceso. Luego, cada dispositivo se conecta a cada punto de acceso, lo que da como resultado cambios de umbral en los parámetros de radio del dispositivo local. A nivel mundial y local, el proceso es un ciclo continuo para optimizar la calidad de Wi-Fi para cada dispositivo ".

Una tecnología de rápido desarrollo, los drones se utilizan en operaciones de socorro en casos de desastre, exploración de petróleo, gas y minerales, vigilancia aérea, bienes raíces y construcción, y realización de películas. Neill McOran-Campbell es CEO de Aeiou.tech, que diseña tecnología avanzada de drones para su uso en muchos sectores diferentes. “Nuestra plataforma Dawn es una serie de sensores a bordo y una computadora complementaria que permite que prácticamente cualquier sistema aéreo no tripulado utilice la amplia gama de beneficios que ofrece la IA, desde la mecánica de vuelo, como la navegación y la evitación de obstáculos, hasta servicios como la infraestructura. inspección o entrega de paquetes ”, dice McOran-Campbell.

McOran-Campbell explica cómo funciona Dawn basándose en dos niveles de biología: “En el primer nivel, usamos RNA para procesar información sin procesar. Hay tres tipos diferentes de redes que usamos: redes neuronales recurrentes, que usan el pasado para informar predicciones sobre las futuras redes neuronales convolucionales, que usan paquetes de neuronas 'deslizantes' (generalmente usamos este tipo para procesar imágenes) y neuronales más convencionales. redes, es decir, redes reales de neuronas. Las redes neuronales convencionales son muy útiles para problemas como la navegación, especialmente cuando se combinan con elementos recurrentes.

“En el segundo nivel más sofisticado, la estructura de Dawn emula la mejor arquitectura que existe para procesar información: el cerebro humano. Esto nos permite desglosar el problema altamente complejo de la autonomía de la misma manera que lo hace la biología: con "córtex" compartimentadas, cada una con sus redes neuronales y cada una con sus vías de comunicación y estructuras jerárquicas de mando. El resultado es que la información fluye en ondas a través de las cortezas de la misma manera que lo hace en el cerebro. [En ambos casos, el proceso se optimiza] para lograr efectividad y eficiencia en el procesamiento de la información ”, explica.

A continuación, se incluye una lista de otras aplicaciones de ingeniería de redes neuronales que se utilizan actualmente en diversas industrias:

Aeroespacial: simulaciones y detectores de fallas de componentes de aeronaves, sistemas de control de aeronaves, pilotaje automático de alto rendimiento y simulaciones de trayectoria de vuelo

Automotriz: sistemas de guía mejorados, desarrollo de trenes de potencia, sensores virtuales y analizadores de actividad de garantía

Electrónica: análisis de fallas de chips, diseños de chips de circuitos, visión artificial, modelado no lineal, predicción de la secuencia de código, control de procesos y síntesis de voz

Fabricación: análisis de diseño de productos químicos, modelado dinámico de sistemas de procesos químicos, control de procesos, diagnóstico de procesos y máquinas, diseño y análisis de productos, predicción de la calidad del papel, licitación de proyectos, planificación y gestión, análisis de calidad de chips de computadora, sistemas de inspección visual de calidad y análisis de la calidad de la soldadura

Mecánica: monitoreo de condiciones, modelado y control de sistemas

Robótica: robots de montacargas, controladores de manipuladores, control de trayectoria y sistemas de visión.

Telecomunicaciones: control de red de cajeros automáticos, servicios de información automatizados, sistemas de procesamiento de pagos de clientes, compresión de datos, ecualizadores, gestión de fallas, reconocimiento de escritura a mano, diseño de red, administración, enrutamiento y control, monitoreo de red, traducción en tiempo real del lenguaje hablado y reconocimiento de patrones ( caras, objetos, huellas dactilares, análisis semántico, corrector ortográfico, procesamiento de señales y reconocimiento de voz)

Aplicaciones comerciales de redes neuronales:

Las aplicaciones comerciales del mundo real para redes neuronales están en auge. En algunos casos, las NN ya se han convertido en el método elegido por las empresas que utilizan análisis de fondos de cobertura, segmentación de marketing y detección de fraudes. A continuación, presentamos algunos innovadores de redes neuronales que están cambiando el panorama empresarial.

En un momento en el que encontrar trabajadores calificados para trabajos específicos se está volviendo cada vez más difícil, especialmente en el sector tecnológico, las redes neuronales y la inteligencia artificial están moviendo la aguja. Ed Donner, cofundador y director ejecutivo de untapt, utiliza redes neuronales e inteligencia artificial para resolver desafíos de talento y recursos humanos, como la ineficiencia en la contratación, la escasa retención de empleados, la insatisfacción con el trabajo y más. "Al final, creamos un modelo de aprendizaje profundo que puede asignar a las personas a roles en los que es más probable que tengan éxito, todo en cuestión de milisegundos", explica Donner.

“Las redes neuronales y la inteligencia artificial tienen un alcance increíble y puedes usarlas para ayudar en las decisiones humanas en cualquier sector. El aprendizaje profundo no fue la primera solución que probamos, pero superó constantemente al resto en la predicción y mejora de las decisiones de contratación. Entrenamos nuestra red neuronal de 16 capas en millones de puntos de datos y decisiones de contratación, para que mejore cada vez más. Es por eso que soy un defensor de que todas las empresas inviertan en inteligencia artificial y aprendizaje profundo, ya sea en recursos humanos o en cualquier otro sector. Los negocios se basan cada vez más en datos, por lo que las empresas deberán aprovechar la inteligencia artificial para seguir siendo competitivas ”, recomienda Donner.

El campo de las redes neuronales y su uso de big data puede ser de alta tecnología, pero su propósito final es servir a las personas. En algunos casos, el vínculo con los beneficios humanos es muy directo, como es el caso del servicio de inteligencia artificial de OKRA.

“La plataforma de OKRA ayuda a las partes interesadas en el cuidado de la salud y la biofarma a tomar mejores decisiones basadas en evidencia en tiempo real, y responde a preguntas relacionadas con el tratamiento y de marca para diferentes mercados”, enfatiza Loubna Bouarfa, directora ejecutiva y fundadora de Okra Technologies y nombrada miembro de la Grupo de expertos de alto nivel de la Comisión Europea sobre IA. “En el cuidado de crianza, aplicamos redes neuronales e inteligencia artificial para emparejar a los niños con cuidadores de crianza que brindarán la máxima estabilidad. También aplicamos las tecnologías para ofrecer apoyo en la toma de decisiones en tiempo real a los cuidadores sociales y la familia de acogida con el fin de beneficiar a los niños ”, continúa.

Al igual que muchas empresas de inteligencia artificial, OKRA aprovecha su tecnología para hacer predicciones utilizando múltiples fuentes de big data, incluidos CRM, registros médicos y mediciones de consumidores, ventas y marcas. Luego, explica Bouarfa, "utilizamos algoritmos de aprendizaje automático de última generación, como redes neuronales profundas, aprendizaje por conjuntos, reconocimiento de temas y una amplia gama de modelos no paramétricos para obtener información predictiva que mejore la vida humana".

Según el Fondo Mundial para la Investigación del Cáncer, el melanoma es el decimonoveno cáncer más común en todo el mundo. Una de cada cinco personas en el planeta desarrolla cáncer de piel, y la detección temprana es esencial para prevenir la muerte relacionada con el cáncer de piel. Hay una aplicación para eso: una aplicación de teléfono para realizar autocomprobaciones de fotos con un teléfono inteligente.

“SkinVision utiliza nuestro algoritmo matemático patentado para construir un mapa estructural que revela los diferentes patrones de crecimiento de los tejidos involucrados”, dice Matthew Enevoldson, Gerente de Relaciones Públicas de SkinVision.

Enevoldson agrega que la aplicación del teléfono funciona rápido: “En solo 30 segundos, la aplicación indica qué puntos en la piel necesitan ser rastreados a lo largo del tiempo y le da a la imagen una indicación de riesgo bajo, medio o alto. Los datos más recientes muestran que nuestro servicio tiene una especificidad del 80 por ciento y una sensibilidad del 94 por ciento, muy por encima de la de un dermatólogo (una sensibilidad del 75 por ciento), un dermatólogo especialista (una sensibilidad del 92 por ciento) o un médico general. (una sensibilidad del 60 por ciento). Nuestro equipo de dermatólogos y expertos en reconocimiento de imágenes verifica cada foto por motivos de calidad. Las fotos de alto riesgo se marcan y, en un plazo de 48 horas, los usuarios reciben asesoramiento médico personal de un médico sobre los próximos pasos ". La aplicación tiene 1,2 millones de usuarios en todo el mundo.

Hacer un seguimiento de los datos en cualquier entorno de trabajo y hacer un buen uso de ellos puede ser un desafío. Rob May es director ejecutivo y cofundador de Talla, una empresa que crea "trabajadores digitales" que ayudan a los empleados con las tareas diarias relacionadas con la recuperación, el acceso y el mantenimiento de la información. “Brindamos a las empresas la capacidad de adoptar la IA de una manera significativa y comenzar a realizar mejoras inmediatas en la productividad de los empleados y el intercambio de conocimientos en toda la organización”, explica May. “Si una empresa almacena la documentación de sus productos en Talla, sus representantes de ventas pueden acceder instantáneamente a esa información durante las llamadas de ventas. Esta capacidad de acceder de forma inmediata y sencilla a información precisa, verificada y actualizada tiene un impacto directo en los ingresos. Al tener la información entregada a los empleados cuando la necesitan, el proceso de incorporación y capacitación de nuevos representantes se vuelve mejor, más rápido y menos costoso ".

La tecnología de redes neuronales de Talla se basa en diferentes enfoques de aprendizaje. "Utilizamos la coincidencia semántica, la traducción automática neuronal, el aprendizaje activo y el modelado de temas para aprender qué es relevante e importante para su organización, y brindamos una mejor experiencia con el tiempo", dice. May diferencia la visión de Talla sobre la IA: “Esta tecnología ha levantado el capó de la IA, lo que permite a los usuarios entrenar contenido basado en el conocimiento con técnicas avanzadas de IA. Talla brinda a los usuarios el poder de hacer que su información sea más visible, procesable y relevante para los empleados. Los creadores de contenido pueden capacitar a Talla para identificar contenido similar, responder preguntas e identificar brechas de conocimiento ".

A continuación, se muestran más ejemplos actuales de aplicaciones comerciales de NN:

Bancario: Desgaste de tarjetas de crédito, evaluación de solicitudes de crédito y préstamo, evaluación de fraude y riesgo, y morosidad de préstamos

Análisis de negocio: Modelado de comportamiento del cliente, segmentación de clientes, propensión al fraude, investigación de mercado, mezcla de mercado, estructura de mercado y modelos de deserción, incumplimiento, compra y renovaciones.

Defensa: Contraterrorismo, reconocimiento facial, extracción de características, supresión de ruido, discriminación de objetos, sensores, sonar, procesamiento de señales de radar y de imágenes, identificación de señales / imágenes, seguimiento de objetivos y dirección de armas

Educación: Software de aprendizaje adaptativo, pronóstico dinámico, análisis y pronóstico del sistema educativo, modelado del desempeño de los estudiantes y perfiles de personalidad.

Financiero: Calificaciones de bonos corporativos, análisis financiero corporativo, análisis de uso de líneas de crédito, predicción de precios de divisas, asesoramiento de préstamos, evaluación de hipotecas, tasación de bienes raíces y negociación de carteras

Médico: Análisis de células cancerosas, análisis de ECG y EEG, asesoramiento sobre pruebas en la sala de emergencias, reducción de gastos y mejora de la calidad de los sistemas hospitalarios, optimización del proceso de trasplante y diseño de prótesis

Valores: Sistemas automáticos de asesoramiento de negociación de acciones, análisis de mercado y calificación de bonos

Transporte: Sistemas de enrutamiento, sistemas de diagnóstico de frenos de camiones y programación de vehículos.

El uso de redes neuronales parece imparable. “Con el avance de las tecnologías informáticas y de la comunicación, todo el proceso de hacer negocios ha experimentado un cambio masivo. Cada vez más sistemas basados ​​en el conocimiento se han abierto camino en un gran número de empresas ”, hallaron los investigadores Nikhil Bhargava y Manik Gupta en" Aplicación de redes neuronales artificiales en aplicaciones comerciales ".

¿Cuáles son los tipos de redes neuronales?

Las redes neuronales son conjuntos de algoritmos destinados a reconocer patrones e interpretar datos mediante agrupamiento o etiquetado. En otras palabras, las redes neuronales son algoritmos. A algoritmo de entrenamiento es el método que utiliza para ejecutar el proceso de aprendizaje de la red neuronal. Como hay una gran cantidad de algoritmos de entrenamiento disponibles, cada uno de los cuales consta de características y capacidades de rendimiento variadas, se utilizan diferentes algoritmos para lograr diferentes objetivos.

En conjunto, los ingenieros de aprendizaje automático desarrollan muchos miles de nuevos algoritmos a diario. Por lo general, estos nuevos algoritmos son variaciones de arquitecturas existentes y utilizan principalmente datos de entrenamiento para hacer proyecciones o construir modelos del mundo real.

A continuación, se ofrece una guía de algunos de los algoritmos de redes neuronales habituales en la actualidad. Para mayor claridad sobre términos desconocidos, puede consultar los glosarios en la sección de recursos de este artículo.

Una guía para principiantes sobre algoritmos comunes de redes neuronales

Algoritmo Objetivo
Codificador automático (AE) Por lo general, utiliza EA para reducir el número de variables aleatorias en consideración, de modo que el sistema pueda aprender una representación de un conjunto de datos y, por lo tanto, procesar modelos de datos generativos.
Red neuronal bidireccional recurrente (BRNN) El objetivo de un BRNN es aumentar las entradas de información disponibles para la red conectando dos capas ocultas opuestas direccionalmente a la misma salida. Usando BRNN, la capa de salida puede obtener información de estados pasados ​​y futuros.
Máquina de Boltzmann (BM) Una red neuronal recurrente, este algoritmo es capaz de aprender representaciones internas y puede representar y resolver problemas combinados difíciles.
Red neuronal convolucional (CNN) Más comúnmente utilizado para analizar imágenes visuales, las CNN son una red neuronal de retroalimentación diseñada para minimizar el preprocesamiento.
Red neuronal deconvolucional (DNN) Los DNN permiten la construcción sin supervisión de representaciones de imágenes jerárquicas. Cada nivel de la jerarquía agrupa la información del nivel anterior para agregar características más complejas a una imagen.
Red de creencias profundas (DBN) Cuando se entrena con un conjunto de ejemplos sin supervisión, un DBN puede aprender a reconstruir sus entradas de manera probabilística mediante el uso de capas como detectores de características. Después de este proceso, puede capacitar a un DBN para realizar clasificaciones supervisadas.
Red de gráficos inversa convolucional profunda (DCIGN) Un modelo DCIGN tiene como objetivo aprender una representación interpretable de imágenes que el sistema separa según los elementos de la estructura tridimensional de la escena, como variaciones de iluminación y rotaciones de profundidad. Un DCIGN utiliza muchas capas de operadores, tanto convolucionales como deconvolucionales.
Red residual profunda (DRN) Los DRN ayudan a manejar modelos y tareas sofisticadas de aprendizaje profundo. Al tener muchas capas, un DRN evita la degradación de los resultados.
Autoencoder de reducción de ruido (DAE) Utiliza DAE para reconstruir datos a partir de entradas de datos corruptos, el algoritmo obliga a la capa oculta a aprender características más sólidas. Como resultado, la salida produce una versión más refinada de los datos de entrada.
Echo State Network (ESN) Un ESN funciona con una red neuronal recurrente fija, grande y aleatoria, en la que cada nodo recibe una señal de respuesta no lineal. El algoritmo establece y asigna aleatoriamente pesos y conectividad para lograr flexibilidad de aprendizaje.
Máquina de aprendizaje extremo (ELM) Este algoritmo aprende las ponderaciones de salida de los nodos ocultos en un paso, creando un modelo lineal. Los ELM pueden generalizar bien y aprender muchas veces más rápido que las redes de retropropagación.
Feed Forward Neural Network (FF o FFNN) y perceptron (P) Estos son los algoritmos básicos para redes neuronales. Una red neuronal feedforward es una red neuronal artificial en la que las conexiones de los nodos no forman un ciclo, un perceptrón es una función binaria con solo dos resultados (arriba / abajo sí / no, 0/1).
Unidad recurrente cerrada (GRU) Las GRU utilizan conexiones a través de secuencias de nodos para realizar tareas de aprendizaje automático asociadas con la agrupación en clústeres y la memoria. Los GRU refinan los resultados mediante el control del flujo de información del modelo.
Red de adversarios generativos (GAN) Este sistema enfrenta a dos redes neuronales, discriminativas y generativas, entre sí. El objetivo es distinguir entre resultados reales y sintéticos para simular tareas conceptuales de alto nivel.
Red Hopfield (HN) Esta forma de red neuronal artificial recurrente es un sistema de memoria asociativa con nodos de umbral binarios. Diseñadas para converger a un mínimo local, las HN proporcionan un modelo para comprender la memoria humana.
Red de Kohonen (KN) Un KN organiza un espacio de problemas en un mapa bidimensional. La diferencia entre los mapas autoorganizados (SOM) y otros enfoques de resolución de problemas es que los SOM utilizan el aprendizaje competitivo en lugar del aprendizaje con corrección de errores.
Máquina de estado líquido (LSM) Conocido como aprendizaje automático de tercera generación (o red neuronal de picos), un LSM agrega el concepto de tiempo como elemento. Los LSM generan la activación de la red de neuronas espacio-temporales, ya que conservan la memoria durante el procesamiento. La física y la neurociencia computacional utilizan LSM.
Memoria a largo / corto plazo (LSTM) LSTM es capaz de aprender o recordar la dependencia del orden en problemas de predicción relacionados con la secuencia. Una unidad LSTM tiene una celda, una puerta de entrada, una puerta de salida y una puerta de olvido. Las celdas retienen valores en intervalos de tiempo arbitrarios. Cada unidad regula los flujos de valor a través de conexiones LSTM. Esta capacidad de secuenciación es esencial en dominios de problemas complejos, como el reconocimiento de voz y la traducción automática.
Cadena de Markov (MC) Un MC es un proceso matemático que describe una secuencia de posibles eventos en los que la probabilidad de cada evento depende exclusivamente del estado alcanzado en el evento anterior. Los ejemplos de uso incluyen predicciones de palabras mecanografiadas y PageRank de Google.
Máquina de Turing neuronal (NTM) Basado en el trabajo de mediados del siglo XX del científico de datos Alan Turing, una NTM realiza cálculos y amplía las capacidades de las redes neuronales al acoplarse con una memoria externa. Los desarrolladores utilizan NTM en robots y lo consideran uno de los medios para construir un cerebro humano artificial.
Redes de funciones de base radial (redes RBF) Los desarrolladores utilizan redes RBF para modelar datos que representan una tendencia o función subyacente. Las redes RBF aprenden a aproximarse a la tendencia subyacente utilizando curvas de campana o clasificadores no lineales. Los clasificadores no lineales analizan más profundamente que los clasificadores lineales simples que trabajan en vectores de menor dimensión. Utiliza estas redes en el control del sistema y en las predicciones de series de tiempo.
Red neuronal recurrente (RNN) Los RNN modelan interacciones secuenciales a través de la memoria. En cada paso de tiempo, un RNN calcula una nueva memoria o un estado oculto dependiendo tanto de la entrada actual como del estado de la memoria anterior. Las aplicaciones incluyen composición musical, control de robots y reconocimiento de acciones humanas.
Máquina de Boltzmann restringida (RBM) Un RBM es un modelo gráfico probabilístico en un entorno no supervisado. Un RBM consta de capas visibles y ocultas, así como las conexiones entre neuronas binarias en cada una de estas capas. Los RBN son útiles para el filtrado, el aprendizaje de características y la clasificación. Los casos de uso incluyen detección de riesgos y análisis comerciales y económicos.
Máquina de vectores de soporte (SVM) Basado en conjuntos de ejemplos de entrenamiento que son relevantes para una de dos categorías posibles, un algoritmo SVM crea un modelo que asigna nuevos ejemplos a una de dos categorías. Luego, el modelo representa los ejemplos como puntos mapeados en el espacio mientras divide esos ejemplos de categorías separadas por la brecha más amplia posible. Luego, el algoritmo mapea nuevos ejemplos en ese mismo espacio y predice a qué categoría pertenecen según el lado del espacio que ocupan. Las aplicaciones incluyen detección de rostros y bioinformática.
Autoencoder variacional (VAE) Un VAE es un tipo específico de red neuronal que ayuda a generar modelos complejos basados ​​en conjuntos de datos. En general, un codificador automático es una red de aprendizaje profundo que intenta reconstruir un modelo o hacer coincidir las salidas de destino con las entradas proporcionadas mediante retropropagación. Un VAE también produce resultados de aprendizaje automático de última generación en las áreas de generación de imágenes y aprendizaje por refuerzo.

¿Qué son las redes neuronales en la minería de datos?

En su artículo "Redes neuronales en minería de datos", Priyanka Guar señala que, "En términos más prácticos, las redes neuronales son herramientas de modelado de datos estadísticos no lineales. Se pueden utilizar para modelar relaciones complejas entre entradas y salidas o para encontrar patrones en los datos. Usando redes neuronales como herramienta, las empresas de almacenamiento de datos están recolectando información de conjuntos de datos en el proceso conocido como procesamiento de datos.”

Gaur continúa: "La diferencia entre estos almacenes de datos y las bases de datos ordinarias es que existe una manipulación real y una fertilización cruzada de los datos, lo que ayuda a los usuarios a tomar decisiones más informadas".

Aunque puede usar redes neuronales para extraer datos, los desarrolladores generalmente no lo hacen porque las NN requieren largos tiempos de entrenamiento y, a menudo, producen modelos difíciles de comprender. Cuando los profesionales deciden usarlos, tienen dos tipos de enfoques de minería de datos de redes neuronales para elegir: uno aprende directamente redes simples y fáciles de entender, mientras que el otro emplea las más complicadas. extracción de reglas, que implica extraer modelos simbólicos de redes neuronales entrenadas.

Computadoras neuronales frente a computadoras convencionales

Una de las principales diferencias entre las computadoras convencionales o tradicionales y las computadoras neuronales es que las máquinas convencionales procesan los datos de forma secuencial, mientras que las redes neuronales pueden hacer muchas cosas a la vez. Estas son algunas de las otras diferencias importantes entre las computadoras convencionales y neuronales:

Seguir instrucciones frente a capacidad de aprendizaje: Las computadoras convencionales aprenden solo mediante la realización de pasos o secuencias establecidas por un algoritmo, mientras que las redes neuronales adaptan continuamente su programación y esencialmente se programan para encontrar soluciones. Las computadoras convencionales están limitadas por su diseño, mientras que las redes neuronales están diseñadas para superar su estado original.

Reglas frente a conceptos e imágenes: Las computadoras convencionales operan a través de funciones lógicas basadas en un conjunto dado de reglas y cálculos. Por el contrario, las redes neuronales artificiales pueden ejecutar funciones lógicas y utilizar conceptos abstractos, gráficos y fotografías. Las computadoras tradicionales se basan en reglas, mientras que las redes neuronales artificiales realizan tareas y luego aprenden de ellas.

Complementario, no igual: Las computadoras algorítmicas convencionales y las redes neuronales se complementan entre sí. Algunas tareas se basan más aritméticamente y no requieren la capacidad de aprendizaje de las redes neuronales. Sin embargo, a menudo, las tareas requieren las capacidades de ambos sistemas. En estos casos, la computadora convencional supervisa la red neuronal para lograr una mayor velocidad y eficiencia.

A pesar de lo impresionantes que son las redes neuronales, todavía están en proceso de desarrollo, presentando desafíos y promesas para el futuro de la resolución de problemas.

Los desafíos de las redes neuronales

Cardinell de Cortx dice que el valor y la implementación de las redes neuronales dependen de la tarea, por lo que es importante comprender los desafíos y las limitaciones: “Nuestro enfoque general es hacer lo que funcione para cada problema específico que estamos tratando de resolver. En muchos de esos casos, eso implica el uso de redes neuronales en otros casos, usamos enfoques más tradicionales ". Cardinell ilustra su punto con este ejemplo: “Por ejemplo, en tiempo perfecto, tratamos de detectar si alguien está usando a o un correctamente. En este caso, usar una red neuronal sería excesivo, porque simplemente puede mirar la pronunciación fonética para tomar la determinación (por ejemplo, una banana Está Mal). Las redes neuronales son donde se están realizando la mayoría de los avances en este momento. Cosas que eran imposibles hace solo uno o dos años con respecto a la calidad del contenido ahora son una realidad ".

Por útiles que puedan ser las redes neuronales, abundan los desafíos en el campo:

Capacitación: Una crítica común a las redes neuronales, particularmente en las aplicaciones de robótica, es que es obligatorio un entrenamiento excesivo para las operaciones del mundo real. Una forma de superar ese obstáculo es barajando ejemplos de entrenamiento al azar. Utilizando un algoritmo de optimización numérica, se toman pequeños pasos, en lugar de grandes, para seguir un ejemplo. Otra forma es agrupando ejemplos en los llamados mini lotes. Mejorar la eficiencia de la formación y las capacidades de convergencia es un área de investigación en curso para los científicos informáticos.

Problemas teóricosSigue habiendo problemas sin resolver, incluso para las redes neuronales más sofisticadas. Por ejemplo, a pesar de sus mejores esfuerzos, a Facebook todavía le resulta imposible identificar todo el discurso de odio y la información errónea mediante el uso de algoritmos. La empresa emplea a miles de revisores humanos para resolver el problema. En general, debido a que las computadoras no son humanas, su capacidad para ser genuinamente creativos (probar teoremas matemáticos, tomar decisiones morales, componer música original o innovar profundamente) está más allá del alcance de las redes neuronales y la inteligencia artificial.

Inautenticidad: Los desafíos teóricos que abordamos anteriormente surgen porque las redes neuronales no funcionan exactamente como lo hacen los cerebros humanos; operan simplemente como un simulacro del cerebro humano. Aún se desconocen los detalles de cómo las neuronas de los mamíferos codifican la información. Las redes neuronales artificiales no replican estrictamente la función neuronal, sino que utilizan las redes neuronales biológicas como inspiración. Este proceso permite la asociación estadística, que es la base de las redes neuronales artificiales. El proceso de aprendizaje de una ANN no es idéntico al de un humano, por lo tanto, sus limitaciones inherentes (al menos por ahora).

Problemas de hardware: El enfoque de este siglo en las redes neuronales se debe al aumento de millones de veces en la potencia de cómputo desde 1991. Una mayor capacidad de hardware ha permitido una mayor multicapa y un aprendizaje profundo posterior, y el uso de unidades de procesamiento de gráficos en paralelo (GPU) ahora reduce los tiempos de capacitación. de meses a días. A pesar de los grandes avances de las NN en los últimos años, a medida que maduran las redes neuronales profundas, los desarrolladores necesitan innovaciones de hardware para satisfacer las crecientes demandas computacionales. La búsqueda está activada y se están desarrollando nuevos dispositivos y chips diseñados específicamente para IA. A 2018 New York Times artículo, “Big Bets on A.I. Open a New Frontier for Chip Startups, también ”, informó que“ los capitalistas de riesgo invirtieron más de $ 1.5 mil millones en nuevas empresas de chips ”en 2017.

Híbridos: Una propuesta para superar algunos de los desafíos de las redes neuronales combina NN con IA simbólica, o representaciones legibles por humanos de búsqueda, lógica y problemas. Para duplicar con éxito la inteligencia humana, es vital traducir el conocimiento procedimental o conocimiento implícito (las habilidades y el conocimiento que no son fácilmente accesibles por la conciencia) los humanos poseen en una forma inequívoca que usa símbolos y reglas. Hasta ahora, las dificultades para desarrollar una IA simbólica han sido irresolubles, pero ese estado puede cambiar pronto.

Los informáticos están trabajando para eliminar estos desafíos. Los líderes en el campo de las redes neuronales y la IA están escribiendo algoritmos más inteligentes, más rápidos y más humanos todos los días. Los ingenieros están impulsando mejoras mediante el uso de un mejor hardware y la polinización cruzada de diferentes hardware y software

El futuro de las redes neuronales

“Necesitamos recordar que las redes neuronales artificiales y el aprendizaje profundo son solo un conjunto de técnicas para desarrollar soluciones a problemas específicos. En este momento, son la 'gran cosa' ”, opina Richard Yonck, fundador y futurista líder de Intelligent Future Consulting y autor de Heart of the Machine: Our Future in a World of Artificial Emotional Intelligence.

Agrega: "Es ese viejo dicho:" Cuando tu única herramienta es un martillo, todo parece un clavo ". Excepto que todo no es un clavo, y el aprendizaje profundo no funciona para todos los problemas. Hay todo tipo de desarrollos por venir en las próximas dos décadas que pueden brindar mejores soluciones: aprendizaje de una sola vez, procesamiento contextual del lenguaje natural, motores de emociones, motores de sentido común y creatividad artificial ".

A continuación, se muestran algunos desarrollos futuros probables en tecnologías de redes neuronales:

Integración de lógica difusa: La lógica difusa reconoce más que simples valores verdaderos y falsos: tiene en cuenta conceptos que son relativos, como algo, a veces y generalmente. La lógica difusa y las redes neuronales están integradas para usos tan diversos como la selección de solicitantes de empleo, ingeniería automotriz, control de grúas de construcción y monitoreo de glaucoma. La lógica difusa será una característica esencial en las futuras aplicaciones de redes neuronales.

Redes neuronales pulsadas: Recientemente, los datos de experimentos neurobiológicos han aclarado que las redes neuronales biológicas de los mamíferos se conectan y se comunican a través de pulsaciones y utilizan la sincronización de las pulsaciones para transmitir información y realizar cálculos. Este reconocimiento ha acelerado una investigación significativa, incluidos análisis teóricos, desarrollo de modelos, modelado neurobiológico y despliegue de hardware, todos con el objetivo de hacer que la computación sea aún más similar a la forma en que funcionan nuestros cerebros.

Hardware especializado: Actualmente hay una explosión de desarrollo para crear el hardware que acelerará y, en última instancia, reducirá el precio de las redes neuronales, el aprendizaje automático y el aprendizaje profundo. Las empresas establecidas y las nuevas empresas están compitiendo para desarrollar chips mejorados y unidades de procesamiento gráfico, pero la verdadera noticia es el rápido desarrollo de las unidades de procesamiento de redes neuronales (NNPU) y otro hardware específico de IA, denominado colectivamente como arquitecturas neurosinápticas. Los chips neurosinápticos son fundamentales para el progreso de la IA porque funcionan más como un cerebro biológico que como el núcleo de una computadora tradicional. Con su tecnología Brain Power, IBM ha sido líder en el desarrollo de chips neurosinápticos. A diferencia de los chips estándar, que funcionan de forma continua, los chips de Brain Power están controlados por eventos y funcionan según sea necesario. La tecnología integra memoria, computación y comunicación.

Mejora de las tecnologías existentes: Habilitadas por el nuevo software y hardware, así como por las tecnologías de redes neuronales actuales y el mayor poder de computación de las arquitecturas neurosinápticas, las redes neuronales solo han comenzado a mostrar lo que pueden hacer. Las innumerables aplicaciones comerciales de métodos de capacitación mejorados y de resolución de problemas más rápidos, más baratos y más parecidos a los humanos son muy lucrativos.

Robótica: Ha habido innumerables predicciones sobre robots que podrán sentirse como nosotros, vernos como nosotros y hacer pronósticos sobre el mundo que los rodea. Estas profecías incluso incluyen algunas versiones distópicas de ese futuro, desde el Terminator serie de películas para Cazarecompensas y Westworld. Sin embargo, el futurista Yonck dice que todavía tenemos un largo camino por recorrer antes de que los robots nos reemplacen: “Si bien estos robots están aprendiendo de manera limitada, es un gran salto decir que están 'pensando'. Hay tantas cosas eso tiene que suceder antes de que estos sistemas puedan pensar verdaderamente de una manera fluida y no frágil. Uno de los factores críticos que menciono en mi libro es la capacidad de establecer y actuar sobre valores autodeterminados en tiempo real, lo que los humanos hacemos miles de veces al día. Sin esto, estos sistemas fallarán cada vez que las condiciones caigan fuera de un dominio predefinido ".

La fusión mental entre cerebros humanos y artificiales, según Yonck, está en nuestro futuro: “Creo que la inteligencia artificial, las redes neuronales artificiales y el aprendizaje profundo eventualmente jugarán un papel mucho más activo en el reentrenamiento de nuestros cerebros, particularmente como interfaces cerebro-computadora (BCI) se vuelven más frecuentes y ampliamente utilizados. El aprendizaje profundo será esencial para aprender a leer e interpretar el lenguaje de un cerebro individual, y se utilizará para optimizar un aspecto diferente del pensamiento: enfoque, análisis, introspección. Eventualmente, este puede ser el camino hacia IA (aumento de inteligencia), una forma de inteligencia combinada que veremos a mediados de este siglo ".

Recursos sobre redes neuronales

El valiente nuevo mundo de las redes neuronales puede ser difícil de entender y está en constante cambio, así que aproveche estos recursos para mantenerse al tanto de los últimos desarrollos.

Las asociaciones de redes neuronales patrocinan conferencias, publican artículos y publicaciones periódicas, y publican los últimos descubrimientos sobre teoría y aplicaciones. A continuación se muestra una lista de algunas de las principales asociaciones de NN y cómo describen sus objetivos organizativos:

La Sociedad Internacional de Redes Neuronales (INNS): La organización es para "personas interesadas en una comprensión teórica y computacional del cerebro y en aplicar ese conocimiento para desarrollar formas nuevas y más efectivas de inteligencia artificial".

Sociedad de Inteligencia Computacional IEEE (IEEE CIS): Esta es una sociedad profesional del Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) que se enfoca en “la teoría, diseño, aplicación y desarrollo de paradigmas computacionales motivados biológica y lingüísticamente que enfatizan las redes neuronales, sistemas conexionistas, algoritmos genéticos, evolutivos programación, sistemas difusos y sistemas inteligentes híbridos en los que están contenidos estos paradigmas ".

Sociedad europea de redes neuronales (ENNS): Esta es una "asociación de científicos, ingenieros, estudiantes y otras personas que buscan aprender y avanzar en nuestra comprensión del modelado de procesos conductuales y cerebrales, desarrollar algoritmos neuronales y aplicar conceptos de modelado neuronal a problemas relevantes en muchos dominios diferentes".

Instituto Internacional de Pronosticadores (IIF): Esta organización está “dedicada a desarrollar y promover la generación, distribución y uso de conocimiento sobre pronósticos”.

La mayoría de los títulos que se proporcionan a continuación se han publicado en los últimos dos años. También hemos incluido algunos clásicos de la disciplina:

Aggarwal, Charu C. Redes neuronales y aprendizaje profundo: un libro de texto. Ciudad de Nueva York: Springer International Publishing, 2018.

Goldberg, Yoav. Métodos de redes neuronales para el procesamiento del lenguaje natural (conferencias de síntesis sobre tecnologías del lenguaje humano). Williston: Morgan & amp Claypool Publishers, 2017.

Hagan, Martin T., Demuth, Howard B. y Beale, Mark H. Diseño de redes neuronales (segunda edición). Martin Hagan, 2014.

Hassoun, Mohamad. Fundamentos de las redes neuronales artificiales. Cambridge: The MIT Press | Un libro de Bradford, 2013.

Haykin, Simon O. Redes neuronales y máquinas de aprendizaje (tercera edición). Chennai: Pearson India, 2008.

Heaton, Jeff. Introducción a las matemáticas de las redes neuronales. Heaton Research, Inc., 2012.

Taylor, Michael. Cree su propia red neuronal: una introducción visual detallada para principiantes. Publicado independientemente, 2017.

El mundo de las redes neuronales tiene su propio lenguaje. Aquí hay algunos recursos para ampliar su vocabulario técnico y comprensión del campo:

Glosario de redes neuronales de la ESA: Una recopilación de términos de redes neuronales del sitio Earthnet Online de las agencias espaciales europeas.

Glosario de redes neuronales medianas: Una lista actualizada con frecuencia de la terminología más reciente del sitio de origen de redacción de tecnología, Medio

Skymind A.I. Glosario Wiki: Un compendio actualizado con frecuencia de términos claramente definidos sobre redes neuronales y redes artificiales profundas.

El futuro del trabajo con procesos automatizados en Smartsheet

Capacite a su gente para que vaya más allá con una plataforma flexible diseñada para satisfacer las necesidades de su equipo y adaptarse a medida que esas necesidades cambien.

La plataforma de Smartsheet facilita la planificación, la captura, la gestión y la generación de informes sobre el trabajo desde cualquier lugar, lo que ayuda a su equipo a ser más eficaz y a hacer más. Genere informes sobre métricas clave y obtenga visibilidad en tiempo real del trabajo a medida que ocurre con informes acumulados, paneles de control y flujos de trabajo automatizados creados para mantener a su equipo conectado e informado.

Cuando los equipos tienen claridad sobre el trabajo que se realiza, no se sabe cuánto más pueden lograr en la misma cantidad de tiempo. Pruebe Smartsheet gratis hoy.


Introducción

El retraso de tiempo existe en muchos sistemas de ingeniería, física, química, biología y economía. En los sistemas de control, el retardo de tiempo debido a la dinámica del sensor y actuador, la transmisión de señales y los cálculos digitales es un factor importante que influye en la estabilidad y el rendimiento del control. Para empeorar las cosas, a menudo se desconoce la demora de tiempo. La estimación del retardo de tiempo en un sistema de control es un problema desafiante. Es aún más desafiante cuando la dinámica del sistema no es lineal y se desconoce. Este artículo presenta una técnica de identificación no paramétrica para identificar sistemas dinámicos no lineales y estimar el retardo de tiempo introducido por el control de retroalimentación.

Se han realizado muchos estudios sobre la identificación del retardo de tiempo de los sistemas de control. Richard presentó una descripción general de los métodos de estimación del retardo de tiempo en [1]. Las técnicas de estimación de retardo de tiempo basadas en entradas pulsadas se han desarrollado en [2, 3]. Aproximación de Padé [4], métodos de mínimos cuadrados modificados y recursivos [5,6,7,8,9], identificación de variables instrumentales [10], redes neuronales [11], estimación algebraica [12, 13], técnicas adaptativas [ 14, 15], y los anillos no conmutativos [16] son ​​sólo algunos métodos populares para la estimación del retardo de tiempo.

Los métodos para la estimación del retardo de tiempo pueden ser en el dominio de la frecuencia o del tiempo [17, 18]. En este artículo, nuestro enfoque está en los enfoques en el dominio del tiempo. Dado que el retardo de tiempo generalmente aparece implícitamente en el sistema, los métodos para la estimación de parámetros convencionales de sistemas dinámicos no se pueden aplicar directamente para estimar el retardo de tiempo. El retardo de tiempo ( tau ) suele aparecer en el término exponencial (e ^ <- tau s> ) en la función de transferencia del sistema. Las técnicas de expansión pueden parametrizarlo, incluida la aproximación clásica de Padé, la serie Laguerre Fourier, la serie Kautz, el cambio Padé de segundo orden y el cambio Padé diagonal. La principal preocupación con la aproximación racional es el error de truncamiento y las complicaciones de estabilidad. Aunque las expansiones de orden superior pueden reducir el error de truncamiento, el sistema puede volverse inestable incluso cuando el sistema es lineal con un retardo de tiempo constante [1]. En este artículo, empleamos la expansión de Taylor. Xu demuestra que la expansión de Taylor de bajo orden proporciona una estimación prometedora de un retardo de tiempo pequeño [19].

El trabajo en [20] presenta un algoritmo no lineal basado en mínimos cuadrados en el que el método de la variable instrumental estima los parámetros de la función de transferencia del sistema mientras que una iteración adaptativa basada en gradiente encuentra el retardo de tiempo óptimo a partir de los datos muestreados irregularmente filtrados. El principal problema con este algoritmo es que la función de costo propuesta puede tener varios mínimos locales. Por lo tanto, depende en gran medida de la estimación inicial de los parámetros y, especialmente, del retraso de tiempo. Para abordar este problema, los autores utilizan un filtro de paso bajo para ampliar la región de convergencia alrededor del mínimo global. Otro algoritmo de optimización recursiva no lineal se propone en [21], que combina el método lineal de Levenberg-Marquardt para calcular los parámetros de la planta con un algoritmo de Gauss-Newton modificado para estimar los retrasos de tiempo. Se aplica un filtro de paso bajo y una transformación binaria a los datos corrompidos por el ruido blanco para crear la matriz regresora para minimizar una función de costo cuadrático del error de estimación. La identificación está en línea y se demuestra en una planta MISO con múltiples retrasos. De manera similar, el algoritmo en [9] emplea el método de Gauss-Newton para estimar el retardo de tiempo cuando la variable instrumental refinada simplificada (SRIVC) se utiliza para encontrar los parámetros de la planta.

La expansión de Taylor se utiliza para parametrizar el sistema con retardo de tiempo explícito en [15]. Se propone una ley adaptativa para la estimación de parámetros de manera que el error de estimación sea convergente. Se introduce una fórmula recursiva en [6] para mejorar la precisión y la tasa de convergencia de otro algoritmo recursivo para la estimación en línea en [22]. La estrategia en [8] tiene como objetivo la identificación de retardo de tiempo fraccional para sistemas de tiempo discreto. Separa la influencia de la estructura del sistema y el retardo de tiempo discretizando el sistema. Con la ayuda del filtro de Kalman, los parámetros se estiman de forma recursiva. El algoritmo en [11] primero parametriza el sistema mediante una función polinomial y entrena una red neuronal para estimar los parámetros y el retardo de tiempo. Una medida ( sigma ) de Schweizer y Wolff denotada como ( sigma _) de la teoría de la cópula se introduce para estudiar la relación de señales de entrada-salida para sistemas SISO [23]. Se encuentra que la medida alcanza su máximo cuando se elimina el retardo de tiempo de los datos. Esta propiedad ofrece un enfoque para estimar el retardo de tiempo sin la necesidad de estimar otros parámetros.

La mayoría de los métodos existentes para la estimación del retardo de tiempo se basan en el conocimiento del modelo del sistema. En este trabajo, proponemos la aplicación de una técnica de identificación de sistemas no paramétricos recientemente desarrollada a la estimación del retardo de tiempo. Brunton y sus colegas propusieron un método llamado identificación dispersa de dinámica no lineal (SINDy) en 2016 para crear una representación dispersa de la función no lineal desconocida del sistema [24]. El método ha atraído una gran atención de la comunidad. Supone que solo se necesitan unos pocos términos importantes de una biblioteca de funciones para describir la dinámica del sistema. Combina el aprendizaje automático y las técnicas de promoción de la dispersión para encontrar la representación dispersa en el espacio de posibles funciones para modelar sistemas dinámicos no lineales. La conexión del método SINDy con los criterios de información de Akaike (AIC) para la selección del modelo se ha estudiado en [25]. Se han obtenido resultados prometedores para problemas de identificación de sistemas como los sistemas dinámicos híbridos, el sistema caótico de Lorenz y la ecuación diferencial parcial de Burger [25, 26]. El método SINDy aplicado al modelo de control predictivo ofrece un mejor rendimiento, requiere significativamente menos datos y es más eficiente desde el punto de vista computacional y más robusto al ruido que el modelo de redes neuronales [27].La solidez al ruido y el requisito de mediciones de derivadas son problemas con el enfoque SINDy [28]. Los derivados regularizados de variación total se utilizan comúnmente para estimar los derivados [29, 30]. En [31] se propone una forma integral de ecuaciones de movimiento en combinación con regresión dispersa. En [32] se informa una aplicación para la identificación de modelos de sistemas mecánicos no lineales.

En casos prácticos, los datos suelen estar contaminados con ruido. Fliess y Ramirez propusieron una técnica de identificación algebraica rápida y robusta para estimar sistemas lineales invariantes en el tiempo sin retardo temporal [33]. Inspirado por la operación algebraica, Belkoura en [12] y [13] primero investigó las condiciones de identificabilidad para una clase general de sistemas descritos por ecuaciones de convolución. Luego, se introduce una formulación algebraica para la estimación en línea del retardo de tiempo y los parámetros de entradas-salidas estructuradas y arbitrarias.

En este artículo, ampliamos el enfoque SINDy combinándolo con el método de procesamiento de señales algebraicas para abordar el problema del ruido de medición, las condiciones iniciales y las derivadas. La operación algebraica genera señales útiles para la identificación del sistema mientras filtra el ruido. Aplicamos la expansión de Taylor para que el tiempo de retardo aparezca como un parámetro del modelo a identificar. Se adopta un estimador de estado extendido no lineal para la estimación de derivadas. Como resultado, llegamos a una regresión dispersa robusta combinada con validación cruzada y técnicas de arranque para la identificación de sistemas no paramétricos. La simulación y los resultados experimentales ilustran que el algoritmo propuesto puede superar las siguientes limitaciones de las técnicas existentes:

Múltiples mínimos locales Lograr el mínimo global es el principal desafío para los métodos de mínimos cuadrados modificados con enfoque recursivo. La regresión dispersa es un problema de optimización convexa con un mínimo global [34].

Identificación no lineal no paramétrica El único supuesto del algoritmo propuesto sobre la estructura del sistema es que el sistema es escaso en el espacio de funciones base. El algoritmo propuesto se basa en los datos para realizar la selección y no se limita a sistemas lineales y SISO.

Resistente al ruido La escasa regresión ya es robusta. La operación algebraica ofrece un filtrado adicional del ruido. Además, el algoritmo propuesto está equipado con bootstrapping para estudiar las estadísticas de estimación, como las desviaciones medias y estándar.

Entradas no estructuradas Muchas estrategias clásicas están diseñadas para entradas pulsadas. El enfoque propuesto analiza los datos de entrada y salida sin ningún marco ni suposición de estructura para las entradas.

Condiciones iniciales Otro supuesto general en la estimación del retardo de tiempo es que las condiciones iniciales son cero, mientras que en la mayoría de las aplicaciones prácticas, no es cierto. La operación algebraica y el cálculo operacional hacen que el algoritmo propuesto sea independiente de las condiciones iniciales.

El resto del artículo está organizado de la siguiente manera. La sección 2 presenta los supuestos y formula el problema matemático de la identificación del sistema. Las técnicas de preprocesamiento de datos algebraicos y estimaciones derivadas, regresión dispersa en combinación con remuestreo bootstrapping y validación cruzada se explican en la Sección. 3. La Sección 4 presenta un ejemplo de un sistema simulado masa-resorte-amortiguador no lineal bajo un control proporcional con retardo de tiempo. La validación experimental del algoritmo propuesto en la junta flexible rotatoria realizada por Quanser se presenta en la Sec. 5. Finalmente, la Secta. 6 concluye el artículo.


Contenido

Los sistemas biológicos complejos se pueden representar y analizar como redes computables. Por ejemplo, los ecosistemas pueden modelarse como redes de especies que interactúan, o una proteína puede modelarse como una red de aminoácidos. [4] Además, los aminoácidos se pueden representar como una red de átomos conectados, como carbono, nitrógeno y oxígeno. Los nodos y los bordes son los componentes esenciales de una red. Los nodos representan unidades en la red, mientras que los bordes representan la conexión entre las unidades. Los nodos pueden representar una amplia gama de unidades biológicas, desde organismos individuales hasta neuronas individuales en el cerebro. Dos de las propiedades importantes de una red son el grado y la centralidad de intermediación. El grado denota el número de bordes conectados a un nodo, mientras que la intermediación es una medida de cuán central es un nodo en la red. [5] Los nodos con un alto nivel de intermediación sirven esencialmente como puentes entre diferentes partes de la red (es decir, las interacciones deben pasar a través de este nodo para llegar a otras partes de la red). En las redes sociales, los nodos con un alto grado de intermediación pueden jugar un papel importante en su composición general. [6]

Ya en la década de 1980, los investigadores comenzaron a ver el ADN o los genomas como el almacenamiento dinámico de un sistema de lenguaje con estados finitos computables precisos representados como una máquina de estados finitos. [7] La ​​investigación reciente de sistemas complejos también ha sugerido algunos puntos en común de gran alcance en la organización de la información en problemas de biología, informática y física, como el condensado de Bose-Einstein (un estado especial de la materia). [8]

La bioinformática ha cambiado cada vez más su enfoque de genes, proteínas y algoritmos de búsqueda individuales a redes a gran escala, a menudo denominadas como -omas como bioma, interactoma, genoma y proteoma. Estos estudios teóricos han revelado que las redes biológicas comparten muchas características con otras redes como Internet o las redes sociales, por ejemplo, la topología de la red. [9]

Redes de interacción proteína-proteína Editar

Redes de interacción proteína-proteína (PIN) representan la relación física entre las proteínas presentes en una célula, donde las proteínas son nodos, y sus interacciones no están dirigidas bordes. [10] Debido a su naturaleza no dirigida, es difícil identificar todas las proteínas involucradas en una interacción. Las interacciones proteína-proteína (IBP) son esenciales para los procesos celulares y también las redes más intensamente analizadas en biología. Los IBP podrían descubrirse mediante diversas técnicas experimentales, entre las cuales el sistema de dos híbridos de levadura es una técnica comúnmente utilizada para el estudio de interacciones binarias. [11] Recientemente, estudios de alto rendimiento que utilizan espectrometría de masas han identificado grandes conjuntos de interacciones de proteínas. [12]

Muchos esfuerzos internacionales han dado como resultado bases de datos que catalogan las interacciones proteína-proteína determinadas experimentalmente. Algunos de ellos son la base de datos de referencia de proteínas humanas, la base de datos de proteínas que interactúan, la base de datos de interacción molecular (MINT), [13] IntAct, [14] y BioGRID. [15] Al mismo tiempo, se propusieron múltiples enfoques computacionales para predecir interacciones. [16] STRING es una de esas bases de datos, donde se recopilan para uso público las interacciones proteína-proteína, tanto predichas computacionalmente como validadas experimentalmente.

Estudios recientes han indicado la conservación de redes moleculares a través del tiempo evolutivo profundo. [17] Además, se ha descubierto que las proteínas con altos grados de conexión tienen más probabilidades de ser esenciales para la supervivencia que las proteínas con grados menores. [18] Esta observación sugiere que la composición general de la red (no simplemente interacciones entre pares de proteínas) es vital para el funcionamiento general de un organismo.

Redes reguladoras de genes (redes de interacción ADN-proteína) Editar

El genoma codifica miles de genes cuyos productos (ARNm, proteínas) son cruciales para los diversos procesos de la vida, como. Diferenciación celular, supervivencia celular y metabolismo. Los genes producen tales productos a través de un proceso llamado transcripción, que está regulado por una clase de proteínas llamadas factores de transcripción. Por ejemplo, el genoma humano codifica casi 1.500 factores de transcripción de unión al ADN que regulan la expresión de más de 20.000 genes humanos. [19] El conjunto completo de productos genéticos y las interacciones entre ellos constituyen redes reguladoras de genes (GRN). Los GRN regulan los niveles de productos génicos dentro de la célula y, a su vez, los procesos celulares.

Los GRN se representan con genes y factores de transcripción como nodos y la relación entre ellos como bordes. Estos bordes son direccionales y representan la relación reguladora entre los dos extremos del borde. Por ejemplo, el borde dirigido del gen A al gen B indica que A regula la expresión de B. Por tanto, estos bordes direccionales no solo pueden representar la promoción de la regulación génica sino también su inhibición.

Los GRN generalmente se construyen utilizando el conocimiento de regulación de genes disponible en bases de datos como., Reactome y KEGG. Las tecnologías de medición de alto rendimiento, como microarrays, RNA-Seq, ChIP-chip y ChIP-seq, permitieron la acumulación de datos transcriptómicos a gran escala, lo que podría ayudar a comprender los complejos patrones de regulación de genes. [20] [21]

Redes de coexpresión de genes (redes de asociación de transcripción-transcripción) Editar

Las redes de coexpresión de genes se pueden percibir como redes de asociación entre variables que miden la abundancia de transcripciones. Estas redes se han utilizado para proporcionar un análisis biológico del sistema de datos de microarrays de ADN, datos de secuencia de ARN, datos de miARN, etc. El análisis de redes de coexpresión de genes ponderados se utiliza ampliamente para identificar módulos de coexpresión y genes concentradores intramodulares. [22] Los módulos de coexpresión pueden corresponder a tipos de células o vías, mientras que los concentradores intramodulares altamente conectados pueden interpretarse como representantes de sus respectivos módulos.

Redes metabólicas Editar

Las células descomponen los alimentos y los nutrientes en pequeñas moléculas necesarias para el procesamiento celular a través de una serie de reacciones bioquímicas. Estas reacciones bioquímicas están catalizadas por enzimas. El conjunto completo de todas estas reacciones bioquímicas en todas las vías representa la red metabólica. Dentro de la red metabólica, las moléculas pequeñas toman el papel de nodos y pueden ser carbohidratos, lípidos o aminoácidos. Las reacciones que convierten estas pequeñas moléculas de una forma a otra se representan como aristas. Es posible utilizar análisis de redes para inferir cómo actúa la selección en las vías metabólicas. [5]

Redes de señalización Editar

Las señales se transducen dentro de las células o entre ellas y, por lo tanto, forman redes de señalización complejas. Por ejemplo, la vía MAPK / ERK se transduce de la superficie celular al núcleo celular mediante una serie de interacciones proteína-proteína, reacciones de fosforilación y otros eventos. [23] Las redes de señalización suelen integrar redes de interacción proteína-proteína, redes reguladoras de genes y redes metabólicas. [24] [25]

Redes neuronales Editar

Las complejas interacciones en el cerebro lo convierten en un candidato perfecto para aplicar la teoría de redes. Las neuronas del cerebro están profundamente conectadas entre sí, y esto da como resultado la presencia de redes complejas en los aspectos estructurales y funcionales del cerebro. [26] Por ejemplo, se han demostrado las propiedades de la red de mundos pequeños en las conexiones entre las regiones corticales del cerebro de los primates [27] o durante la deglución en humanos. [28] Esto sugiere que las áreas corticales del cerebro no interactúan directamente entre sí, pero se puede llegar a la mayoría de las áreas desde todas las demás a través de unas pocas interacciones.

Redes alimentarias Editar

Todos los organismos están conectados a través de interacciones alimentarias. Si una especie come o es devorada por otra especie, están conectadas en una intrincada red alimenticia de interacciones entre depredadores y presas. La estabilidad de estas interacciones ha sido una cuestión de larga data en ecología. [29] Es decir, si se eliminan ciertos individuos, ¿qué sucede con la red (es decir, se colapsa o se adapta)? El análisis de red se puede utilizar para explorar la estabilidad de la red alimentaria y determinar si ciertas propiedades de la red dan como resultado redes más estables. Además, el análisis de redes se puede utilizar para determinar cómo las eliminaciones selectivas de especies influirán en la red alimentaria en su conjunto. [30] Esto es especialmente importante considerando la posible pérdida de especies debido al cambio climático global.

Redes de interacción entre especies Editar

En biología, las interacciones por pares han sido históricamente el foco de un estudio intenso. Con los avances recientes en la ciencia de redes, se ha hecho posible ampliar las interacciones por pares para incluir individuos de muchas especies involucradas en muchos conjuntos de interacciones para comprender la estructura y función de redes ecológicas más grandes. [31] El uso del análisis de red puede permitir tanto el descubrimiento como la comprensión de cómo estas complejas interacciones se vinculan entre sí dentro de la red del sistema, una propiedad que anteriormente se había pasado por alto. Esta poderosa herramienta permite el estudio de varios tipos de interacciones (desde competitivas hasta cooperativas) utilizando el mismo marco general. [32] Por ejemplo, las interacciones planta-polinizador son mutuamente beneficiosas y, a menudo, involucran a muchas especies diferentes de polinizadores, así como a muchas especies diferentes de plantas. Estas interacciones son críticas para la reproducción de las plantas y, por lo tanto, la acumulación de recursos en la base de la cadena alimentaria para los consumidores primarios; sin embargo, estas redes de interacción están amenazadas por el cambio antropogénico. El uso del análisis de redes puede iluminar cómo funcionan las redes de polinización y, a su vez, puede informar los esfuerzos de conservación. [33] Dentro de las redes de polinización, el anidamiento (es decir, los especialistas interactúan con un subconjunto de especies con las que interactúan los generalistas), la redundancia (es decir, la mayoría de las plantas son polinizadas por muchos polinizadores) y la modularidad juegan un papel importante en la estabilidad de la red. [33] [34] Estas propiedades de la red en realidad pueden funcionar para ralentizar la propagación de los efectos de perturbación a través del sistema y, potencialmente, amortiguar la red de polinización de los cambios antropogénicos de alguna manera. [34] De manera más general, la estructura de las interacciones de las especies dentro de una red ecológica puede decirnos algo sobre la diversidad, riqueza y solidez de la red. [35] Los investigadores pueden incluso comparar las construcciones actuales de redes de interacciones de especies con reconstrucciones históricas de redes antiguas para determinar cómo las redes han cambiado con el tiempo. [36] La investigación reciente sobre estas complejas redes de interacciones de especies está muy preocupada por comprender qué factores (por ejemplo, la diversidad) conducen a la estabilidad de la red. [37]

Redes de interacción dentro de las especies Editar

El análisis de red proporciona la capacidad de cuantificar asociaciones entre individuos, lo que permite inferir detalles sobre la red en su conjunto a nivel de especie y / o población. [38] Una de las características más atractivas del paradigma de la red sería que proporciona un marco conceptual único en el que la organización social de los animales en todos los niveles (individual, díada, grupo, población) y para todo tipo de interacción (agresiva, cooperativa, sexual, etc.) se puede estudiar. [39]

Los investigadores interesados ​​en la etología en muchos taxones, desde insectos hasta primates, están comenzando a incorporar el análisis de redes en su investigación. Los investigadores interesados ​​en insectos sociales (p. Ej., Hormigas y abejas) han utilizado los análisis de redes mejor para comprender la división del trabajo, la asignación de tareas y la optimización de la búsqueda de alimento dentro de las colonias [40] [41] [42] Otros investigadores están interesados ​​en cómo las propiedades específicas de la red a nivel de grupo y / o población puede explicar los comportamientos a nivel individual. Los estudios han demostrado cómo la estructura de la red social animal puede verse influenciada por factores que van desde las características del entorno hasta las características del individuo, como la experiencia de desarrollo y la personalidad. A nivel del individuo, el patrón de conexiones sociales puede ser un determinante importante de la aptitud, prediciendo tanto la supervivencia como el éxito reproductivo. A nivel de la población, la estructura de la red puede influir en la configuración de los procesos ecológicos y evolutivos, como la selección dependiente de la frecuencia y la transmisión de enfermedades e información. [43] Por ejemplo, un estudio sobre los saltamontes de cola de alambre (un pequeño pájaro paseriforme) encontró que el grado de un macho en la red predijo en gran medida la capacidad del macho para ascender en la jerarquía social (es decir, eventualmente obtener un territorio y apareamientos) . [44] En los grupos de delfines mulares, los valores de centralidad de grado y de intermediación de un individuo pueden predecir si ese individuo exhibirá o no ciertos comportamientos, como el uso de movimientos laterales y columpios boca abajo para liderar los esfuerzos de viaje del grupo, los individuos con valores de intermediación altos son más conectados y pueden obtener más información y, por lo tanto, son más adecuados para liderar viajes en grupo y, por lo tanto, tienden a exhibir estos comportamientos de señalización más que otros miembros del grupo. [45]

El análisis de redes sociales también se puede utilizar para describir la organización social dentro de una especie de manera más general, lo que frecuentemente revela importantes mecanismos próximos que promueven el uso de ciertas estrategias de comportamiento. Estas descripciones están frecuentemente vinculadas a propiedades ecológicas (por ejemplo, distribución de recursos). Por ejemplo, los análisis de redes revelaron diferencias sutiles en la dinámica de grupo de dos especies relacionadas de fisión-fusión de équidos, la cebra y los onagros de Grevy, que viven en entornos variables Las cebras de Grevy muestran preferencias distintas en sus opciones de asociación cuando se dividen en grupos más pequeños, mientras que los onagros no lo hacen. . [46] De manera similar, los investigadores interesados ​​en primates también han utilizado análisis de red para comparar organizaciones sociales en el diverso orden de primates, lo que sugiere que el uso de medidas de red (como centralidad, assortatividad, modularidad e intermediación) puede ser útil en términos de explicar los tipos de los comportamientos sociales que vemos dentro de ciertos grupos y no en otros. [47]

Por último, el análisis de redes sociales también puede revelar importantes fluctuaciones en el comportamiento de los animales en entornos cambiantes. Por ejemplo, análisis de redes en babuinos chacma hembras (Papio hamadryas ursinus) revelaron importantes cambios dinámicos a lo largo de las estaciones que antes se desconocían en lugar de crear vínculos sociales estables y duraderos con los amigos, se descubrió que los babuinos exhibían relaciones más variables que dependían de contingencias a corto plazo relacionadas con la dinámica a nivel de grupo, así como con el entorno. variabilidad. [48] ​​Los cambios en el entorno de la red social de un individuo también pueden influir en características como la "personalidad": por ejemplo, las arañas sociales que se apiñan con vecinos más audaces tienden a aumentar también en audacia. [49] Este es un conjunto muy pequeño de ejemplos amplios de cómo los investigadores pueden utilizar el análisis de redes para estudiar el comportamiento animal. La investigación en esta área se está expandiendo actualmente muy rápidamente, especialmente porque el desarrollo más amplio de etiquetas transmitidas por animales y la visión por computadora se puede utilizar para automatizar la colección de asociaciones sociales. [50] El análisis de redes sociales es una herramienta valiosa para estudiar el comportamiento animal en todas las especies animales y tiene el potencial de descubrir nueva información sobre el comportamiento animal y la ecología social que antes no se comprendía bien.


Materiales y métodos

La Arquitectura de la Red

Para reflejar arquitecturas biofísicamente realistas, modelamos la conectividad en la población mixta de la siguiente manera: cada neurona de la subpoblación excitadora está acoplada linealmente con cualquier otra neurona, cada neurona inhibidora es impulsada solo por el acoplamiento con sus socios excitadores [36] (para un esquema dibujo animado (ver Figura 14). Esta arquitectura está motivada por la presencia de aproximadamente un 90% de neuronas excitadoras y un 10% de neuronas inhibidoras en un elemento de volumen típico de la corteza [37]. El acoplamiento lineal captura con precisión el acoplamiento eléctrico a través de uniones de brecha y un acoplamiento aproximadamente sináptico cuando la actividad de la población promedio está restringida a un rango de señal pequeño. Deseamos enfatizar que la conectividad es instantánea, por lo que nuestra red no puede dar cuenta de ningún fenómeno relacionado con el retraso de la transmisión sináptica. Estos últimos cobran relevancia cuando se consideran redes a gran escala. Para las redes pequeñas como se considera aquí, los retrasos de transmisión son insignificantes. En el cerebro, la comunicación entre dos neuronas cualesquiera en la corteza se logra típicamente a través de acoplamientos monosinápticos. La posición en el árbol dendrítico, la dimensión de la terminal sináptica y la distribución y tipo de receptores sinápticos son solo algunos factores que pueden determinar la eficacia de cada sinapsis. Aquí consideramos los promedios de todas estas propiedades en cada subpoblación neuronal y las absorbemos en nuestros modelos mediante los parámetros de fuerza de conectividad. Kij con I, j = 1,2. Con respecto a las limitaciones anatómicas, hacemos las siguientes consideraciones: La fuerza de la conectividad entre neuronas dentro de la subpoblación excitadora (K11) puede diferir de la fuerza de conectividad entre neuronas excitadoras e inhibidoras (K12). Capturamos su interdependencia por la proporción. Los acoplamientos excitadores-inhibidores pueden no ser necesariamente bidireccionales, por lo tanto, otro valor de la conectividad entre neuronas inhibidoras y excitadoras (K21) se considera por separado. Finalmente, descuidamos cualquier posible acoplamiento dentro de la subpoblación inhibitoria (K22≃0), lo que refleja la pequeña probabilidad de conexiones interneurona-interneurona debido a la escasez característica de estas neuronas en un volumen de corteza pequeño (ver [38] para una revisión completa).


Ver el vídeo: Tu primera red neuronal en Python y Tensorflow (Enero 2022).