En los últimos años, los modelos basados en redes neuronales profundas han producido resultados notables en muchas tareas. A pesar de la alta precisión de las predicciones, se sabe que estos modelos son de naturaleza “caja negra”, lo que esencialmente significa que los procesos que conducen a sus predicciones son difíciles de interpretar.
Uno de los procesos clave que realiza la red neuronal profunda en el pronóstico del aprendizaje se conoce como selección de variables. Básicamente, implica una elección variables de entrada que tienen un alto poder predictivo (es decir, identificar características de datos que permiten que el modelo haga predicciones muy precisas).
Investigadores de la Universidad de Notre Dame desarrollaron recientemente SurvNet, una técnica que puede mejorar los procesos de selección de variables al entrenar redes neuronales profundas. Esta técnica, presentada en un artículo publicado en Inteligencia de la máquina de la naturaleza, puede estimar y controlar las tasas de detección falsa durante la selección de variables (es decir, el grado en el que la red neuronal profunda selecciona variables irrelevantes para la tarea que debe realizar).
“La gente tiende a pensar en las redes neuronales profundas como cajas negras (es decir, aunque logran una alta precisión de predicción, es difícil explicar por qué funcionan) y esto limita su aplicación a campos que requieren modelos interpretables, como la biología y la medicina”, dijo Jun. Li, el investigador principal que ideó el estudio, le dijo a TechXplore. “Queríamos desarrollar un método para interpretar redes neuronales, en particular para saber qué variables de entrada son importantes para el éxito del proyecto. la red“.
Para mejorar la selección de variables, Li y su alumno Zixuan Song desarrollaron SurvNet, un procedimiento de eliminación hacia atrás que se puede utilizar para seleccionar de forma fiable variables de entrada para redes neuronales profundas. Esencialmente, SurvNet elimina gradualmente las variables (es decir, características de datos) que son irrelevantes para la tarea en cuestión, identificando en última instancia las que tienen el mayor poder predictivo.
“Por ejemplo, en la investigación genómica, los científicos utilizan datos de expresión génica, que consiste en la expresión de miles de genes (cada gen es una variable de entrada) que se utilizan para diagnosticar enfermedades “, dijo Li”. red neuronal profunda podría desarrollarse para dicho diagnóstico, pero queríamos saber qué genes (generalmente unas pocas o unas pocas docenas) son realmente importantes para el diagnóstico, de modo que los científicos pudieran realizar más experimentos para estudiar o validar estos genes y aprender más sobre los mecanismos de la enfermedad para finalmente identificar los productos químicos / medicamentos que combaten estos genes y pueden curar una enfermedad específica ‘.
Li y Song evaluaron SurvNet a través de una serie de experimentos con conjuntos de datos reales y simulados. Además, compararon su funcionamiento con otras técnicas de selección de variables existentes. En estas pruebas, SurvNet se comparó favorablemente con otros métodos, y aunque algunas técnicas (p. Ej., Métodos basados en imitaciones) lograron una tasa de descubrimiento falso más baja en datos con variables altamente correlacionadas, SurvNet tendió a tener un poder de selección de variables general más alto, proporcionando negociar en mejores condiciones entre los falsos descubrimientos y el poder.
“Una característica única de SurvNet es que proporcionacontrol de calidad“Para la selección de variables, este control de calidad se realiza de una manera moderna y estadísticamente rígida mediante el control de la tasa de falsos descubrimientos”, dijo Li. “Un control de calidad tan estricto es crucial para la biología y la investigación médica, ya que la validación (experimental) de los resultados a menudo es costosa y requiere mucho tiempo”.
En comparación con otros métodos de selección de variables, SurvNet es más confiable y más eficiente computacionalmente. En el futuro, puede ayudar a mejorar la precisión de la predicción y la interpretabilidad de los modelos de redes neuronales profundas mediante la selección eficiente de variables con alto poder predictivo.
“Nuestro estudio proporciona una herramienta útil para determinar qué entradas son importantes, y esta herramienta es automática (no Intervención humana es necesario), confiable (que permite un estricto control de calidad), computacionalmente eficiente (bajo costo de tiempo o recursos informáticos) y versátil (aplicable a una amplia gama de problemas) “, dijo Li.” En nuestra próxima investigación, planeamos extender SurvNet a la investigación no supervisada, como la creación de clústeres ”.
Selección variable con falso control de velocidad en redes neuronales profundas. Inteligencia de la máquina de la naturaleza(2021). DOI: 10.1038 / s42256-021-00308-z.
© 2021 Science X Network