Uso del aprendizaje automático para predecir investigaciones de alto impacto

Uso del aprendizaje automático para predecir investigaciones de alto impacto

Los investigadores del MIT han diseñado una plataforma de aprendizaje automático que puede predecir el impacto futuro de la investigación mediante el cálculo de gráficos de investigación histórica. Fuente: Instituto de Tecnología de Massachusetts

Un marco de inteligencia artificial creado por científicos del MIT puede proporcionar una señal de ‘alerta temprana’ para futuras tecnologías de alto impacto al aprender de patrones recopilados de publicaciones científicas anteriores.

En una prueba retrospectiva de sus capacidades, DELPHI, abreviatura de Dynamic Early Warning by Learning to Predict High Impact, pudo identificar todos los artículos pioneros en la lista de expertos en avances clave en biotecnología, a veces en el primer año después de la publicación. .

James W. Weis, investigador asociado del MIT Media Lab, y Joseph Jacobson, profesor de ciencia de los medios y jefe del grupo de investigación Molecular Machines en Media Lab, también utilizaron DELPHI para destacar los últimos 50 artículos de investigación que predicen que tendrán un gran impacto. para el 2023. Los temas tratados en los artículos incluyen nanobots de ADN para el tratamiento del cáncer, baterías de litio-oxígeno de alta densidad de energía y síntesis química utilizando redes neuronales profundas, entre otros.

Los científicos ven DELPHI como una herramienta que puede ayudar a las personas a hacer un mejor uso de los fondos. investigar, identificando tecnologías de “diamantes en bruto” que de otro modo podrían verse disminuidas y ofreciendo una vía para los gobiernos, la filantropía y empresas de capital riesgo Apoyar la ciencia de manera más eficaz y eficiente.

“Básicamente, nuestro algoritmo funciona aprendiendo patrones de la historia de la ciencia y luego haciendo coincidir los patrones en nuevas publicaciones para encontrar señales tempranas de alto impacto”, dice Weis. “Al rastrear la propagación temprana de ideas, podemos predecir la probabilidad de que se vuelvan virales o se propaguen de manera significativa a la comunidad académica en general”.

El artículo fue publicado en Biotecnología de la naturaleza.

Busque un “diamante en bruto”

El algoritmo de aprendizaje automático desarrollado por Weis y Jacobson utiliza la gran cantidad de información digital que ahora está disponible con el crecimiento exponencial de las publicaciones científicas desde la década de 1980. Pero en lugar de utilizar medidas unidimensionales como el recuento de citas para evaluar el impacto de las publicaciones, DELPHI fue capacitado en los metadatos web de los artículos en una serie de tiempo completo para revelar patrones dimensionales más altos en su diseminación por todo el ecosistema científico.

El resultado es un gráfico de conocimiento que contiene las conexiones entre los nodos que representan artículos, autores, instituciones y otros tipos de datos. La fuerza y ​​el tipo de conexiones complejas entre estos nodos determinan sus propiedades que se utilizan en el marco. “Estos nodos y bordes definen un gráfico basado en el tiempo que DELPHI utiliza para aprender patrones que predicen un gran impacto en el futuro”, explica Weis.

Todas estas funciones de red se utilizan para predecir el impacto científico, y los artículos que cinco años después de la publicación se encuentran dentro del 5 por ciento superior de la centralidad de los nodos con una escala de tiempo se han identificado como el conjunto de objetivos de “alto impacto” que DELPHI pretende identificar. . El 5 por ciento superior de los artículos representa el 35 por ciento del impacto total en el gráfico. Como dicen los autores, DELPHI también puede usar los valores de corte alto de 1, 10 y 15 por ciento de la centralidad del nodo con una escala de tiempo.

DELPHI sugiere que el trabajo de gran influencia se difunde casi de forma viral más allá de sus disciplinas y comunidades de investigación más pequeñas. Dos artículos pueden tener el mismo número de citas, pero los artículos de gran importancia llegan a una audiencia más amplia y profunda. Por otro lado, los papeles de bajo impacto “realmente no están siendo utilizados por un grupo cada vez mayor de personas”, dice Weis.

Los marcos pueden ser útiles para ‘lograr que equipos de personas trabajen juntos incluso si aún no se conocen entre sí, tal vez al canalizarles fondos para que trabajen juntos en importantes cuestiones multidisciplinarias’, agrega.

En comparación con el número de citas por sí solo, DELPHI identifica más del doble de artículos de alto impacto, incluido el 60 por ciento de “gemas ocultas”, artículos que se perderían en el umbral de citas.

“La investigación básica está avanzando al disparar múltiples tiros al blanco y luego duplicar rápidamente lo mejor de esas ideas”, dice Jacobson. “El estudio trataba de averiguar si podíamos llevar a cabo este proceso de una manera más escalable, utilizando a la comunidad científica en su conjunto, en línea con el cuadro académico, y también de manera más inclusiva en la identificación de direcciones de investigación de alto impacto”.

Los investigadores se sorprendieron de lo temprano que en algunos casos hay una “bandera roja” de un artículo muy influyente que utiliza DELPHI. “Dentro de un año de la publicación, identificamos gemas ocultas que tendrán un impacto significativo más adelante”, dice Weis.

Sin embargo, advierte que DELPHI no predice el futuro con exactitud. “Utilizamos el aprendizaje automático para extraer y cuantificar señales que están ocultas en la dimensionalidad y dinámica de los datos que ya existen”.

Financiamiento justo, eficiente y efectivo

Los científicos dicen que hay esperanzas de que DELPHI ofrezca una forma menos sesgada de evaluar el archivo. papelimpacto, ya que se pueden manipular otras medidas como las citas y el número de factores que influyen en la revista, como ha demostrado la investigación anterior.

“Esperamos utilizar esto para encontrar a los investigadores e investigadores más merecedores, independientemente de las instituciones a las que estén afiliados o cómo estén conectados”, dice Weis.

Sin embargo, como ocurre con todas las plataformas de aprendizaje automático, los diseñadores y usuarios deben estar alertas a los prejuicios, agrega. “Necesitamos estar constantemente al tanto de posibles errores en nuestros datos y modelos. Queremos que DELPHI ayude a encontrar la mejor investigación de una manera menos sesgada, por lo que debemos tener cuidado de que nuestros modelos no aprendan a predecir los impactos futuros únicamente sobre la base de métricas subóptimas como el índice h, las citas de los autores o la afiliación institucional “.

DELPHI puede ser una herramienta poderosa para ayudar a aumentar la eficiencia y efectividad de la financiación científica, y también se puede utilizar para crear nuevas clases de productos financieros relacionados con la inversión científica.

“La metaciencia emergente de la financiación de la ciencia muestra la necesidad de un enfoque de cartera para la inversión científica”, señala David Lang, director ejecutivo de Experiment Foundation. “Weis y Jacobson han hecho una contribución significativa a esta comprensión y, lo que es más importante, a su implementación con DELPHI”.

Es algo en lo que Weis ha pensado mucho después de sus propias experiencias con el lanzamiento de fondos de capital de riesgo y laboratorios de incubación para nuevas empresas de biotecnología.

“Me di cuenta cada vez más de que los inversores, incluido yo mismo, buscamos constantemente nuevos negocios en los mismos lugares y con los mismos prejuicios”, dice. “Hay una enorme riqueza de personas altamente talentosas y una tecnología asombrosa que he comenzado a ver, pero esto a menudo se pasa por alto. Pensé que debe haber una forma de trabajar en este espacio, y el aprendizaje automático puede ayudarnos a encontrar y realizar de manera más eficiente todo este potencial sin explotar. ”


Los planes de Delphi se dividieron en empresas tecnológicas tradicionales en abril

Más información:
James W. Weis y col. Aprender la dinámica de los gráficos de conocimiento proporciona una advertencia temprana de investigaciones influyentes, Biotecnología de la naturaleza (2021). DOI: 10.1038 / s41587-021-00907-6

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *