
Fuente: Unsplash / CC0 Public Domain
Los patrones y anomalías en big data pueden ayudar a las empresas a llegar a clientes potenciales, exponer fraudes e incluso predecir interacciones entre medicamentos. Desafortunadamente, estos patrones a menudo no son fáciles de observar. Para extraer agujas de información útil de un pajar, los científicos de datos necesitan métodos de aprendizaje automático cada vez más potentes.
El Dr. Aria Nosratinia, distinguido profesor de ingeniería eléctrica e informática de Erik Jonsson en la Universidad de Texas en Dallas, recibió dos becas de la National Science Foundation por un total de $ 749,492 para descubrir compuestos que se esconden en grandes conjuntos de datos a través del aprendizaje automático y el desarrollo de métodos de mantenimiento comunicación de datos seguro.
“Mi laboratorio contribuye a expandir el universo de herramientas y técnicas para que podamos descubrir nuevas conexiones en los datos”, dijo Nosratinia, subdirector del departamento de ingeniería eléctrica e informática de A. Erik Jonsson.
Muchos algoritmos de aprendizaje automático y minería de datos utilizan gráficos que son simplemente listas de relaciones entre personas, grupos u objetos. Los ejemplos incluyen relaciones de “amigo”, “me gusta” o “seguir” en las redes sociales, o una lista de transmisión o videos favoritos en un servicio de suscripción de transmisión.
Estas montañas de datos son útiles información cuya extracción cae en un área conocida como inferencia gráfica. La inferencia gráfica tiene muchos usos interesantes y útiles, por ejemplo, sugerir películas en un servicio de transmisión en función de su historial de visualización o sugerencias de compras en línea. También puede revelar patrones en la propagación de epidemias o proporcionar información sobre el plegamiento de proteínas, lo cual es importante para comprender cómo funcionan las proteínas.
El trabajo de Nosratinia por primera vez propone y analiza técnicas para mejorar la inferencia de gráficos al absorber información distinta de los gráficos que antes no se entendían bien para vincular de manera efectiva a la información gráfica. Los ejemplos de información que no sean gráficos incluyen la edad de la persona y el código postal de residencia, que son atributos individuales.
“En casi todas las aplicaciones gráficas prácticas, hay datos no gráficos de gran importancia”, dice Nosratinia. “El tipo de trabajo que hacemos es trabajo de alto nivel, desarrollando modelos matemáticos, teorías y técnicas, pero tiene amplias aplicaciones”.
En varios artículos publicados, Nosratinia describe modelos matemáticos desarrollados por él y miembros de su laboratorio que pueden mejorar la estimación de información oculta en un gráfico mediante el uso de información adicional. Nosratinia y el coautor Dr. Hussein Saad ”19, ahora ingeniero senior en Qualcomm Inc., analizaron recientemente cómo identificar un pequeño grupo o comunidad escondida en un gráfico grande. Su último trabajo apareció en diciembre de 2020 en la revista IEEE Transactions on Information Theory.
El segundo elemento de la investigación de Nosratinia se refiere a la seguridad de los datos. Su trabajo utiliza variedades naturales de canales inalámbricos para proporcionar capas de seguridad para la transmisión de datos. Esta área de trabajo, denominada seguridad de la capa física, tiene como objetivo aprovechar las imperfecciones del canal de comunicación como herramienta de seguridad. Parte de esta investigación tiene como objetivo desarrollar técnicas para evitar que los ciberdelincuentes detecten la presencia de comunicaciones electrónicas.
“Para dar un ejemplo simple, la contraseña funciona aprovechando la diferencia entre lo que conoce el usuario legítimo y los ciberdelincuentes que quieren robar la información”, dijo Nosratinia. “Nuestro trabajo crea, fortalece y analiza asimetrías estadísticas de información contra los adversarios de una manera que no requiere contraseñas ni claves, y las utiliza para asegurar las comunicaciones”.
Hussein Saad y col. Recuperar una sola comunidad con información adicional, Transacciones IEEE en teoría de la información (2020). DOI: 10.1109 / TIT.2020.3030764
Entregado por
Universidad de Texas en Dallas