La recopilación de suficientes datos sin sesgos de distribución es esencial para mejorar el rendimiento de los análisis de inteligencia artificial (IA). Se requiere tecnología de inteligencia artificial para recopilar datos distribuidos en múltiples instituciones y realizar análisis integrados de forma segura mientras se mantiene la confidencialidad de cierta información, como datos personales y conocimientos. En particular, el uso de datos se considera limitado si hay información personal identificable en los datos compartidos.
El equipo de investigación ha desarrollado una tecnología de inteligencia artificial segura llamada “análisis colaborativo de datos no identificables” que proporciona solo datos abstractos que no se pueden identificar fácilmente con los datos originales y permite el análisis integrado de datos personales en poder de múltiples partes, como empresas, gobiernos locales, hospitales. y otras organizaciones. Su artículo fue publicado en la revista Fusión de información.
El equipo creó un marco para definiciones matemáticas de datos fácilmente identificables. Luego, el equipo propuso un algoritmo de análisis integrado que proporciona solo datos abstractos que no se pueden identificar fácilmente con los datos originales. Esto permitirá que se utilicen más datos en el análisis de datos personales, lo que a su vez se espera que mejore significativamente la precisión del análisis de IA.
Las aplicaciones específicas incluyen la predicción de enfermedades mediante la estimación de factores de riesgo a través del análisis integrado de datos de pruebas y medicamentos de múltiples instituciones médicas, y la mejora de la eficacia de la enseñanza a través del análisis integrado de datos de estudiantes de múltiples instituciones educativas. Se espera que esta tecnología facilite el desarrollo de una nueva plataforma que recopile datos personales de alta calidad de varias instituciones, protegiendo los datos originales y utilizando inteligencia artificial para el análisis integral de datos.
Más información:
Akira Imakura et al., Análisis de datos colaborativos no fácilmente identificables para múltiples conjuntos de datos, incluidos datos personales, Fusión de información (2023). DOI: 10.1016/j.inffus.2023.101826