Opinión | INTELIGENCIA ARTIFICIAL

La revolución de los datos sintéticos

Desafortunadamente, presenciamos situaciones en las que ciertos grupos resultan perjudicados por la tecnología, que, sin supervisión, no hace más que exacerbar las desigualdades

Imagen de un centro de datos.

Imagen de un centro de datos. / ShutterStock

La era digital nos ha traído la inteligencia artificial con el propósito de mejorar nuestra vida. Sin embargo, esa mejora puede verse comprometida por los sesgos que a menudo la impregnan. Hay dos elementos clave sobre los que convendría estar atentas: el diseño de los algoritmos y los datos utilizados para entrenarlos. Desafortunadamente, presenciamos constantemente situaciones en las que ciertos grupos resultan perjudicados por la tecnología, que, sin supervisión, no hace más que exacerbar las desigualdades existentes. La discriminación de género, la persistencia del sujeto masculino como universal, la invisibilización de las mujeres ahora en las nuevas imágenes generadas por las últimas aplicaciones del mercado y la exclusión de diversos colectivos en la tecnología son solo algunos de los problemas que enfrentamos. Ante este desafío, surge una propuesta que puede llegar a ser revolucionaria: los datos sintéticos.

Los datos sintéticos son datos generados artificialmente a través de algoritmos o simulaciones por ordenador, y que actúan como sustitutos de los reales. Su principal función es validar modelos matemáticos y entrenar sistemas de aprendizaje automático. Ofrecen una alternativa valiosa cuando los auténticos datos no están disponibles, son sesgados, no pueden usarse por razones de privacidad u otros riesgos de cumplimiento normativo.

La versatilidad de los datos sintéticos es notable, ya que pueden generarse en una variedad de formatos. Su uso está redefiniendo los límites de lo que es posible en el campo del aprendizaje automático, permitiendo el desarrollo de algoritmos más precisos y con mejor comportamiento. Los expertos afirman que tienen tantas aplicaciones como la inteligencia artificial, pero son especialmente utilizados en la investigación de sistemas autónomos, como robots, drones y coches. Son utilísimos para superar las limitaciones de las pruebas en entornos reales, que pueden resultar peligrosas, costosas y por qué no reconocerlo, lentas.

En el ámbito de los medios de comunicación, los datos sintéticos abarcan diferentes formatos. Desde imágenes sintéticas para entrenar modelos de visión por computadora, a audios para entrenar sistemas de reconocimiento de voz o procesamiento de sonido. Del mismo modo, los videos sintéticos, generados por un ordenador, simulan eventos del mundo real, como pueden ser incidentes de tráfico, y situaciones en las que no querríamos estar, que sirven para entrenar los modelos que dirigen los vehículos autónomos. La idea sería enseñarles a actuar en todo tipo de circunstancias para que el sistema pueda reaccionar. Otro campo muy automatizado es el de los servicios financieros, hasta hay asesores-máquinas o roboadvisors. Aquí este tipo de datos pueden servir también para validar modelos de comercio algorítmico, contemplando muchísimos escenarios. El último de los ejemplos que me gustaría poner es el de la industria manufacturera, donde se pueden generar defectos sintéticos, es decir, imágenes generadas por computadora que representan productos defectuosos. De esta forma las máquinas saben identificar la calidad y pueden reducir los defectos en la fabricación.

En el ámbito de los medios de comunicación, los datos sintéticos abarcan diferentes formatos: desde imágenes sintéticas para entrenar modelos de visión por computadora, a audios para entrenar sistemas de reconocimiento de voz o procesamiento de sonido

Estos solo son algunos ejemplos de los múltiples que existen y que demuestran la cantidad de posibilidades que tienen los datos sintéticos, ayudando a las organizaciones a entrenar modelos, validar algoritmos y superar desafíos de privacidad o disponibilidad de datos. En el otro lado cabría preguntarse: ¿cuáles son las implicaciones éticas asociadas con el uso de estos datos? Inevitable querer saber si los datos sintéticos realmente pueden imitar la complejidad e imprevisibilidad del mundo real. Si son neutros en sesgos, quién lo garantiza, cómo se neutraliza un sesgo y si queremos un mundo absolutamente libre de ellos, creando por tanto una realidad que tampoco hemos conocido. A esto habría que añadir el examen crítico de las dinámicas de poder y las promesas de inclusión asociadas con los datos sintéticos. En definitiva, una buena idea con grandes posibilidades que merece ser explorada con rigor en un mundo que automatiza, cada vez más, las decisiones sobre la vida de las personas. Los datos sintéticos son una oportunidad para corregir la injusticia que se va sistematizando a través del uso cada vez más extendido de la inteligencia artificial.