Datos sintéticos

Esto ayuda a detectar y resolver problemas inesperados, como limitaciones en el procesamiento de la información.

"Esto nos permite crear perfiles de comportamiento realistas para usuarios y atacantes.

En el contexto del análisis estadístico que preserva la privacidad, en 1993, Donald Rubin creó la idea de los datos originales totalmente sintéticos.

[7]​ Más tarde ese año, Little creó la idea de los datos originales parcialmente sintéticos.

Little utilizó esta idea para sintetizar los valores sensibles en el archivo de uso público.

[9]​ Estos se utilizaron para entrenar un LeNet-4 para alcanzar un rendimiento de última generación.

[7]​ Más tarde, otros contribuyentes importantes al desarrollo de la generación de datos sintéticos fueron Trivellore Raghunathan, Jerry Reiter, Donald Rubin, John M. Abowd y Jim Woodcock.

[11]​ Los datos sintéticos se pueden generar mediante el uso de líneas aleatorias, con diferentes orientaciones y posiciones iniciales.

Este modelo o ecuación se llamará construcción de sintetizador.

Se diseñan algoritmos y generadores específicos para crear datos realistas,[14]​ que luego ayudan a enseñarle al sistema cómo reaccionar ante determinadas situaciones o criterios.

Los datos sintéticos permiten que el software reconozca estas situaciones y reaccione en consecuencia.

El uso de datos sintéticos reduce los problemas de confidencialidad y privacidad, ya que no contienen información personal y no se puede rastrear a ningún individuo.

Los avances en las redes generativas antagónicas (GAN) conducen a la idea natural de que uno puede producir datos y luego usarlos para entrenamiento.