Conozca Neosync: la solución de código abierto para sincronizar y anonimizar datos de producción en entornos de desarrollo y pruebas

En el desarrollo de software, los equipos a menudo enfrentan desafíos cuando trabajan con datos de producción confidenciales con fines de prueba y desarrollo. La necesidad de equilibrar la privacidad y la seguridad de los datos con la necesidad de realizar pruebas sólidas puede resultar complicada. Algunas soluciones existentes pueden implicar la anonimización manual de datos o la creación de datos sintéticos, pero es posible que estos procesos deban ser más convenientes o eficientes.

Un enfoque común para abordar este problema implica anonimizar o generar datos sintéticos manualmente para realizar pruebas. Sin embargo, esto puede llevar mucho tiempo y ser propenso a errores, lo que genera posibles riesgos de seguridad. A medida que avanza la tecnología, una nueva solución de código abierto llamada Neosync ha surgido para agilizar y simplificar este proceso.

Neosincronización es una plataforma diseñada para conectarse sin problemas a una instantánea de una base de datos de producción, lo que permite a los equipos generar datos sintéticos basados ​​en el esquema de producción o anonimizar los datos de producción existentes. Estos datos anonimizados o sintéticos se pueden sincronizar en varios entornos, incluido el desarrollo local, la puesta en escena y las pruebas de integración continua.

Las características clave de Neosync incluyen su capacidad para generar automáticamente datos sintéticos, anonimizar información confidencial y crear subconjuntos de la base de datos de producción para necesidades de prueba específicas. La plataforma sigue un enfoque basado en GitOps y se adapta perfectamente a los flujos de trabajo de desarrolladores existentes. Neosync también garantiza la integridad referencial de los datos, abordando las preocupaciones sobre claves externas rotas que pueden surgir durante las pruebas.

Un aspecto notable de Neosync es su canal asincrónico integral, que maneja los reintentos de trabajo, las fallas y la reproducción utilizando un modelo de fuente de eventos. Esto garantiza un entorno de pruebas sólido y confiable para los desarrolladores. La plataforma admite varios tipos de datos con transformadores prediseñados y permite a los usuarios definir transformadores personalizados para requisitos específicos.

Neosync demuestra sus capacidades al ofrecer una experiencia de desarrollador de clase mundial que se integra perfectamente en cualquier flujo de trabajo. Su compatibilidad con múltiples sistemas de bases de datos, incluidos Postgres y MySQL, y soluciones de almacenamiento como S3 mejoran su versatilidad. El uso de Kubernetes y Docker por parte de la plataforma, junto con herramientas como Tilt, proporciona un entorno de desarrollo eficiente y escalable.

En conclusión, Neosync es una solución valiosa para los desarrolladores que buscan un equilibrio entre pruebas eficientes y privacidad de datos. Su naturaleza de código abierto permite a los equipos mantener sus datos más confidenciales dentro de su infraestructura, promoviendo un entorno de prueba seguro y confiable. Con características como generación automática de datos, anonimización y soporte para varias bases de datos, Neosync se alinea con las mejores prácticas de los desarrolladores modernos, contribuyendo a crear aplicaciones mejores y más resistentes.


Revisar la Proyecto. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides unirte. nuestro SubReddit de 33k+ ML, 41k+ comunidad de Facebook, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias sobre investigaciones de IA, interesantes proyectos de IA y más.

Si te gusta nuestro trabajo, te encantará nuestra newsletter.


Niharika es pasante de consultoría técnica en Marktechpost. Es estudiante de tercer año y actualmente cursa su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT), Kharagpur. Es una persona muy entusiasta con un gran interés en el aprendizaje automático, la ciencia de datos y la inteligencia artificial y una ávida lectora de los últimos avances en estos campos.