Les dades sintètiques són dades artificials generades a partir de dades originals utilitzant un model entrenat per reproduir-ne les característiques i l’estructura.
Així, ajudem les empreses a superar els desafiaments relacionats amb la ciberseguretat, la privadesa i la confidencialitat de les dades mentre utilitzem tècniques avançades de modelatge d’informació i intel·ligència artificial.
Gestionant la governança de dades
Les dades sintètiques poden funcionar com una tecnologia de privadesa millorada (Privacy Enhanced Technology, PET en anglès): aplicant la protecció de dades des del disseny algorítmic en casos en què s’utilitzen dades personals. Les dades sintètiques ofereixen una solució per superar les limitacions d’accés a dades reals, permetent testar, entrenar algorismes i desenvolupar aplicacions sense exposar informació sensible. En el desenvolupament, els tests i la validació de serveis d’aprenentatge automàtic, en què les dades reals no estan disponibles en quantitats suficients, les dades sintètiques també hi tenen un paper crucial.
-
- Compliment del RGPD. Garantim la privadesa de les dades més enllà de la simple anonimització i evitem la necessitat d’agregar dades compartides amb els proveïdors. Aconseguim un equilibri entre la privadesa i la utilitat, permetent als proveïdors i operadors de dades desenvolupar els seus serveis i anàlisis de manera adequada.
- Treballar amb dades sintètiques. Les “noves” dades sintètiques que creem proporcionaran la mateixa informació útil que les dades originals amb l’avantatge que no revelen cap dada sensible i redueixen el risc en cas de fallada en la ciberseguretat.
- Evitar que la informació sensible pugui ser inferida a partir de les dades compartides. Superem el desafiament freqüent d’evitar el reconeixement de persones en funció de comportaments o dades relacionades, fins i tot si les dades ja estan anonimitzades. Per exemple: “En Joan va a l’hospital infantil amb moto el 2 de juliol/span>“. Fins i tot si eliminem l’ID o el nom de les dades, podríem identificar-lo fàcilment.
Gestionant la privadesa mentre extraiem valor de les dades
Superem les limitacions de l’anonimització tradicional, evitant tant la identificació directa com les inferències indirectes.
Per exemple, les nostres dades sintètiques ens permeten mantenir la integritat de patrons i tendències crítics, cosa que és essencial per a l’anàlisi predictiva o la identificació de comportaments sense comprometre la privadesa individual.
Dos casos d’ús il·lustratius podrien ser:
-
- Planificació urbana: les dades sintètiques permeten modelar els patrons de mobilitat sense revelar la ubicació exacta de les persones, protegint així la seva privadesa i optimitzant els sistemes de transport.
- Assistència sanitària: les dades sintètiques poden permetre una millor personalització dels tractaments, alhora que protegeixen la informació de l’historial sanitari del pacient, així com les seves dades de comportament. Això generaria millors resultats, adherència al tractament, així com entrenar futurs models per ajudar els professionals de la salut en diagnòstics avançats.
En essència, la nostra solució de dades sintètiques és una eina valuosa per equilibrar la privadesa i la utilitat en processar dades.






























