TISI
L'IA protectrice de données ? - Version imprimable

+- TISI (https://www.tisi-fr.com/board)
+-- Forum : La cafet' (https://www.tisi-fr.com/board/forumdisplay.php?fid=14)
+--- Forum : Le journal (https://www.tisi-fr.com/board/forumdisplay.php?fid=15)
+--- Sujet : L'IA protectrice de données ? (/showthread.php?tid=4758)



L'IA protectrice de données ? - Ciroc - 04-12-2024

L'IA protectrice de données ?
Les données personnelles, souvent au cœur des scandales, sont une vraie source d’inquiétude. Pour y remédier, découvrez PII Masker, qui est un outil open-source qui utilise l’intelligence artificielle pour protéger vos informations sensibles.
Grâce à son modèle DeBERTa-v3, PII Masker repère et masque automatiquement les données personnelles (noms, adresses, numéros, etc.) dans vos documents. En quelques secondes, il remplace ces informations par des marqueurs génériques comme [NOM] ou [ADRESSE], tout en préservant la qualité du document.
Simple d’utilisation, cet outil ne nécessite aucune expertise en IA ou cryptographie pour sécuriser efficacement vos données.

Les performances : 
 
Les performances de cette IA protectrice fonctionne grâce au support des tokens de 1024 caractères, PII Masker peut traiter efficacement des documents longs, il est open-source, ce qui permet de l’adapter aux besoins spécifiques des utilisateurs.
 
Pour les entreprises qui ont peur de la conformité réglementaire (RGPD, CCPA et compagnie), PII Masker est réel solution le permettant de les respecter. Il aide principalement à la protection des données, réduisant les risques d’erreurs ainsi que les coûts de mise en conformité.

L'installation : 
 
Pour l’installer, rien de plus simple. Un petit
Code :
git clone https://github.com/HydroXai/pii-masker-v1.git

[b][font=Arial,Helvetica,sans-serif]puis taper : [/font][/b]
pip install -r requirements.txt

[font=Arial,Helvetica,sans-serif][size=medium][b]L'utilisation : [/b][/size][/font]
La question principal que beaucoup de potentielle futur utilisateur se pose est comment l'utiliser et est ce simple ? Il est très facile à l’utiliser comme première étape de traitement pour nettoyer vos données avant de les injecter dans vos systèmes d’IA conversationnelle ou vos bases de connaissances.
Pour l'utiliser il suffit simplement de taper quelques lignes de code : 
Code :
from model import PIIMasker<br></br>masker = PIIMasker()<br></br>text = "Jean Dupont habite au 123 rue des Lilas"<br></br>masked_text, pii_dict = masker.mask_pii(text)<br></br>print(masked_text) 
Code :
# Affiche : "[NOM] habite au [ADRESSE]"
 
Pour finir je dirais que si vous manipulez des données sensibles, je vous conseille vivement de jeter un œil à cet outil. Il pourrait bien devenir votre meilleur allié dans la bataille pour la protection des données personnelles.
 



RE: L'IA protectrice de données ? - EnZ0 - 09-12-2024

Franchement, PII Masker, c’est une belle trouvaille. L’idée d’utiliser DeBERTa-v3 pour repérer et anonymiser automatiquement les données personnelles est hyper pratique, surtout dans un contexte dans lequel la conformité (RGPD, CCPA) devient incontournable.

Le fait que ce soit open-source, c’est un gros point fort. Ça permet de le customiser selon les besoins spécifiques d’une entreprise ou d’un projet. Par exemple, pour un étudiant SLAM qui développe une appli manipulant des informations sensibles, intégrer ça directement pourrait éviter pas mal de galères. En plus, le processus d’installation est ultra-simple (un git clone et un pip install, on a vu plus compliqué).

L’utilisation en elle-même a l’air fluide. Une API simple, du Python basique, et hop, les données sensibles sont masquées. Le gain de temps pour les développeurs est clair, notamment quand il s’agit de nettoyer des tonnes de données avant de les injecter dans un chatbot ou une base de connaissances.

Bref, c’est un outil qui a l’air prometteur, surtout pour ceux qui bossent ou veulent bosser dans des environnements dans lesquels la sécurité des données est primordiale.