Secrets Dévoilés : Comment des Milliers de Mots de Passe Nourrissent l’Intelligence Artificielle

Fuite de données sensibles dans les IA : une alerte de sécurité majeure

Une découverte alarmante a été faite au sein du projet Common Crawl : près de 12 000 informations sensibles, y compris des clés API et des mots de passe, se trouvent dans un corpus utilisé pour entraîner des intelligences artificielles telles que ChatGPT. Ce constat suscite des préoccupations significatives concernant la protection des données utilisées par ces technologies avancées.

Une analyse révélatrice des données

Des chercheurs de Truffle Security ont exploré 400 téraoctets de données provenant de 2,67 milliards de pages web et ont identifié un total de 11 908 données sensibles dans le référentiel de Common Crawl. Collectées depuis 2008, ces données ouvertes sont indispensables à l’entraînement de modèles linguistiques, utilisés notamment par des entreprises de premier plan comme OpenAI, Google et Meta pour développer des IA plus efficaces.

« Nous avions des soupçons quant à la présence d’identifiants codés dans ces données, pouvant influencer le comportement des modèles d’IA », confie un porte-parole de Truffle Security.

Les conséquences d’une telle fuite

Cette situation met en lumière un enjeu grandissant : l’entraînement des modèles d’IA sur des données non sécurisées peut entraîner des conséquences imprévues, comme la divulgation involontaire d’informations sensibles. Bien que les données soient censées subir un traitement visant à éliminer les informations nuisibles ou inutiles, la présence de données critiques soulève un sérieux malaise.

Parmi les données sensibles révélées, on trouve des clés API valides qui donnent accès à des services comme Amazon Web Services (AWS) et MailChimp, avec un grand nombre de clés concernant cette dernière plateforme d’automatisation des courriels.

Des pratiques de développement à revoir

Truffle Security souligne que la cause de cette fuite réside dans une pratique de développement inappropriée : des informations sensibles telles que des identifiants ont été intégrées directement dans le code des formulaires HTML et des scripts JavaScript. Certains identifiants étaient même répétés, exacerbant ainsi les risques en cas de compromission.

En réponse à cette découverte préoccupante, Truffle Security a contacté toutes les entreprises dont les clés et mots de passe ont été exposés. Grâce aux efforts conjoints de ces organisations, plusieurs milliers de clés ont été révoquées pour remédier à cette situation.

Pour suivre toutes les actualités de 01net, abonnez-vous à notre page sur Google Actualités et WhatsApp.

Intelligence Artificielle

Source : Truffle Security

Source : www.01net.com

Veuillez vous connecter pour commenter.