IA Générative : gare à l’empoisonnement des données

La lettre de Frédéric Simottel n°57

BFM Business Cybersécurité

5 min ⋅ 12/06/2024

Dans la newsletter d’aujourd’hui:

Pour les abonnés gratuits:

L’édito: “ IA Générative : gare à l’empoisonnement des données ” par Frédéric Simottel

Pour les abonnés payants:

Études: Une campagne malveillante baptisée « Matriochka ».
La Tribune: “NIS 2 : il est temps de s’y préparer” par Nicolas Lacourte chez NXO.
A ne pas manquer sur le web: Un jeune français, surdoué, bac à 12 ans, Polytechnicien à 17, doctorat en cyberbersécurité à 21 ans.

Depuis l’avènement de l’IA générative. Ils sont plusieurs à prévenir des risques cyber liés à l’IA. Malgré tous leurs atouts, ces technologies sont en effet vulnérables. L’institut de sécurité de l’IA du gouvernement britannique a ainsi révélé il y a quelques jours que ses chercheurs avaient testé - sans les citer- la vulnérabilité de quatre modèles d’IA. Résultat, ces systèmes se sont montrés extrêmement peu sécurisés même face à des piratages de base. Pire, certains ont même généré des « résultats nuisibles » sans même que les chercheurs n’essaient de les produire. Certes, la majorité des modèles d’IA accessibles au grand public disposent de mesures de protection. Une IA ne vous donnera pas aussi facilement la formule du cocktail Molotov. Il n’empêche, l’heure est à la vigilance et même avec des technologies aussi évoluées, il ne faut jamais sous-estimer l’importance de la sécurité.

IA Générative : gare à l’empoisonnement des données

Non bien entendu l’IA, comme toutes technologies, n’est pas à l’abri d’attaques cyber. Ce que confirme Patrice Caine, P-DG de Thales dans une interview donnée au journal La Tribune Dimanche (9 juin 2024). « L’IA soulève évidemment des questions sur sa vulnérabilité. Elle peut faire, elle aussi, l’objet d’attaques ciblées ». Il précise d’ailleurs que des hackers éthiques de Thales ont réussi à détourner ChatGPT. Et que l’IA n'aura pas d’avenir dans la durée si on ne peut pas la protéger des menaces cyber. Bref si nous voulons continuer à injecter de l’IA à tous les étages (dans les capteurs ou les systèmes d’aide à la décision, pour ce qui est de Thales), nous avons intérêt à être certains que ni données, ni algorithmes ne soient corrompues par des attaques cyber IA. Et pour cela, il faut se lancer dans une grande chasse aux failles.

Les experts dans le domaine n’ont évidemment pas attendu l’avènement de ChatGPT pour monter en régime. Un exemple avec la découverte des chercheurs de l’industriel américain Synopsis. Ils ont mis à jour une vulnérabilité d’empoisonnement des données dans l’application EmbedAI, spécialisée dans la création de chatbots via ChatGPT et Gemini. La faille porte ainsi sur la gestion des sessions sécurisées et la politique de partages des ressources.

Une fois exploitée, cette faille peut venir perturber en temps réel le fonctionnement du modèle et impacter sa fiabilité et surtout la sécurité des systèmes qui en dépendent. Pour entrer plus en détail, via cette faille, les pirates vont inciter les utilisateurs finaux à exécuter des actions non désirées dans une application web dans laquelle ils avaient pourtant été authentifiés. Ils vont par exemple télécharger des données empoisonnées et mettre en péril les résultats rendus par leur modèle LLM. Outre les hallucinations, la diffusion d’informations erronées, l’introduction de biais ou des performances altérées, les applications utilisant le composant EmbedAI pourraient être exposées à des fuites de données potentielles.

Tester en permanence données et algorithmes

Parmi ses recommandations, Synopsis préconise de déconnecter des réseaux de l’entreprise, les applications a priori infectées. Mais la leçon à retenir de cet incident et que l’on peut appliquer à l’exploitation de tous les LLM existants, et que même après avoir intégré les systèmes d’IA, les développeurs doivent continuer à tester leurs process pour être certain que les contrôles mis en place pour l’accès aux applications web sont également mis en œuvre sur les API pour les applications d’IA. Le danger est évidemment qu’en déployant rapidement ces LLM et autres applications d’IA génératives, les organisations donnent accès aux potentiels hackers à d’immenses bases et référentiels de données.

Rappelons qu’en France, il existe une structure qui évalue certains des pans de ces systèmes d’IA. Le laboratoire national de métrologie et d’essais (LNE) a en effet mis au point une plateforme multi-approche destinée à évaluer la fiabilité, garantir l’utilisation sécurisée et s’assurer du respect des principes éthiques dans la conception et le fonctionnement des solutions logicielles et des dispositifs physiques dotés d’IA. Aux développeurs d’agir également pour un meilleur « design IA by cyber ».

...

BFM Business Cybersécurité

Par Frédéric Simottel

Frédéric SIMOTTEL, est éditorialiste High-Tech sur BFM BUSINESS et BFMTV. Il est également rédacteur en chef de l’éditorial de l’ensemble des évènements organisés par BFM Business (BFM Awards, Grands prix de l’accélération digitale, hors séries BFM, etc). Il présente aussi chaque week-end sur BFM Business les émissions « Tech & Co Business », un programme sur la transformation numérique des entreprises, « BFM Stratégie », un cours sur la stratégie des entreprises avec Xavier Fontanet, ancien PDG d’Essilor. Il traite également des sujets high tech chaque jour dans les journaux de l'antenne et intervient quotidiennement dans l’émission du soir « Tech & Co » sur BFM Business. Il intervient enfin sur BFM TV & RMC sur les sujets liés aux technologies. Ingénieur télécoms et réseaux de formation, ce journaliste spécialisé occupe depuis plus de 28 ans une position privilégiée en tant qu’observateur du marché high-tech. Parmi ses sujets de prédilection figurent la stratégie digitale des entreprises, l’évolution de l’écosystème IT, la cybersécurité, l’univers des startups et plus globalement les changements provoqués par l’innovation numérique (IA, Cloud, Infrastructures IT et réseaux, télécoms, mobilité, électroniques embarquée, quantique, etc). Autant de sujets dont ils se fait l’écho sur les différents canaux du groupe Altice Media (Web, TV, radio et évènements). Il intervient enfin depuis de nombreuses années en tant que keynote speaker ou animateur lors d’évènements portant sur l’innovation, le business et les technologies numériques.