Avec la généralisation de l'intelligence artificielle (IA) dans les entreprises, la question d'un développement et d'une utilisation des systèmes d'IA conformes à la protection des données gagne fortement en importance. Le site Conférence sur la protection des données (DSK) a publié à cet effet en juin 2025 le "Guide des mesures techniques et organisationnelles recommandées pour le développement et l'exploitation de systèmes d'intelligence artificielle". Ce document concrétise les exigences de la RGPD pour les traitements liés à l'IA et fournit un guide pratique pour les fabricants, les développeurs et les utilisateurs en ce qui concerne les systèmes d'IA.
Approche axée sur le cycle de vie et champ d'application des systèmes d'IA
La DSK articule les exigences posées aux systèmes d'IA tout au long de leur cycle de vie :
- Phase de conception
- Phase de développement
- Phase d'introduction
- Exploitation et suivi
Chaque phase est évaluée en tenant compte des sept objectifs de garantie du site Modèle standard de protection des données (SDM) évalué :
- Minimisation des données
- Disponibilité
- Confidentialité
- Intégrité
- Intervenabilité
- Transparence
- Non-enchaînement
Bases légales et responsabilités pour les systèmes d'IA
Les systèmes d'IA sont entièrement soumis à la RGPD. Les principes de base suivants sont notamment pertinents :
- Légitimité (art. 6 RGPD)
- Affectation des fonds (art. 5, al. 1, let. b RGPD)
- Minimisation des données (art. 5, al. 1, let. c RGPD)
- Transparence et Obligations d'information (Art. 13, 14 RGPD)
- Droits des personnes concernées (Art. 15-22 RGPD)
- Analyse d'impact sur la protection des données (Art. 35 RGPD)
- Sécurité des Traitement (Art. 32 RGPD)
Fabricants et développeurs sont généralement considérés comme Responsable pour les phases de conception et de développement. Organisations d'utilisateurs assument la responsabilité de l'introduction et de l'exploitation
1ère phase de conception
La phase de conception constitue la base d'un développement de systèmes d'IA respectueux de la protection des données. C'est à ce stade précoce que des décisions essentielles sont prises concernant l'objectif, l'architecture et le traitement des données du système. L'objectif est de prendre en compte et de mettre en œuvre de manière adéquate les exigences en matière de protection des données dès le début.
Un élément central est ici la Transparence. Responsable doivent documenter en détail les sources des données de formation et garantir leur origine légale. L'établissement de ce que l'on appelle "Datasheets for Datasets" s'est établi comme une bonne pratique. Ces fiches de données décrivent notamment les catégories de données, les méthodes de collecte, l'objectif et l'origine des données de manière compréhensible.
Dans le cadre de la Minimisation des données il convient d'examiner quelles catégories de données sont réellement nécessaires pour la fonctionnalité visée du système d'IA. Il convient de choisir des algorithmes aussi peu gourmands en données que possible. L'utilisation de données anonymes ou synthétiques doit toujours être envisagée. Des études pilotes et des analyses préliminaires permettent d'évaluer de manière réaliste les besoins réels en données personnelles.
Du point de vue de la non-concaténation, il convient d'éviter les risques qui pourraient résulter de l'association de données provenant de sources différentes. L'utilisation d'attributs de proxy, qui permettent de déduire indirectement des caractéristiques sensibles, est particulièrement critique.
Afin de Droits des personnes concernées (par ex. renseignements, Rectification, Suppression), il convient de définir, dès la phase de conception, des processus organisationnels et des mesures techniques d'interopérabilité.
De plus, les exigences en matière de Disponibilité, Intégrité et Confidentialité doivent être prises en compte. En font partie la mise en place de concepts de sauvegarde robustes, des mesures pour l'intégrité des données et du système ainsi que des dispositions contre l'empoisonnement des données ou les attaques par porte dérobée. Les mécanismes de contrôle d'accès et les stratégies de cryptage devraient également être spécifiés dès la conception.
2ème phase de développement
Dans la phase de développement d'un système d'IA, les exigences définies lors de la phase de conception sont concrètement mises en œuvre sur le plan technique. Au cours de cette phase, les algorithmes d'IA sont implémentés, les données d'entraînement sont préparées et l'entraînement proprement dit ainsi que la validation des modèles d'IA sont effectués.
A ce stade, une préoccupation centrale du guide d'orientation de DSK est Transparence. Responsable doivent donc documenter de manière exhaustive l'ensemble du processus d'entraînement. Cela inclut une description précise des données d'entraînement, des méthodes d'entraînement utilisées et des critères de sélection des algorithmes utilisés. Toutes les décisions d'entraînement qui ont une influence sur la performance ultérieure du modèle et le traitement des données doivent également être consignées de manière compréhensible.
Dans l'esprit de la Minimisation des données seules les données absolument nécessaires à l'objectif de formation défini peuvent être traitées. Une collecte de données excessive ou spéculative n'est pas autorisée. Il faut veiller, en particulier dans le cas de "systèmes d'IA composés" de conception modulaire, à ce que chaque composant ne reçoive que les données qui lui sont nécessaires.
L'objectif de garantie de non-enchaînement exige que les modèles d'IA soient entraînés exclusivement pour l'objectif défini lors de la phase de conception. L'acquisition involontaire d'informations sensibles supplémentaires (par exemple à partir de variables fortement corrélées) doit être activement empêchée. Des mécanismes de contrôle statistiques et techniques appropriés doivent être mis en œuvre à cet effet.
En ce qui concerne la possibilité d'intervention, il faut s'assurer dès le développement que les demandes ultérieures de suppression ou de correction sont techniquement réalisables. Des procédures telles que le "Machine Unlearning" ou le réentraînement modulaire sans certains ensembles de données doivent donc être prises en compte très tôt.
Concernant les Intégrité les responsables doivent s'assurer que les données de formation, de validation et de test sont correctes, complètes et exemptes de toute manipulation. Des mesures telles que la validation des données, la détection des biais et la protection contre l'empoisonnement des données et les attaques adverses (par exemple, les attaques par évasion) sont obligatoires.
De même, les Confidentialité joue un rôle prépondérant : les données d'entraînement et les modèles doivent être protégés contre les accès non autorisés ainsi que contre les attaques telles que l'extraction de modèles ou les attaques par inférence de membres. Le cas échéant, les résultats intermédiaires doivent être anonymisés ou agrégés afin de minimiser la référence aux personnes.
3ème phase d'introduction
La phase d'introduction décrit le passage d'un système d'IA de l'environnement de développement à l'utilisation productive. Au cours de cette phase, les questions relatives à la distribution et à la configuration du logiciel dans le respect de la protection des données sont notamment au centre des préoccupations.
Un objectif essentiel est d'être transparent vis-à-vis des utilisateurs et des personnes concernées. Les responsables doivent fournir des informations sur le fonctionnement du système d'IA, les sources de données utilisées, l'architecture du système et les facteurs influençant la prise de décision. Les options de configuration et leurs conséquences en termes de protection des données doivent également être documentées de manière compréhensible. Cela inclut également la divulgation des éléments livrés du système d'IA (par exemple, les paramètres du modèle, les versions du système, les fichiers de configuration).
En ce qui concerne les Minimisation des données il convient de s'assurer que seules les données à caractère personnel nécessaires à l'utilisation prévue sont mises à disposition et traitées. La distinction entre les modèles paramétriques (par exemple, les réseaux neuronaux qui ne contiennent plus de données brutes) et les modèles non paramétriques (par exemple, les algorithmes de k-voisins qui nécessitent toujours des données d'apprentissage) est particulièrement pertinente. Ces différences influencent les données qui peuvent être transférées dans le cadre de la distribution de logiciels.
Du point de vue de la Confidentialité des mesures de protection appropriées doivent être prises lors de la mise à disposition et de la distribution du système d'IA. Ces mesures comprennent notamment des techniques de cryptage, des restrictions d'accès et le contrôle du cercle des destinataires de la distribution du logiciel. Si des données d'entraînement à caractère personnel font partie du système distribué, elles doivent également faire l'objet de mesures de protection spécifiques.
En outre, il convient de noter que la livraison du système peut être pertinente du point de vue de la protection des données, même si, à ce stade, il n'y a pas d'action active. Traitement des données à caractère personnel est effectuée, car elle constitue la base des traitements de données ultérieurs.
Globalement, la phase d'introduction pose la première pierre d'un environnement d'exploitation du système d'IA respectueux de la protection des données. Elle nécessite une planification minutieuse, Documentation et la sécurisation technique des composants logiciels livrés.
Conseil de lecture : Intérêt légitime dans le développement de systèmes d'IA : Orientation de la CNIL
4. exploitation et suivi
La phase "Exploitation et surveillance" décrit l'utilisation active d'un système d'IA ainsi que la surveillance continue de son fonctionnement et de sa conformité avec la protection des données. Elle commence par la validation du système d'IA pour une utilisation productive et comprend toutes les activités courantes d'exploitation et de maintenance.
L'un des principaux objectifs du guide d'orientation de DSK à ce stade est de Transparence. Responsable doivent donc documenter toutes les opérations de traitement, les mises à jour du système et les adaptations du modèle de manière à ce qu'elles puissent faire l'objet d'un audit. Cela comprend notamment l'enregistrement des données utilisées, des versions du modèle d'IA et des modifications apportées au système. L'historique des décisions du système d'IA doit également être archivé de manière compréhensible, dans la mesure du possible, en particulier pour les décisions automatisées ayant un effet juridique.
En ce qui concerne les Minimisation des données il convient de vérifier en permanence si les données à caractère personnel collectées et traitées dans l'entreprise sont encore nécessaires aux fins fixées. Si ce n'est pas le cas, les données doivent être supprimées ou rendues anonymes. Le retour d'informations des utilisateurs en vue d'améliorer le système d'IA nécessite également une gestion économe des données. Traitement assurer.
La possibilité d'intervenir doit être garantie à tout moment. Cela implique la possibilité Droits des personnes concernées comme des renseignements, Rectification ou Suppression à tout moment de manière efficace. Des solutions techniques telles que des systèmes de filtrage ou des contrôles d'entrée et de sortie permettent d'éviter ou de corriger les sorties de modèles non souhaitées. Obligations de suppression concernant les données contenues dans le modèle données à caractère personnel (Machine Unlearning) doivent également être mises en œuvre si cela est techniquement possible.
Afin de Intégrité du système d'IA, les entreprises doivent s'assurer qu'il n'est pas compromis par des attaques adverses (par exemple, des entrées manipulées) ou des modifications non autorisées du modèle. Des tests réguliers, des validations et des évaluations des risques - par exemple par le biais de Red Teaming - sont des éléments importants d'une exploitation sécurisée.
De même, les Confidentialité est d'une importance capitale dans les opérations courantes. Contrôles d'accès, Cryptage et la journalisation doivent empêcher que des personnes non autorisées aient accès à des paramètres de modèle sensibles ou à des données de base. données à caractère personnel En particulier lors de l'utilisation de systèmes de génération augmentée de recherche (RAG), il convient de surveiller de près qui a le droit d'accéder à quelles sources de données.
Aspects supplémentaires pour les systèmes d'IA
En complément des exigences liées aux différentes phases du guide d'orientation de la CCPD, il existe d'autres aspects importants pour le développement et l'exploitation de systèmes d'IA dans le respect de la protection des données.
Gestion des systèmes d'IA à haut risque
Les systèmes d'IA dits à haut risque au sens du règlement sur l'IA (RI) sont soumis à des exigences accrues. Celles-ci concernent en particulier la Documentation des données, des algorithmes et des décisions de modélisation utilisés, ainsi qu'un système de gestion de la qualité obligatoire. Les entreprises doivent s'assurer que les systèmes d'IA ont fait l'objet des procédures d'évaluation de la conformité requises. Des analyses de risques régulières et la réalisation d'une Analyse d'impact sur la protection des données (DSFA) sont obligatoires à cet égard.
Prise en compte des modèles de tiers
Lors de l'utilisation de modèles d'IA développés en externe ou pré-entraînés (par exemple, des LLM open source ou des services basés sur des API), des contrôles supplémentaires de sécurité et de protection des données doivent être effectués. Il s'agit notamment
- Une vérification de l'origine et de la qualité des données de formation
- Le contrôle d'éventuelles attaques par porte dérobée ou empoisonnement des données
- La garantie contractuelle des obligations de protection des données par le fournisseur
- L'évaluation des risques d'extraction de modèles ou d'attaques par inférence de membres
Les entreprises devraient s'assurer que la traçabilité et l'intégrité des données sont également garanties. Transparence de ces modèles tiers soit documentée. En outre, l'utilisation de tels modèles doit être régulièrement vérifiée quant à sa conformité avec le RGPD.
Rédaction du contrat
La DSK recommande de tenir compte des exigences spécifiques en matière de protection des données dès la rédaction des contrats avec les fournisseurs et les prestataires de services. Les éléments importants du contrat devraient être, entre autres
- Définition claire des responsabilités (rapport contrôleur-processeur)
- Prescriptions relatives aux mesures techniques et organisationnelles (TOM)
- Droits d'audit et de contrôle du pouvoir adjudicateur
- Règles relatives à la restitution, à l'effacement et à la portabilité des données
- Accords sur les obligations de notification en cas de violation de la protection des données
En particulier lors de l'utilisation d'offres d'IA en tant que service, des dispositions contractuelles sont essentielles pour garantir un niveau de protection des données approprié, même dans le cas de processus de traitement externalisés. Traitement des systèmes d'IA à haut risque Des exigences supplémentaires en matière de documentation et de gestion de la qualité s'appliquent aux systèmes d'IA à haut risque conformément au règlement sur l'IA.
Conclusion et recommandations pour la pratique
Le guide d'orientation de DSK offre pour la première fois une une guidance systématique, pratique et juridiquement fondée pour l'ensemble du cycle de vie de l'IA. Elle pose des exigences élevées en matière de Documentationla conception technique et les processus organisationnels. Les entreprises doivent rapidement Protection des données intégrer à toutes les étapes du développement et de l'utilisation de l'IA.
La mise en œuvre des exigences définies dans le guide d'orientation de la DSK exige des entreprises une approche stratégique et structurée. Les recommandations suivantes ont pour but d'aider les organisations à intégrer de manière pratique et efficace les exigences de la législation sur la protection des données dans leurs processus :
- Élaborer un plan d'action sur la protection des données de l'IA : Avant même le début du projet, il convient d'élaborer un plan détaillé définissant les contrôles, les mesures et les responsabilités nécessaires en matière de protection des données. Ce plan devrait tenir compte de toutes les phases du cycle de vie d'un système d'intelligence artificielle.
- Réalisation précoce et répétée d'analyses d'impact sur la protection des données (AIPD) : Un DSFA doit être effectué pour tous les projets d'IA à haut risque. Il est recommandé d'adopter une approche itérative : les premières évaluations ont lieu dès la phase de conception, suivies de mises à jour lors des phases de développement et d'exploitation.
- Création d'un organe de gouvernance de l'IA : Cette équipe interdisciplinaire composée de responsables de la protection des données, de spécialistes de la sécurité informatique, de développeurs d'IA et de responsables de la conformité pilote le suivi des projets d'IA en matière de protection des données, évalue les risques et coordonne les mesures.
- des formations et des mesures de sensibilisation pour les équipes de développeurs et de produits : Il est essentiel de sensibiliser toutes les personnes impliquées dans un projet d'IA aux exigences en matière de protection des données. Cela implique des formations sur des sujets tels que Minimisation des donnéesLes exigences en matière de transparence, les évaluations des risques et les droits des personnes concernées.
- Mise en place d'un processus de suivi et d'audit : Les entreprises devraient surveiller en permanence la conformité de leurs systèmes d'IA avec les exigences en matière de protection des données. Cela implique des audits réguliers des processus de traitement des données, la vérification de l'efficacité des mesures techniques de protection et une évaluation permanente des risques.
- Documentation et la gestion des preuves : Toutes les décisions, mesures et vérifications relatives à la protection des données devraient être documentées de manière compréhensible, afin de répondre aux exigences de l'obligation de rendre compte visée à l'article 5, paragraphe 2. RGPD de répondre à la demande.
- Définir un plan de réponse aux incidents pour les violations de données liées à l'IA : Comme les systèmes d'IA présentent des risques spécifiques, il devrait exister un plan d'urgence définissant des voies de réaction et de notification rapides en cas d'incidents de protection des données, ainsi que des contre-mesures appropriées.
Prochaines étapes avec Ailance - Integrated Risk Management
Vous souhaitez mettre en œuvre les exigences de l'aide à l'orientation de DSK de manière efficace et durable dans votre entreprise ? Notre logiciel Ailance - Gestion intégrée des risques vous aide à identifier, évaluer et gérer les risques liés à la protection des données à toutes les étapes du cycle de vie de l'IA.
Avec Ailance, vous pouvez
Réaliser et documenter systématiquement des analyses d'impact sur la protection des données (AIPD)
Mesures techniques et organisationnelles (TOMs) spécifiques à l'IA et en assurer le suivi
Gérer efficacement les risques liés à vos fournisseurs et à vos tiers
établir des documentations d'audit et de conformité pour les contrôles internes et externes
Droits des personnes concernées et gérer efficacement les processus de réponse aux incidents
Prenez rendez-vous avec nous, cela en vaut la peine !





