Q: Qu'est-ce que l'intelligence artificielle (IA) ?

L’intelligence artificielle est le développement de machines capables d’effectuer des tâches qui requièrent en général une intelligence humaine. Elle couvre des domaines tels que la reconnaissance vocale ou textuelle, la résolution de problèmes et la prise de décisions. Le développement de l’IA nécessite souvent d’alimenter les systèmes avec énormément de données pour les aider à « apprendre ».

Q: Qu'est-ce que l'apprentissage automatique (machine learning – ML) ?

L’apprentissage automatique est un sous-ensemble de l’IA qui porte sur le développement d’algorithmes et de modèles, qui permettent aux ordinateurs d’apprendre à partir des données et de faire des prévisions (« predictions ») ou prendre des décisions sans programmation explicite. C’est un moyen pour les ordinateurs d’« apprendre » à partir d’exemples et d’améliorer leurs performances au fil du temps.

Q: Quels sont les problèmes liés à l'utilisation des données à caractère personnel dans le cadre de l'entraînement de l'IA ?

La préoccupation majeure à l’égard de l’utilisation des données à caractère personnel pour les ensembles de données d’entraînement de l’IA est de savoir si le consentement des personnes auxquelles les données appartiennent a été obtenu ou non. Les données à caractère personnel se distinguent par leur type et sensibilité. Certaines données peuvent être utilisées pour identifier une personne, d’autres peuvent être dangereuses en cas d’utilisation abusive. Les informations médicales et financières constituent de parfaits exemples de données à caractère personnel sensibles. Les données sensibles nécessitent généralement le consentement de l’utilisateur pour être collectées ou utilisées en vertu de la loi sur la protection des données. Toutefois, concernant les données à caractère personnel non sensibles, il se peut qu’un consentement soit exigé uniquement dans le cadre de la vente ou de l’utilisation de ces données à des fins de publicité ciblée, de profilage, etc. Tous les lots de données d’entraînement ne sont pas égaux. La qualité, la quantité, la diversité et l’autorisation d’utilisation peuvent considérablement varier, ce qui peut influer grandement sur l’apprentissage et les performances des systèmes. Des données mal équilibrées ou non diversifiées peuvent également produire des résultats faussés. Les résultats produits peuvent s’avérer offensants ou juridiquement précaires, par exemple recommandations discriminatoires ou identification inexacte.

Q: Le consentement de l'utilisateur peut-il être obtenu pour l'utilisation de l'IA ?

Les systèmes d’IA sont souvent encore expérimentaux et les résultats sont imprévisibles. Les entreprises peuvent informer les utilisateurs de ce pour quoi ils souhaitent utiliser les données, généralement à l’avance, mais il est possible que ces dernières soient finalement utilisées ou modifiées à des fins différentes, ou que les résultats découlant de leur utilisation soient distincts. Si les données sont analysées en grande quantité en temps réel, les mécanismes traditionnels d’obtention du consentement des utilisateurs, tels que les bandeaux cookies, peuvent ne pas être assez rapides, granulaires ou suffisants.

Q: Les systèmes d'IA peuvent-ils causer des problèmes de protection des données ?

Les systèmes d’IA orientés utilisateur peuvent être potentiellement trompeurs, auquel cas les utilisateurs fournissent des informations qu’ils n’avaient pas anticipées. Les systèmes peuvent également faire apparaître des liens plus sophistiqués et plus nébuleux entre les points de données, ce qui permet l’identification et le profilage à un niveau inédit. Ainsi, la plupart des données seraient considérées comme des données d’identification ou sensibles. Les exigences actuelles en matière de consentement peuvent ne pas répondre de manière adéquate à ce problème. Bien que les fonctions de manipulation de l’interface utilisateur et de l’expérience utilisateur trompeuses, communément appelées « interfaces truquées » soient de plus en plus pointées du doigt, voire réglementées dans certains cas, elles tendent à se concentrer sur des tactiques déjà connues. Une conception réactive pourrait permettre le développement de nouvelles méthodes plus sophistiquées de manipulation des utilisateurs.

Q: L'entraînement de l'IA a-t-il des conséquences sur le consentement lié aux cookies ?

L’utilisation de l’IA peut accélérer la disparition des cookies, en particulier des cookies tiers, car elle propose des fonctionnalités fournissant de meilleurs résultats et ne demandant pas nécessairement la collecte de données à caractère personnel. Les modèles de consentement aux cookies actuels peuvent être insuffisants pour couvrir l’utilisation de l’IA. En effet, les systèmes d’IA sont capables d’analyser de grandes quantités de données en temps réel, tandis que d’autres outils analysent les données liées aux cookies actifs au fil du temps. Pour donner son consentement avant le début de la collecte ou de l’utilisation des données avec les fenêtres contextuelles actuelles, il faudrait que l’utilisateur soit bombardé de bannières de consentement, trop rapides et nombreuses pour pouvoir être traitées par un humain.

Question 1

Qu'est-ce que l'intelligence artificielle (IA) ?

Accepted Answer

L&rsquo;intelligence artificielle est le développement de machines capables d&rsquo;effectuer des tâches qui requièrent en général une intelligence humaine. Elle couvre des domaines tels que la reconnaissance vocale ou textuelle, la résolution de problèmes et la prise de décisions. Le développement de l&rsquo;IA nécessite souvent d&rsquo;alimenter les systèmes avec énormément de données pour les aider à « apprendre ».

Question 2

Qu'est-ce que l'apprentissage automatique (machine learning – ML) ?

Accepted Answer

L&rsquo;apprentissage automatique est un sous-ensemble de l&rsquo;IA qui porte sur le développement d&rsquo;algorithmes et de modèles, qui permettent aux ordinateurs d&rsquo;apprendre à partir des données et de faire des prévisions (« predictions ») ou prendre des décisions sans programmation explicite. C&rsquo;est un moyen pour les ordinateurs d&rsquo;« apprendre » à partir d&rsquo;exemples et d&rsquo;améliorer leurs performances au fil du temps.

Question 3

Qu'est-ce qu'un grand modèle de langage (large language model – LLM) ?

Accepted Answer

Les grands modèles de langage constituent une avancée récente de la recherche sur l&rsquo;IA. Ils sont conçus pour comprendre et générer un langage de type humain. ChatGPT d&rsquo;OpenAI et Bard de Google sont des exemples de LLM accessibles au public. Certaines fonctionnalités développées à l&rsquo;aide de ces outils peuvent être utilisées à des fins d&rsquo;optimisation des moteurs de recherche, de contenu marketing et à d&rsquo;autres fins commerciales.

Question 4

Comment les systèmes d'IA sont-ils entraînés ?

Accepted Answer

L&rsquo;entraînement de l&rsquo;IA consiste, pour un système d&rsquo;IA, à assimiler des schémas et faire des prévisions ou prendre des décisions en fonction des données qui lui sont fournies. L&rsquo;entraînement est essentiel au développement de systèmes d&rsquo;IA capables d&rsquo;effectuer des tâches spécifiques, de reconnaître des modèles, de fournir des informations précises ou de prendre des décisions éclairées.
Voici une description détaillée du processus d&rsquo;entraînement de l&rsquo;IA :

Collecte de données : La première étape consiste à recueillir des données pertinentes et représentatives. Elles servent de données d&rsquo;entrée pour l&rsquo;entraînement du modèle d&rsquo;IA. La qualité et la diversité des données ont un impact direct sur les performances du modèle.
Prétraitement des données : Les données brutes nécessitent souvent un nettoyage, une transformation et une structuration pour s&rsquo;adapter au processus d&rsquo;entraînement. Cette étape consiste à éliminer les éléments non désirés, à gérer les valeurs manquantes et à standardiser les données.
Ingénierie des caractéristiques : L&rsquo;ingénierie des caractéristiques englobe la sélection et la transformation des attributs (caractéristiques) pertinents dans les données et utilisés par le modèle pour faire des prévisions. Une ingénierie des caractéristiques efficace peut avoir une influence significative sur les performances du modèle.
Sélection du modèle : En fonction du problème, un algorithme ou un modèle d&rsquo;apprentissage automatique adapté est choisi. Chaque modèle a des capacités différentes et est spécialisé dans certains types de tâches, tels que la régression, la classification ou le regroupement.
Entraînement : C&rsquo;est le cœur du processus. Pendant la phase d&rsquo;entraînement, le modèle reçoit les données d&rsquo;entrée ainsi que les données de sortie souhaitées correspondantes. Le modèle ajuste ses paramètres internes de manière itérative pour minimiser la différence entre ses prévisions et les résultats réels.
Fonction de perte : La fonction de perte est utilisée pour quantifier la mesure dans laquelle les prévisions du modèle correspondent aux résultats réels. L&rsquo;objectif de l&rsquo;entraînement est de minimiser cette fonction de perte, en apprenant globalement au modèle comment faire de meilleures prévisions au fil du temps.
Optimisation : Des techniques d&rsquo;optimisation, telles que l&rsquo;algorithme du gradient (gradient descent), sont utilisées pour affiner les paramètres du modèle de manière à minimiser la fonction de perte.
Validation : Processus qui vise à garantir que le modèle entraîné traite correctement les nouvelles données. Un ensemble de données de validation distinct est utilisé pour évaluer ses performances. Cette étape permet d&rsquo;éviter le surapprentissage, lorsque le modèle fonctionne bien sur les données d&rsquo;entraînement, mais pas sur les nouvelles données.
Réglage des hyperparamètres : De nombreux modèles disposent d&rsquo;hyperparamètres, soit des paramètres influant sur le processus d&rsquo;apprentissage. Ces paramètres doivent être ajustés pour trouver l&rsquo;équilibre optimal entre un sous-apprentissage et un surapprentissage.
Test et déploiement : Une fois que le modèle fonctionne correctement sur les données d&rsquo;entraînement et de validation, il peut être testé sur un ensemble de données test distinct pour évaluer ses performances réelles. Si les résultats sont satisfaisants, le modèle peut être déployé pour utilisation.

Le processus d&rsquo;entraînement de l&rsquo;IA implique une combinaison de données, d&rsquo;algorithmes et d&rsquo;optimisation itérative pour créer un modèle capable de faire des prévisions précises ou de prendre des décisions adaptées. Il convient de noter que l&rsquo;entraînement d&rsquo;un modèle d&rsquo;IA nécessite une expertise, une évaluation minutieuse et une compréhension des problématiques spécifiques au domaine pour garantir des résultats efficaces et fiables.

Question 5

Quelles données à caractère personnel utiliser pour entraîner les systèmes d'IA ?

Accepted Answer

L&rsquo;IA peut être entraînée au moyen de nombreuses catégories de données, en fonction des objectifs du système (répondre à des questions, prendre des décisions, générer des graphiques ou du texte, etc.).
Voici quelques catégories de données d&rsquo;entraînement de l&rsquo;IA habituelles :

Textes : issus notamment de livres, d&rsquo;articles, de sites web ou de réseaux sociaux ; utilisés pour la traduction, l&rsquo;analyse des sentiments, le développement des assistants virtuels de type chatbots, etc.
Images : tirées d&rsquo;un grand nombre d&rsquo;images légendées ; utilisées pour la reconnaissance d&rsquo;images, la détection d&rsquo;objets et la génération d&rsquo;images.
Contenus audio : comme des mots prononcés, des sons ou des schémas acoustiques ; utilisés pour la reconnaissance vocale, les assistants vocaux et les modèles d&rsquo;analyse audio.
Données vidéo : des séquences vidéo ; utilisées dans l&rsquo;analyse vidéo, la surveillance, la génération de vidéo et pour l&rsquo;apprentissage des modèles temporels.
Données de jeu : tirées des données de jeu et des interactions ; utilisées pour développer le jeu et la stratégie.
Données structurées : extraites notamment de bases de données ou de feuilles de calcul ; utilisées pour l&rsquo;analyse prédictive, les systèmes de recommandation ou la détection des fraudes.
Données de détecteurs : données des caméras, lidars, radars, etc. ; utilisées pour les systèmes de véhicules autonomes, l&rsquo;automatisation industrielle, etc.
Données médicales : données de l&rsquo;imagerie médicale, comme les radiographies ou les IRM, dossiers des patients et données cliniques ; utilisées pour faciliter les diagnostics, les traitements et la recherche.
Données financières : données financières existantes issues des registres des marchés et des transactions ; utilisées pour la prévision du cours des actions, la notation de crédit et la détection des fraudes.
Données génomiques : issues des séquences ADN, des marqueurs génétiques et d&rsquo;autres données biologiques associées ; utilisées pour la médecine personnalisée et pour améliorer la compréhension de la génétique.
Données de simulation : soit des données générées par les simulations ; utilisées pour apprendre comment les systèmes se comportent dans différentes conditions.

Question 6

Quels sont les problèmes liés à l'utilisation des données à caractère personnel dans le cadre de l'entraînement de l'IA ?

Accepted Answer

La préoccupation majeure à l&rsquo;égard de l&rsquo;utilisation des données à caractère personnel pour les ensembles de données d&rsquo;entraînement de l&rsquo;IA est de savoir si le consentement des personnes auxquelles les données appartiennent a été obtenu ou non. Les données à caractère personnel se distinguent par leur type et sensibilité. Certaines données peuvent être utilisées pour identifier une personne, d&rsquo;autres peuvent être dangereuses en cas d&rsquo;utilisation abusive.
Les informations médicales et financières constituent de parfaits exemples de données à caractère personnel sensibles. Les données sensibles nécessitent généralement le consentement de l&rsquo;utilisateur pour être collectées ou utilisées en vertu de la loi sur la protection des données. Toutefois, concernant les données à caractère personnel non sensibles, il se peut qu&rsquo;un consentement soit exigé uniquement dans le cadre de la vente ou de l&rsquo;utilisation de ces données à des fins de publicité ciblée, de profilage, etc.
Tous les lots de données d&rsquo;entraînement ne sont pas égaux. La qualité, la quantité, la diversité et l&rsquo;autorisation d&rsquo;utilisation peuvent considérablement varier, ce qui peut influer grandement sur l&rsquo;apprentissage et les performances des systèmes. Des données mal équilibrées ou non diversifiées peuvent également produire des résultats faussés. Les résultats produits peuvent s&rsquo;avérer offensants ou juridiquement précaires, par exemple recommandations discriminatoires ou identification inexacte.

Question 7

Quel consentement de l'utilisateur est nécessaire pour utiliser les données à caractère personnel dans le cadre de l'entraînement de l'IA ?

Accepted Answer

Un certain nombre de facteurs déterminent si le consentement de l&rsquo;utilisateur est nécessaire pour l&rsquo;utilisation des données à caractère personnel dans le cadre de l&rsquo;entraînement de l&rsquo;IA. Comme dans le cas de la polémique autour de Zoom, l&rsquo;entraînement de l&rsquo;IA peut dépendre des conditions de service d&rsquo;une entreprise. Si tel est le cas, il est possible qu&rsquo;aucun consentement supplémentaire ne soit nécessaire. Cependant, dans certains pays, cela n&rsquo;est pas suffisant, comme au sein de l&rsquo;UE en vertu du RGPD. Dans ce cas, un consentement explicite doit être obtenu pour l&rsquo;utilisation des données à caractère personnel dans les ensembles de données d&rsquo;entraînement de l&rsquo;IA, et les utilisateurs doivent être informés de cette utilisation avant que les données ne soient collectées à cette fin.
Les entreprises doivent savoir où se trouvent leurs clients et utilisateurs, connaître les lois en matière de protection de la vie privée applicables et adapter leurs activités liées à la protection des données en conséquence. Il se peut que les entreprises obtiennent déjà le consentement pour la collecte de données à caractère personnel. Toutefois, en vertu de nombreuses lois sur la protection de la vie privée, elles ne peuvent pas simplement ajouter « entraînement de l&rsquo;IA » dans les finalités de la collecte et l’utilisation de données sans avoir préalablement mis à jour leur déclaration de confidentialité et obtenu le consentement pour cette nouvelle utilisation. Dans de nombreux pays, les utilisateurs doivent également être en mesure de refuser l&rsquo;utilisation de leurs données à un niveau granulaire, ce qui peut inclure l&rsquo;entraînement de l&rsquo;IA.
Certaines lois sur la protection des données ne couvrent pas les données à caractère personnel rendues publiques par les personnes, ce qui peut englober les données générées sur les réseaux sociaux. Toutefois, les conséquences sur l&rsquo;utilisation des données à caractère personnel dans le cadre de l&rsquo;entraînement de l&rsquo;IA ne sont pas encore très claires. Les publications, les commentaires ou les photos (entre autres) sont plus susceptibles d&rsquo;être considérés comme publics que les messages privés, par exemple.

Question 8

Le consentement de l'utilisateur peut-il être obtenu pour l'utilisation de l'IA ?

Accepted Answer

Les systèmes d&rsquo;IA sont souvent encore expérimentaux et les résultats sont imprévisibles. Les entreprises peuvent informer les utilisateurs de ce pour quoi ils souhaitent utiliser les données, généralement à l&rsquo;avance, mais il est possible que ces dernières soient finalement utilisées ou modifiées à des fins différentes, ou que les résultats découlant de leur utilisation soient distincts.
Si les données sont analysées en grande quantité en temps réel, les mécanismes traditionnels d&rsquo;obtention du consentement des utilisateurs, tels que les bandeaux cookies, peuvent ne pas être assez rapides, granulaires ou suffisants.

Question 9

Les systèmes d'IA peuvent-ils causer des problèmes de protection des données ?

Accepted Answer

Les systèmes d&rsquo;IA orientés utilisateur peuvent être potentiellement trompeurs, auquel cas les utilisateurs fournissent des informations qu&rsquo;ils n&rsquo;avaient pas anticipées. Les systèmes peuvent également faire apparaître des liens plus sophistiqués et plus nébuleux entre les points de données, ce qui permet l&rsquo;identification et le profilage à un niveau inédit. Ainsi, la plupart des données seraient considérées comme des données d&rsquo;identification ou sensibles. Les exigences actuelles en matière de consentement peuvent ne pas répondre de manière adéquate à ce problème.
Bien que les fonctions de manipulation de l&rsquo;interface utilisateur et de l’expérience utilisateur trompeuses, communément appelées « interfaces truquées » soient de plus en plus pointées du doigt, voire réglementées dans certains cas, elles tendent à se concentrer sur des tactiques déjà connues. Une conception réactive pourrait permettre le développement de nouvelles méthodes plus sophistiquées de manipulation des utilisateurs.

Question 10

L'entraînement de l'IA a-t-il des conséquences sur le consentement lié aux cookies ?

Accepted Answer

L&rsquo;utilisation de l&rsquo;IA peut accélérer la disparition des cookies, en particulier des cookies tiers, car elle propose des fonctionnalités fournissant de meilleurs résultats et ne demandant pas nécessairement la collecte de données à caractère personnel.
Les modèles de consentement aux cookies actuels peuvent être insuffisants pour couvrir l&rsquo;utilisation de l&rsquo;IA. En effet, les systèmes d&rsquo;IA sont capables d&rsquo;analyser de grandes quantités de données en temps réel, tandis que d&rsquo;autres outils analysent les données liées aux cookies actifs au fil du temps. Pour donner son consentement avant le début de la collecte ou de l&rsquo;utilisation des données avec les fenêtres contextuelles actuelles, il faudrait que l&rsquo;utilisateur soit bombardé de bannières de consentement, trop rapides et nombreuses pour pouvoir être traitées par un humain.

Question 11

Comment les entreprises doivent-elles obtenir le consentement pour l'entraînement de l'IA ?

Accepted Answer

Les entreprises qui collectent des données utilisateur via leurs propres plateformes ou utilisateurs pour l&rsquo;entraînement de l&rsquo;IA ou d&rsquo;autres utilisations ont la responsabilité directe d&rsquo;obtenir un consentement valable et de se conformer aux lois sur la protection des données. Les bonnes pratiques d&rsquo;obtention du consentement dans le cadre de l&rsquo;entraînement de l&rsquo;IA sont les mêmes que pour la conformité de la protection des données.

Donner aux utilisateurs une notification claire et accessible à l&rsquo;avance sur la façon dont les données seront utilisées et obtenir un nouveau consentement en cas de modification des finalités.
Garantir que les utilisateurs peuvent accepter ou refuser le consentement à un niveau granulaire, c&rsquo;est-à-dire pour toutes les utilisations ou seulement pour certaines. Il doit être aussi facile de refuser que d&rsquo;accepter, et les utilisateurs doivent pouvoir modifier facilement leurs préférences de consentement ou retirer leur consentement ultérieurement.
Connaître les lois applicables sur la protection des données et les responsabilités des entreprises. Examiner régulièrement la collecte et le traitement des données pour s&rsquo;assurer que les notifications et les informations de consentement sont à jour.

Question 12

Le RGPD couvre-t-il l'intelligence artificielle et le consentement ?

Accepted Answer

Le Règlement général sur la protection des données ne mentionne pas explicitement l&rsquo;intelligence artificielle, mais comme plusieurs autres lois sur la protection des données, il fait référence à la « prise de décision automatisée », qui peut inclure des systèmes d&rsquo;IA.
L&rsquo;IA serait traitée comme toute autre utilisation de données à caractère personnel, c&rsquo;est-à-dire que les utilisateurs doivent être informés de l&rsquo;utilisation demandée avant que les données à caractère personnel ne soient collectées pour cette utilisation, et le consentement doit être obtenu pour cette utilisation avant toute collecte ou tout traitement.

Question 13

Qu'est-ce que la loi européenne sur l'IA ?

Accepted Answer

La loi européenne sur l’IA est une loi sur l’intelligence artificielle proposée par la Commission européenne. Les objectifs de cette loi sont les suivants :

équilibrer les utilisations positives et les risques liés à la technologie ;
limiter les risques actuels et futurs, et les utilisations négatives de la technologie ;
codifier les droits des consommateurs ;
clarifier les questions actuelles et futures sur le développement de l’IA ;
faire de ladite loi une norme mondiale (à l’instar du RGPD).

La loi classerait les applications de l’IA dans l’une des catégories suivantes :

risque inacceptable : interdiction totale d’utilisation ;
risque élevé : utilisation autorisée sous réserve d’évaluation et de conformité ;
risque moyen : utilisation autorisée sous réserve du respect des obligations de transparence ;
risque minime ou nul : autorisation sans restrictions si aucun risque notable n’est identifié.

Intelligence artificielle (IA), données à caractère personnel et consentement

Qu’est-ce que l’intelligence artificielle (IA) ?

Qu’est-ce que l’apprentissage automatique (machine learning – ML) ?

Qu’est-ce qu’un grand modèle de langage (large language model – LLM) ?

Qu’est-ce que l’entraînement d’IA ?

Ambiguïtés dans l’utilisation des ensembles de données d’entraînement de l’IA

Quelles données servent à entraîner l’IA ?

Inquiétudes liées au consentement concernant les différentes catégories de données d’entraînement de l’IA

Consentement, IA et données à caractère personnel

L’origine des ensembles de données d’entraînement de l’IA est-elle importante ?

Difficultés liées à l’obtention du consentement des utilisateurs en matière d’IA

La polémique Zoom et le consentement de l’utilisateur

La réponse de Zoom à la controverse sur le changement des conditions de service

Autres défis liés aux entreprises technologiques, aux conditions de service et au consentement

Comment les entreprises peuvent-elles utiliser les données de manière éthique avec un consentement utilisateur valable ?

Quels sont les droits des utilisateurs de plateformes en ligne sur leurs données ?

Intelligence artificielle et cookies

Qu’est-ce que la loi européenne sur l’IA ?

Dispositions relatives au consentement dans la loi sur l’IA

Conclusion : quel avenir pour l’IA et le consentement ?

Foire aux questions