Comment utiliser efficacement et en toute sécurité l'IA dans votre organisation

par Catherine Lunardi, Ceo, Neil Barrett, Vice President @Genaiz and Eustache Paramithiotis, Vice President @CellCarta

Quelques réflexions à considérer pour les sciences de la vie

 

Comment identifier un bon cas d'utilisation pour l'intelligence artificielle 

Complexité des données 

Les meilleurs cas d'utilisation des applications d'intelligence artificielle (IA) impliquent souvent deux éléments clés : la complexité et le volume. Mais qu'est-ce que sont les données complexes ? Les données manuscrites sont un bon exemple pour expliquer ce type de concept ; tandis que les données hétérogènes provenant de différents systèmes peuvent également être plus difficiles à agréger et à exploiter, comme dans le cas d'une étude longitudinale sur des sujets participant à un essai clinique pour une nouvelle classe de vaccins. Des données multiplexes à grande échelle au niveau des gènes, des protéines et des cellules pour plusieurs sujets peuvent être collectées. Chaque type de données est déjà complexe et il devient encore plus difficile de les combiner, parce qu’elles n'ont pas toutes le même impact ! L'IA peut considérablement accélérer le rythme et la profondeur du traitement et de l'analyse des données, en faisant un excellent outil pour la découverte de biomarqueurs.

 

How to Use Artificial Intelligence Efficiently and Safely in Your Organization _1

Volume de données

Les processus qui pourraient bénéficier le plus des technologies d'IA sont ceux qui impliquent un grand volume de données. Qu'il s'agisse de processus hautement répétitifs, comme les revues de qualité pour les laboratoires et les enregistrements de lots, ou de la génération de grandes quantités de données, l'IA peut aider à travers tout le spectre du développement de médicaments et de la prestation de soins de santé de nombreuses manières différentes. 

Nous commençons à comprendre avec une grande précision les conditions qui prédisposent les sujets aux effets indésirables. L'IA sera capable de compiler, interroger, classer, pondérer et produire beaucoup plus rapidement et plus précisément des profils de réponse personnalisés, mais aussi en termes de développement en prenant en considération les variables importantes. Cela signifie, en fin de compte, moins d'effets indésirables et une meilleure capacité à cibler les thérapies sur les sujets qui y répondront, tout en accélérant le développement. Dans ces cas-là, l'IA représente un accélérateur et un facilitateur. 

    

Quelles sont les méthodes efficaces pour garantir la protection des données ? 

Utilisation de données publiques sous licence appropriée

L'utilisation de données mises à disposition du public pour ce but précis garantit que les données privées, critiques et protégées par la propriété intellectuelle soient en sécurité. Dans le casles données publiques soient insuffisantes, une voie à prendre en considération est la création de données réelles spécifiquement pour une utilisation dans l'IA ou la création de données artificielles qui capturent les schémas importants du domaine problématique. De même, une organisation peut transformer des données réelles en données "fictives" grâce à des processus appropriés, y compris l'anonymisation.

 

Utilisation de données privées

Si toutes ces avenues sont insuffisantes, des données privées peuvent être nécessaires. Mais la gestion des données privées soulève de nombreuses questions. Quelles sont les politiques appropriées à mettre en place ? Où les données peuvent-elles être stockées ? Qui a accès aux données ? Quand doivent-elles être supprimées, y compris les sauvegardes ? De plus, si aucun accord légal n'existe entre l'organisation propriétaire des données et l'organisation utilisant les données, il convient d'en créer un ? Dans certains cas, il peut être envisageable d'établir cet accord par un processus d'opt-in.

 

Gestion des apprentissages des modèles 

La gestion des données peut également être abordée du point de vue de l'IA. Dans ce cas, il est important de comprendre la capacité de l'IA à mémoriser des données. Par exemple, modéliser une distribution normale nécessite des moyennes et des variances, ce qui, dans la plupart des contextes, protège les données originales grâce à l'abstraction des points de données individuels. D'un autre côté, les grands modèles de langage (LLM) tels que ChatGPT ont une immense capacité à mémoriser et à reproduire mot à mot des données. Ces modèles pourraient facilement divulguer des informations privées (même au sein d'environnements d'entreprise fermés, si le LLM est entraîné sur des informations sensibles telles que des dossiers comptables ou des données RH). Préférer des modèles qui ne peuvent pas mémoriser les données peut constituer un élément important dans leur gestion et protection. 

 

Quels sont les trois éléments principaux à prendre en compte pour les contrats liés à l'IA ? 

Propriété des données et de la propriété intellectuelle (PI)

Your contract should be very clear regarding what the data can be used for and who owns the results after data processing. Can the data be used to train models? Are models made available to other parties after training? AI built specifically from a consulting agreement will leave the IP with the paying customer. However, if the AI is presented as a product in itself, then the code and models will remain the supplier’s property. In the latter, you should have the choice to opt in/out of having your data used to train AI models.

 

Support technique et processus de mise à jour

Une technologie IA ne doit être exclusivement validée, mais elle doit également être en versions. Le processus de mise à jour doit être clairement défini. À quelle fréquence les mises à jour seront-elles disponibles ? Quel est le processus pour éviter la régression des modèles lors de l'entraînement avec des données supplémentaires ? S'assurer que le contrat est clair sur le rythme auquel l'IA évoluera, vous aidera à préparer les tests et validations clés.

 

Mesures de sécurité des données

Comme la plupart des systèmes d'IA reposent largement sur le traitement des données pour produire des résultats et de la valeur, la manière dont les données sont gérées doit être clairement définie. Les données seront-elles hébergées dans le cloud ? Les données sont-elles délocalisées pour être traitées ? Le cloud garantit efficacité et évolutivité avec un coût élevé. Cependant, les données des patients doivent être anonymes avant traitement et purgées lorsque le traitement termine. Le contrat doit clairement stipuler que les données ne doivent pas transiter en dehors de votre région pour être traitées.

Vous souhaitez en savoir plus ?

Le personnel du groupe PQE est composé d'experts chevronnés et qualifiés au sein d'équipes multidisciplinaires, prêts à aider votre entreprise à atteindre les plus hauts niveaux de sécurité pour vos systèmes.

Consultez notre page Digital Governance pour en savoir plus ou pour nous contacter, et trouver la solution la plus adaptée à votre entreprise.

Contactez-nous