Volume de données
Les processus qui pourraient bénéficier le plus des technologies d'IA sont ceux qui impliquent un grand volume de données. Qu'il s'agisse de processus hautement répétitifs, comme les revues de qualité pour les laboratoires et les enregistrements de lots, ou de la génération de grandes quantités de données, l'IA peut aider à travers tout le spectre du développement de médicaments et de la prestation de soins de santé de nombreuses manières différentes.
Nous commençons à comprendre avec une grande précision les conditions qui prédisposent les sujets aux effets indésirables. L'IA sera capable de compiler, interroger, classer, pondérer et produire beaucoup plus rapidement et plus précisément des profils de réponse personnalisés, mais aussi en termes de développement en prenant en considération les variables importantes. Cela signifie, en fin de compte, moins d'effets indésirables et une meilleure capacité à cibler les thérapies sur les sujets qui y répondront, tout en accélérant le développement. Dans ces cas-là, l'IA représente un accélérateur et un facilitateur.
Quelles sont les méthodes efficaces pour garantir la protection des données ?
Utilisation de données publiques sous licence appropriée
L'utilisation de données mises à disposition du public pour ce but précis garantit que les données privées, critiques et protégées par la propriété intellectuelle soient en sécurité. Dans le cas où les données publiques soient insuffisantes, une voie à prendre en considération est la création de données réelles spécifiquement pour une utilisation dans l'IA ou la création de données artificielles qui capturent les schémas importants du domaine problématique. De même, une organisation peut transformer des données réelles en données "fictives" grâce à des processus appropriés, y compris l'anonymisation.
Utilisation de données privées
Si toutes ces avenues sont insuffisantes, des données privées peuvent être nécessaires. Mais la gestion des données privées soulève de nombreuses questions. Quelles sont les politiques appropriées à mettre en place ? Où les données peuvent-elles être stockées ? Qui a accès aux données ? Quand doivent-elles être supprimées, y compris les sauvegardes ? De plus, si aucun accord légal n'existe entre l'organisation propriétaire des données et l'organisation utilisant les données, il convient d'en créer un ? Dans certains cas, il peut être envisageable d'établir cet accord par un processus d'opt-in.
Gestion des apprentissages des modèles
La gestion des données peut également être abordée du point de vue de l'IA. Dans ce cas, il est important de comprendre la capacité de l'IA à mémoriser des données. Par exemple, modéliser une distribution normale nécessite des moyennes et des variances, ce qui, dans la plupart des contextes, protège les données originales grâce à l'abstraction des points de données individuels. D'un autre côté, les grands modèles de langage (LLM) tels que ChatGPT ont une immense capacité à mémoriser et à reproduire mot à mot des données. Ces modèles pourraient facilement divulguer des informations privées (même au sein d'environnements d'entreprise fermés, si le LLM est entraîné sur des informations sensibles telles que des dossiers comptables ou des données RH). Préférer des modèles qui ne peuvent pas mémoriser les données peut constituer un élément important dans leur gestion et protection.
Quels sont les trois éléments principaux à prendre en compte pour les contrats liés à l'IA ?
Propriété des données et de la propriété intellectuelle (PI)
Your contract should be very clear regarding what the data can be used for and who owns the results after data processing. Can the data be used to train models? Are models made available to other parties after training? AI built specifically from a consulting agreement will leave the IP with the paying customer. However, if the AI is presented as a product in itself, then the code and models will remain the supplier’s property. In the latter, you should have the choice to opt in/out of having your data used to train AI models.
Support technique et processus de mise à jour
Une technologie IA ne doit être exclusivement validée, mais elle doit également être en versions. Le processus de mise à jour doit être clairement défini. À quelle fréquence les mises à jour seront-elles disponibles ? Quel est le processus pour éviter la régression des modèles lors de l'entraînement avec des données supplémentaires ? S'assurer que le contrat est clair sur le rythme auquel l'IA évoluera, vous aidera à préparer les tests et validations clés.
Mesures de sécurité des données
Comme la plupart des systèmes d'IA reposent largement sur le traitement des données pour produire des résultats et de la valeur, la manière dont les données sont gérées doit être clairement définie. Les données seront-elles hébergées dans le cloud ? Les données sont-elles délocalisées pour être traitées ? Le cloud garantit efficacité et évolutivité avec un coût élevé. Cependant, les données des patients doivent être anonymes avant traitement et purgées lorsque le traitement termine. Le contrat doit clairement stipuler que les données ne doivent pas transiter en dehors de votre région pour être traitées.