Phil Kay

Phil Kay

Phil Kay est un responsable de la formation pour JMP Statistical Discovery, une filiale de SAS. Son travail consiste à comprendre les défis scientifiques et techniques et à fournir des recommandations concernant les solutions d'analyse de données pour les organisations industrielles du monde entier.

Il était auparavant responsable scientifique chargé du développement de nombreux processus de fabrication de colorants pour l'impression numérique chez Fujifilm Imaging Colorants. Phil Kay est titulaire d'un master en statistiques appliquées et a écrit un mémoire portant sur les plans d'expériences. Il détient également un master et un doctorat en chimie.

Il est chimiste agréé, membre de la Royal Statistical Society et fait partie du comité du groupe de chimie et de technologie des procédés de la Royal Society of Chemistry.

Phil adore montrer comment l'analyse des données contribue à l'amélioration de la science. Suivez Phil Kay, passionné d'analyse de données, sur LinkedIn.

Les outils dont nous disposons pour comprendre le vivant ont énormément progressé au cours de ma vie. En l'espace de 20 ans à peine, la facture pour séquencer le génome humain d'une personne est passé de cent millions de dollars à moins de mille, et les volumes de données générés ont considérablement augmenté. Les innovations chimiques telles que les techniques de séquençage, les étiquettes fluorescentes et les réactions orthogonales ont joué un rôle essentiel dans bon nombre de ces progrès, tandis que la collaboration entre les disciplines devrait en apporter d'autres. Toutefois, la chimie pourrait également tirer profit de certaines idées provenant de la biologie.

Il faut reconnaître que les biologistes ont une longueur d'avance sur les chimistes dans la course à la numérisation de l'apprentissage empirique. Sans même parler du « laboratoire du futur », certains laboratoires de biologie commerciale automatisent actuellement des expériences biologiques complexes et de grande envergure. Les avantages qu'ils en retirent peuvent donner des pistes de réflexion intéressantes à l'heure où la chimie passe progressivement au numérique, mais il est également possible de tirer des enseignements de certaines applications plus limitées.

La biologie a rapidement pris conscience de ces avantages, en partie en raison de la nature des recherches. Les biologistes ont affaire à des systèmes complexes et interconnectés ainsi qu'à des propriétés émergentes, ce qui nécessite des expériences de grande envergure pour explorer et décomposer cette complexité en vue d'identifier les nombreux facteurs susceptibles d'entrer en jeu. Par exemple, pour comprendre comment les mutations ponctuelles affectent l'activité d'une protéine, il se peut que l'effet du changement d'un acide aminé sur une position donnée dépende des acides aminés présents à d'autres positions. L'automatisation et les approches à haut rendement, qui conviennent parfaitement aux protocoles répétitifs à grande échelle, permettent d'explorer ce champ de possibilités plus efficacement et simplement.

Les innovations numériques apportent des améliorations de plusieurs ordres de grandeur en matière de qualité, de volume et de rythme de collecte des données.

Les expériences biologiques présentent également certains avantages intrinsèques : elles ont tendance à impliquer une palette d'opérations assez étroite, le solvant étant toujours de l'eau et le chauffage se limitant généralement à une température à peine supérieure à la température ambiante. Les technologies habilitantes qui ont eu le plus d'impact concernent donc en grande partie la distribution précise de petites quantités d'ingrédients aqueux dans de très petits récipients. Les sondes fluorescentes ont acquis une importance considérable précisément parce qu'elles permettent de suivre simultanément les résultats d'un très grand nombre d'expériences à l'aide d'une technologie d'imagerie relativement simple.

Les outils numériques permettent également de relever l'un des grands défis de la biologie. Les systèmes vivants sont sujets au bruit, ce qui peut entraîner des faux positifs et négatifs, si bien que la norme en biologie est de « tout faire en trois exemplaires ». Tout ce qui permet de réduire les erreurs aléatoires ou systématiques et d'augmenter le rapport signal/bruit est le bienvenu. Les robots de laboratoire sont aujourd'hui très appréciés pour leur capacité à répéter systématiquement des tâches simples mais essentielles telles que le pipetage.

L'autre grand avantage de la biologie numérique n'est pas strictement lié à l'automatisation. Les expériences numériques imposent de saisir les instructions sous une forme qui peut être facilement structurée pour maximiser l'apprentissage. Une fois codées de manière explicite dans le plan d'expériences, toutes les opérations de laboratoire pertinentes peuvent facilement être transformées en caractéristiques pour les modèles orientés données. Et peu importe qui réalise l'expérience, dans la mesure où les instructions sont les mêmes, les résultats seront plus fiables. Les instructions peuvent également être partagées avec d'autres scientifiques, ce qui rend la recherche plus reproductible. Cette solution s'avère encore plus efficace lorsque l'on peut également automatiser la collecte des résultats et des flux de données à partir de différents équipements.

La capacité de tester simultanément des centaines, voire des milliers de possibilités signifie que les biologistes peuvent désormais poser des questions auxquelles il était impossible de répondre auparavant. Quid des chimistes ? Il sera beaucoup plus difficile de numériser l'exécution de toutes les expériences chimiques en raison de leur diversité, mais on peut tout de même apprendre beaucoup de choses de la biologie, notamment comment éviter les pièges.

Nous devrions toujours nous efforcer de tirer le maximum des expériences que nous menons et de faire en sorte que chaque essai compte.

Les expériences numériques constituent un nouveau paradigme et nous devons nous attendre à quelques ratés en adaptant notre approche et nos méthodes. En tant que chimiste chargé de développement, j'avais l'habitude de passer trois jours par essai, c'est pourquoi je trouve les derniers progrès époustouflants, et je ne suis pas surpris que les gens soient particulièrement enthousiastes face à la promesse d'une augmentation massive du débit expérimental. Néanmoins, multiplier les expériences et collecter davantage de données n’est pas forcément garant d'une science de meilleure qualité. En réalité, ces approches peuvent coûter plus cher si un projet n'est pas adapté.

La conception et l'analyse statistiques des expériences (ou des plans d'expériences) ont prouvé leur utilité en chimie depuis les années 1950. Elles permettent d'en apprendre le plus possible, en particulier dans les situations où seule une poignée des combinaisons possibles de paramètres de facteurs peut être testée, car cela est laborieux, long et coûte cher. Les plans d'expériences resteront importants dans la mesure où ces contraintes pratiques constituent encore la norme pour la plupart des travaux de laboratoire dans le domaine de la R&D en chimie. Et l'automatisation mettra du temps à changer la donne. En outre, le maintien d'une approche orientée plans d'expériences sera un gage d'efficacité à mesure que nous évoluerons vers des expériences de chimie entièrement numériques.

Les innovations numériques apportent des améliorations de plusieurs ordres de grandeur en matière de qualité, de volume et de rythme de collecte des données dans le domaine de l'apprentissage empirique en biologie. Il sera à la fois très intéressant et stimulant de s'adapter lorsque ces innovations feront leur apparition en chimie. Toutefois, nous devrions toujours nous efforcer de tirer le maximum des expériences que nous menons et de faire en sorte que chaque essai compte.

Si vous n'utilisez pas encore les plans d'expériences, vous pouvez vous familiariser avec ce précieux outil lors d'un atelier en ligne gratuit, animé par des experts en statistiques de JMP. Pour en savoir plus, inscrivez-vous ici.

Restons en contact !

J'autorise JMP à m'envoyer par e-mail des informations concernant les nouveautés, événements ou offres promotionnelles. Je peux retirer mon consentement à tout moment.

*
*

JMP est une division de SAS Institute Inc., vos informations seront utilisées en accord avec la politique de confidentialité de SAS.