Avec de vrais morceaux d'intelligence artificielle dedans
Le premier mars se baladaient ici de fort charmantes petites croix, tout aussi esthétiques que mystérieuses, et soulevant (je le sais) moultes interrogations sur mes occupations diurnes (mes occupations nocturnes étant, comme chacun sait, d'écrire des bêtises, de lire, de regarder des films, de danser, de jouer au poker et de manger du chocolat). Il faut dire aussi qu'expliquer ce en quoi consiste une thèse est une épreuve assez délicate quand on ne s'adresse pas aux spécialistes du sujet, qui eux se mettent alors à poser plein de questions embarassantes ; parler de sa thèse est donc un moment douloureux que le thésard évite au maximum.
Menfin bref. Le plus clair de mon temps (la thèse, c'est comme la Bretagne, ça vous gagne, ça vous prend et ça ne vous laisse pas repartir, ça s'infiltre jusque dans vos rêves, et en plus ça fatigue vos neurones au point de faire des blagues de mauvais goût) se passe donc, non pas comme on pourrait le croire à me lire à combattre des déménagements douteux et des pannes matérielles zet logicielles (quoique), mais à jouer la Madame Irma des molécules.
Autrement dit, à trouvert et/ou appliquer diverses méthodes permettant de prédire des propriétés moléculaires. Les molécules sont en effet des petites saletés bourrées de propriétés, qui vont de leur faculté peu glamour à se dissoudre dans l'eau ou se complaire dans le gras à leur potentiel beaucoup plus vendeur à guérir le SIDA, le cancer ou la mixomatose des genoux.
Ces propriétés peuvent se déterminer directement à l'aide d'expériences de laboratoire, mais les expériences de laboratoire, ça prend du temps, de l'argent, et en plus le gras, c'est sale. Puis tester cinq millions de molécules les unes après les autres pour voir si elles guérissent la mixomatose des genoux, c'est pas tellement réaliste à l'échelle humaine.
Afin d'éviter d'avoir à toucher des molécules toutes sales alors qu'on peut rester tranquillement au chaud derrière son clavier en plastique noir à regarder un écran briller seize heures par jour, on peut aussi envisager de faire des simulations. Mais la simulation, ça marche pas toujours non plus. Souvent parce que les molécules, c'est plein d'atomes, d'interactions électro-machintrucs de types différents, d'énergies quantiques et de ratons laveurs (ah non, pas ça), et qu'à modéliser précisément, ça prend beaucoup de migraines, beaucoup de ressources dans un ordinateur, et le désir profond de soumettre des diptères à des actes sexuels réprimandés par la moralité publique.
Reste alors la voie ô combien tortueuse de l'intelligence artificielle. L'idée qui sous-tend tout mon travail, c'est « tiens, cette molécule Truchon, là, elle ressemble achement à la molécule Chifonnette, et je sais que la molécule Chifonnette n'aime pas du tout le gras, y a donc de grandes chances que Truchon non plus ». Un peu comme appliquer le principe du délit de faciès aux molécules, je vous l'accorde, sauf que c'est un peu plus subtil, et que ça marche (parfois).
Tout le boulot, donc, c'est de déterminer ce que « ressembler vachement » peut bien vouloir dire, précisément. Alors là on s'y colle avec les chimistes, on torture les molécules afin de mieux les décrire, on numérote leurs abattis, on les aplatit en une ou deux dimensions, ou alors on les gonfle en quatre dimensions, jusqu'à les transformer en suites de 0 et de 1 qui vont bien sur un ordinateur. Après, on peut aussi avoir beaucoup de migraines plaisir à comparer les suites de 0 et de 1 de cette façon-ci ou de cette façon-là, en introduisant un peu de biais par ici et en tenant compte de tel facteur par là, et en saupoudrant le tout d'un peu de mathématiques histoire d'avoir l'air de savoir ce qu'on fait. Mais bon en fait faut pas se leurrer au fond c'est de la cuisine, hein.
En général la règle du jeu, c'est de faire semblant de pas connaître Truchon (non monsieur, je ne vois pas du tout de qui vous parlez, et je ne sais pas si vous soignez la mixomatose des genoux), et de lui appliquer notre savant mélange de torture (on appelle ça l'extraction de caractéristiques - ou features extraction dans le texte) et de comparaisons avec une bande de Chifonnettes, et de voir ce qu'il en sort. Si on a correctement deviné le jeu de Truchon, on est bon, sinon, y a quelque chose qui cloche là-dedans et on y retourne immédiatement. Et puis parfois, une fois qu'on a un truc qui tient la route, on l'applique à un gros tas de molécules inconnues, et puis on dit aux chimistes, dis-donc, là y a mon ordinateur qui dit que y a de grandes chances pour que les molécules de Balthazarette à Césarine, elles soignent la mixomatose des genoux, tu devrais concentrer ta recherche sur elles un peu. De temps en temps, y a un chimiste qui nous aime bien ou qui a pitié de nous et qui dit okay, d'accord, c'est bon, arrêtez de me harceler, on va les regarder d'un peu plus près. Et si on avait un peu raison, il est vachement contents et ils devient notre meilleur ami du monde. Sinon, il fait la gueule et il râle contre ces incompétents d'informaticiens qui font rien qu'à se mêler de choses trop compliquées pour eux. Mais bon nous on continue, on est des battants ou quoi alors ?
Et, évidemment, le but, c'est de faire mieux que les autres. Parfois, on se contente de leur piquer leurs jeux de données, de faire notre tambouille dessus, et s'il en ressort de meilleurs résultats, pouf, on les publie. Sinon, généralement, on s'abstient hein. Et puis d'autres fois, y a des gens qui organisent des concours compétitions défis.
Et là en l'occurence, y a un défi zinternational dans lequel j'ai investi mon mois de février et un peu plus (c'était censé se terminer le premier mars, et puis finalement ça se poursuit jusqu'en août, mais passons). Là, on a une bande de molécules dont un certain (et petit) nombre sont efficaces contre le VIH. Et puis on nous donne un gros paquet de nouvelles molécules, et il faut qu'on dise lesquelles sont efficaces et lesquelles ne le sont pas. Le 28 février, j'ai soumis mes derniers résultats, et ça c'est affiché comme ici avec plein de petites croix là où qu'on savait pas encore ce que c'était les réponses. Bon, ben c'est moi que j'étais la meilleure à ce petit jeu-là.
Autant vous le dire : champagne ! (C'est pas tous les jours que je reçois un mail d'Advisor qui me dit You rock! Congratulations!).