Il y a quelques années, un gène impliqué dans un pourcentage élevé de femmes atteintes d'un cancer du sein a pu être identifié. Baptisé BRCA ce gène a pu être trouvé grâce en particulier à une succession d'analyses statistiques très complexes.
Quand on sait qu'un gène se situe quelque part sur une longue chaîne d'ADN composée de 3 milliards et demi de molécules de quatre natures différentes, que l'on a souvent comparées à des lettres de l'alphabet a, t, g et c, on comprend toute la difficulté de trouver un tout petit bout de ce filament, immense à l'échelle microscopique, et d'y dénicher l'anomalie qui est la cause des maladies. Et ce travail est extrêmement lourd même avec des moyens informatiques puissants.
Or, chez l'homme, les gènes ne constituent pas plus de 3% de la molécule d'ADN. Le reste, c'est à dire les 77% est appelé "intergénique". Il est donc intéressant de ne travailler que sur ces 3% sur lesquels se trouvent les gènes que l'on recherche. Ainsi réduit-on considérablement la difficulté.
Oui, mais voilà, comment peut-on distinguer les gènes du reste de la molécule. Eh bien on s'est aperçu que l'on peut les reconnaître sur des différences de style. En effet les fréquences de successions de lettres ne sont pas les mêmes pour les gènes et pour le matériel intergénique. Les chercheurs ont donc fait appel à des modèles statistiques qu'ils ont adaptés tout en mettant au point des algorithmes capables de caractériser les différents styles.
Pour que nous puissions mesurer l'importance du rôle des mathématiques dans un grand nombre d'applications une petite brochure intitulée "l'explosion des mathématiques" nous est offerte gratuitement par la société mathématique de France et la société de mathématiques appliquées et industrielles. |