Le séquençage génétique disponible en mode service
technologies
Google Genomics a annoncé un partenariat avec un institut de recherche phare de la région de Boston, le Broad Institute. Cette alliance au service de la banalisation du séquençage génétique permettra de rendre largement accessible un des logiciels du Broad via la plateforme cloud de Google. Aujourd’hui, la quasi-totalité des géants du web se placent sur le marché du séquençage de l’ADN.

Le Broad Institute est né il y a 11 ans grâce à un premier don de 100 millions de dollars d’Eli et Edythe Broad, riches entrepreneurs et philanthropes américains. L’idée fondatrice de l’institut était d’accélérer les recherches médicales en facilitant les collaborations entre chercheurs et les meilleures institutions de la région. Pour ce faire, le Broad Institute se base sur trois collaborations principales, le MIT, Harvard, et l’ensemble des hôpitaux universitaires d’Harvard (Mass General Hospital, Brigham & Women, Children Hospital…).
Cette joint-venture des deux mastodontes universitaires bostoniens est aujourd’hui à la pointe de la recherche en ce qui concerne la compréhension des mécanismes biologiques des maladies, en s’appuyant en particulier sur la génomique. On recense parmi les travaux du Broad Institute d’importantes recherches sur les mécanismes du paludisme, la compréhension des mutations génétiques se rapportant à différents types de cancer, la détermination des mécanismes moléculaires impliqués dans la transmission des maladies héréditaires…Fort de son succès, l’institut a finalement reçu au total 700 millions de dollars de la part d’Eli et Edythe Broad, rapidement suivi par d’autres contributeurs.
Aujourd’hui, et comme beaucoup d’autres instituts de recherches américains, l’institut se finance par d’importants dons privés, qui permettent aux équipes de recherche de solliciter des subventions gouvernementales (NIH, NSF, …). Des collaborations industrielles permettent en outre d’équilibrer les financements ; parmi ceux-ci, on compte la plupart des grands groupes pharmaceutiques, notamment Pfizer, Novartis, Roche, Merck ou encore GSK. En effet, le secteur privé est très intéressé par les compétences techniques du Broad Institute.
Le séquençage génétique au cœur des compétences du Broad Institute
Le Broad Institute possède un degré d’excellence sur les mécanismes biologiques et une réputation sans égale en ce qui concerne le séquençage génétique. Le centre de séquençage du Broad Institute, qui a d’ailleurs été un des principaux contributeurs du Human Genome Project, est l’un des plus important centre de séquençage dans le monde, l’un des trois principaux aux Etats Unis, avec le Human Genome Sequencing Center at Baylor College of Medecine à Houston et le McDonnell Genome Institute à Washington University in St Louis.
L’ensemble de la chaîne de séquençage, de niveau presque industriel, est montée sur un modèle rappelant le kanban cher à Toyota, incluant des sites dédies aux consommables, des marqueurs autours des outils, des tableaux d’efficacité de productivité des machines, le planning des maintenances etc.
Grâce à son approche industrielle, le site peut aujourd’hui analyser jusqu’à 1.400 échantillons par jour, 95% étant des données humaines (on compte parmi les autres types d’échantillons des spécimens de singes, du virus Ebola, et même de l’homme de Neandertal). Fort de robustes compétences techniques basées sur les chercheurs d’Harvard et du MIT ainsi qu’une importante capacité de production, le Broad Insitute propose aujourd’hui ses services de séquençage à l’extérieur pour d’autres centres de recherche à travers le monde.
Le Broad Institute est aujourd’hui à la tête d’une quantité massive de données. A 1.400 échantillons par jour et pour des brins d’ADN qui font quelques 3,4 billions de bases, le Broad Institute possède une base de données à très forte valeur ajoutée.
Google fera rayonner les compétences du Broad
L’alliance entre le Broad Institute et Google Genomics est basée sur le lancement d’une version limitée du logiciel utilisé par le Broad Institute appelé Genome Analysis Toolkit (ou GATK), disponible « as a service » sur la plateforme Cloud de Google. Le logiciel qui a été développé par le Broad Institute aidera les scientifiques à travers le monde à analyser rapidement les données de séquençage génomique.
Il faut également savoir que séquençage de l’ADN génère d’énormes quantités de données. En effet et a titre d’exemple, les données brutes du génome d’une seule personne occupent plus de 100 giga-octets de mémoire. Le Broad Institute a à lui tout seul séquencé ou génotypé l’équivalent de plus de 1,4 millions d’échantillons biologiques. D’énormes ressources sont ainsi nécessaires pour analyser toutes ces données, ce qui est l’une des autres raisons du partenariat avec Google.
Le service de Google Genomics permettra donc aux chercheurs à travers le monde de bénéficier des meilleures pratiques en termes de séquençage basées sur l’expertise du Broad Institute, sans se soucier de la gestion et des performances de leur infrastructure informatique.
Un marché du séquençage génétique en plein boom
Ce partenariat intervient dans un contexte où tous les géants du web ont aujourd’hui ouvert une plateforme cloud dédiée à l’hébergement et à l’analyse de données liées au séquençage génétique. On compte parmi eux NCBI BLAST pour Windows Azure, Genomics labs pour Amazon Web Services ou encore IBM. Un choix intelligent quand on sait que le marché seul du « online sequencing » pourrait atteindre le milliard de dollars d’ici 2018, pour un marché total du séquençage génétique qui pourrait atteindre le 20 milliards selon Jay Flatley, Président Directeur Général d’Illumina.
Bulletin de veille Science, Technologie et Innovation – Etats-Unis