Know more

Our use of cookies

Cookies are a set of data stored on a user’s device when the user browses a web site. The data is in a file containing an ID number, the name of the server which deposited it and, in some cases, an expiry date. We use cookies to record information about your visit, language of preference, and other parameters on the site in order to optimise your next visit and make the site even more useful to you.

To improve your experience, we use cookies to store certain browsing information and provide secure navigation, and to collect statistics with a view to improve the site’s features. For a complete list of the cookies we use, download “Ghostery”, a free plug-in for browsers which can detect, and, in some cases, block cookies.

Ghostery is available here for free: https://www.ghostery.com/fr/products/

You can also visit the CNIL web site for instructions on how to configure your browser to manage cookie storage on your device.

In the case of third-party advertising cookies, you can also visit the following site: http://www.youronlinechoices.com/fr/controler-ses-cookies/, offered by digital advertising professionals within the European Digital Advertising Alliance (EDAA). From the site, you can deny or accept the cookies used by advertising professionals who are members.

It is also possible to block certain third-party cookies directly via publishers:

Cookie type

Means of blocking

Analytical and performance cookies

Realytics
Google Analytics
Spoteffects
Optimizely

Targeted advertising cookies

DoubleClick
Mediarithmics

The following types of cookies may be used on our websites:

Mandatory cookies

Functional cookies

Social media and advertising cookies

These cookies are needed to ensure the proper functioning of the site and cannot be disabled. They help ensure a secure connection and the basic availability of our website.

These cookies allow us to analyse site use in order to measure and optimise performance. They allow us to store your sign-in information and display the different components of our website in a more coherent way.

These cookies are used by advertising agencies such as Google and by social media sites such as LinkedIn and Facebook. Among other things, they allow pages to be shared on social media, the posting of comments, and the publication (on our site or elsewhere) of ads that reflect your centres of interest.

Our EZPublish content management system (CMS) uses CAS and PHP session cookies and the New Relic cookie for monitoring purposes (IP, response times).

These cookies are deleted at the end of the browsing session (when you log off or close your browser window)

Our EZPublish content management system (CMS) uses the XiTi cookie to measure traffic. Our service provider is AT Internet. This company stores data (IPs, date and time of access, length of the visit and pages viewed) for six months.

Our EZPublish content management system (CMS) does not use this type of cookie.

For more information about the cookies we use, contact INRA’s Data Protection Officer by email at cil-dpo@inra.fr or by post at:

INRA
24, chemin de Borde Rouge –Auzeville – CS52627
31326 Castanet Tolosan CEDEX - France

Dernière mise à jour : Mai 2018

Menu Logo Principal Logo Biogeco Logo Université de Bordeaux

Home page

PLEIADE

PLEIADE

From patterns to models in computational biodiversity and biotechnology

 

Team Leaders: Jean-Marc Frigerio & Franck Salin

Manager : Florence Le Pierres

Background and motivation

La connaissance et préservation de la biodiversité est un enjeu crucial qui doit être présent à l’esprit lors de toute conception et réalisation d’une activité humaine. La connaissance de la diversité notamment en espèces est à la base de la compréhension de la dynamique des communautés. Or, cette diversité est mal connue, malgré plusieurs siècles d’histoire naturelle. Plusieurs « révolutions » permettent d’aborder cette connaissance avec des concepts, outils et méthodes nouveaux :

  • le rapprochement entre évolution, biologie moléculaire, systématique et génétique qui permet de comprendre la diversité actuelle comme fruit d’une histoire évolutive (phylogénies, systématique moléculaire) ;
  • la révolution des NGS qui permet d’avoir accès à la diversité moléculaire de communautés entières, tous organismes confondus  (métabarcoding) ;
  • une révolution numérique actuelle associant données massives  et accès au calcul intensif, avec le développement de méthodes d’analyse issues de l’IA

Pleiade a comme enjeu de contribuer au développement des outils et méthodes numériques en métabarcoding, avec investissement dans le calcul intensif, pour une meilleure caractérisation des patterns de diversité. Pour ce faire Pleiade est une composante d’une équipe mixte Inra/Inria. (voir https://www.inria.fr/equipes/pleiade).

Objectives and strategies

L’activité de Pleiade s’articule globalement autour des éléments suivants :

  • au sein du réseau R-Syst, favoriser les échanges et discussions autour de la notion d’espèce, comment elle se décline selon les grands groupes taxonomiques du réseau (des bactéries aux insectes) ; analyser la qualité du dictionnaire entre taxonomie à base morphologique (celle sur laquelle la systématique est fondée) et à base moléculaire (barcoding), en associant des équipes produisant et maintenant des bases de référence (bactéries, micro-algues, plantes, champignons, nématodes, insectes), en collaboration avec l’infrastructure Rare
  • étudier les associations d’espèces au sein des communautés selon des déterminants de type spatial, temporel, ou environnemental (assemblage des communautés)
  • en amont de cette activité, contribuer à l’évolution des outils et méthodes d’inventaires des communautés, en collaboration avec la communauté scientifique du calcul intensif pour faciliter le passage à l’échelle (coll. HiePACS, SED Inria, IDRIS, GRICAD, …), et l’unité MIAT pour l’appui sur les méthodes statistiques (statistique computationnelle)
  • transférer les outils et méthodes en métabarcoding vers les équipes de recherche utilisatrices, notamment via des collaborations avec la plateforme PGTB ; les (in)valider  par une comparaison avec les outils acceptés comme état de l’art actuel (outils derrière Mothur, QIIME, DADA2, le BLAST, SWARM, …) ;
  • accompagner voire devancer les évolutions dans les outils rendues nécessaires par l’évolution des technologies de séquençage, comme l’émergence actuelle des techniques dites « longs reads », par une proximité et collaboration avec la plateforme PGTB de séquençage/génotypage

Un « focus » particulier est réalisé sur le traitement des données massives issues de NGS qui pose des problèmes partiellement résolus. La plupart des méthodes ont en effet été conçues alors que les jeux de données étaient de taille « accessible » (données Sanger). Le passage à l’échelle sur données issues de NGS se réalise à l’aide d’heuristiques (algorithmes gloutons, etc …). La stratégie de Pleiade quant aux méthodes et outils est double :

  • aller le plus loin possible (en terme de taille des fichiers à analyser) avec des méthodes exactes et contrôlées, afin notamment d’assurer une répétabilité des traitements, et de proposer des benchmarks de comparaison avec la diversité des heuristiques disponibles. Cela requiert le recours au calcul intensif (parallélisation, distribution), qui est un des axes de développement de Pleiade ;
  • relier la caractérisation de la diversité aux outils et méthodes de l’apprentissage (machine learning), notamment s’appuyer sur les outils et méthodes de l’apprentissage supervisé pour la construction d’inventaires avec bases de référence, et l’apprentissage non supervisé pour la construction d’OTUs.

La stratégie scientifique de Pleiade, qui est une petite équipe (deux chercheurs, trois ingénieurs chacun à temps partiel) est de développer un réseau puissant de collaborations suivies, notamment

  • au sein de la communauté du calcul intensif, grâce à la double affiliation Inra/Inria, prolongée avec l’unité MIAT pour les statistiques computationnelles
  • au sein de la communauté européenne du métabarcoding, grâce au projet COST DNAqua.net
  • par une association entre les outils (enjeu de Pleiade) et les données biologiques, au sein du réseau Inra R-Syst
  • avec les équipes en Guyane (IPG) quant aux questions liées à la biodiversité

Key words

Metabarcoding – Ecologie des communautés – Systématique à base moléculaire - NGS – Données massives – Méthodes et algorithmes – Calcul intensif – Apprentissage supervisé et non supervisé.

Staff members

Permanents

Fixed-term employees/Post-doc

PhD students

Alain Franc (DR INRAE)

Guillaume Ravel

Sourakhata Tirera
(Institut Pasteur de Guyane, Univ. de Cayenne, co-direction (direction : Anne Lavergne, IPG))

Jean-Marc Frigerio (IR INRAE)

Bonnie Bailet
(SLU, Uppsala, co-direction (direction : Maria Kahlert, SLU))

Simon Labarthe (CR INRAE)

Mohamed-Anwar Abouabdallah

Franck Salin (IE INRAE)