V2.2 DSL2 transition
Next release corresponding to different improvements of the pipeline:
- improve documentation: improve "use case" page + correct graphical representation of metagWGS
- replace some tools by more performant tools if it is necessary? (diamond --> mmeseqs2? , bwa--> bwa v2?)
- new binning strategy and functional annotation step
- change architecture from DSL1 to DSL2
- parallelize the 03_filtering step to make it faster
- handling rRNA genes detection for potential mapping on RFAM
- various bug fixes
- Deal with HiFi reads
1 Contexte scientifique
[cf. milestone V1] Le workflow d'analyse de données métagénomique WGS Illumina créé dans le cadre du projet AntiSelfish. Il a également été et sera utilisé dans d'autres projets d'analyse.
2 Description de la demande
Pour améliorer la robustesse du code : implémentation de tests fonctionnels à chaque étape du workflow. De plus, sont nécessaires un refactoring, une revue de la doc et potentiellement un refactoring de celle-ci. À voir à l'usage.
3 Organisation
3.1 Planning
De nov 2021 à déc 2021 : Migration en DSL2, ajout de certaines briques dédiées aux lectures HiFi (celles qui suivent l'assemblage) et mise à jour de la documentation
Janvier 2022 - Juin 2022 : diverses améliorations de la performance du workflow (voir les issues) et implémenter la possibilité de faire du co-assemblage
Bornes plus floues : implémenter les stratégies de binning les plus intéressantes pour nos projets en priorité, avant fin septembre 2022 si on a les ressources nécessaires.
3.2 Personnes
Implémentation : Pierre, Céline et Jean
Tests et revue du code : Céline & Claire
4. Échéancier
voir planning
5 Critères de validation
Test fonctionnel opérationnels Test du pipeline : Céline & Claire
6 Bilans et modifications du planning et des ressources
6.1 Point d'étape du 29 novembre 2021 :
Passage à la milestone suivante :
- outils plus performants (bwa, eggnog-mapper, mmseq2)
- use_case.md à mettre à jour plus tard
- binning et co-assemblage
Nous avons décidé de faire une release, voyant la version DSL2 finalisée plus tôt que prévu. Cela permettra de ne pas avoir à maintenir les branches DSL1 et DSL2 en parallèle. La nouvelle milestone qui suivra contiendra les améliorations du binning, le co-assemblage et les updates d'outils divers. Fermeture de la branche "dsl2" lors du merge dans les jours qui viennent.
6.2 Point d'étape du 17 décembre 2021 :
La branche dev est la plus à jour (version DSL2). La migration en DSL2 a été faite dans les temps.
Problèmes techniques sur la forge, indépendants de notre volonté, nous empêchent d'uploader les images singularity sur la forge ; et donc de tag.
Les issues prioritaires doivent être faites pour le tag, qui sera repoussé au début de l'année 2022 : proposition fin janvier.
L'arrivée de nouvelles forces travailleuses sur le projet permettra de s'occuper de ces issues.
Nouveau planning :
Janvier 2022 :
- issues prioritaires + nouveau tag DSL2
Février - Juin 2022 :
- diverses améliorations de la performance du workflow
- implémenter la possibilité de faire du co-assemblage
Bornes plus floues (voir en janvier avec les nouvelles personnes) : implémenter les stratégies de binning les plus intéressantes pour nos projets en priorité, avant fin septembre 2022 si on a les ressources nécessaires.
6.3 Point d'étape du 26 janvier 2022 :
Nous avons taggué la version 2.2. Et redéplacé les issues sur la 2.3. En pratique les issues qui avaient été mises prioritaires ont été traitées comme prévu. En terme de ressources Pierre est parti mais Maïna reste jusque juin.