V2.3 - Binning and co-assembly ?
Next release corresponding to different improvements of the pipeline:
1 Contexte scientifique
[cf. milestone V1] Le workflow d'analyse de données métagénomique WGS Illumina créé dans le cadre du projet AntiSelfish. Il a également été et sera utilisé dans d'autres projets d'analyse. Le long read a été ajouté (mais après l'assemblage)
2 Description de la demande
Amélioration diverses du WF cf issues. Binning : stratégies à tester et implémenter. Voir pour co-assemblage (intérêt et limites) Ensuite ajout de la partie assemblage pour les reads HIFI.
3 Organisation
3.1 Planning
Janvier 2022 - Juin 2022 : diverses améliorations de la performance du workflow (voir les issues) et implémenter la possibilité de faire du co-assemblage + binning (Vincent et Jean)
3.2 Personnes
Implémentation : Maïna et Jean et Vincent
Tests et revue du code : Céline & Claire
4. Échéancier
voir planning
5 Critères de validation
Utilisation du Mock de Joanna pour valider la qualité du binning (métrique "standard" cf CAMI) Test du pipeline : Céline & Claire
6 Bilans et modifications du planning et des ressources
6.1 Point d'étape du 29 aout 2022 :
Décision de faire une release plus vite la prochaine fois (y mettre certains améliorations pressenties) pour taguer plus souvent les nouvelles versions. Car aujourd'hui on lancer des fois la branche en cour de développement pour la production pour avoir des modifications utiles.
Changement de planning décidé en juin dernier : faire la release avant ECCB soit pour le 18 septembre. Cette release doit à minima contenir une première version du binning.
- plot affiliation taxonomique difficile à intégrer dans multiQC. A intégrer dans la prochaine release v2.3.1.
- metrics sur les annotations fonctionelles et ahoutr au rapport multiQC. Evaluation du temps nécessaire à faire car serait chouette de l'avoir. MV + JM
- Co-assembly : décision de reporter à la release 2.3.1
- garder les bins de mauvaises qualité pour les présenter à l'utilisateur. VD regarde si c'est long. On voir si on peut le faire pour la 2.3 ou si on reporte pour la 2.3.1.
- EggNog mapper à mettre à jour. MV s'est charge.
- Binning
- VD finalise le multiQC (des bug d'affichage à corriger). test sur antiselfish ok relancer sur le cross-alignement. Améliorer la heatmap en tenant compte des groupes si il y en a dans la sample sheet + doc à finir.
- MV Finalise les tests fonctionnels + récupération de versions de logiciels. POur bin_refinment et checkM2 modifiés il faut le spécifier dans les versions et ajouter une phrase dans la doc et pointer le code source.
- JM rajoute une issue pour mieux gérer les versions à l'avenir : quelque chose de plus automatisé serait top. + test du binning sur des donées HiFi.
- Voir pour améliorer la doc en rajoutant un schéma "metro" et un code couleur pour chaque étape qui serait repris dans les schémas de chaque étape.
En terme de ressource : le stage de Maina s'est terminé fin juin mais nous la gardons jusque fin décembre 2022 en CDD pour publier le workflow.
6.2 Point d'étape du 05 septembre 2022 :
Les trois issues suivantes sont finalement prévues sur la version 2.3.1 : Co-assembly implementation, Binning: keep track of poor quality bins, Metrics on final quantification file with annotations
Pour la release 2.3 prévu mi-septembre on fini les tests, la doc et l'image singularity avec la nouvelle version de eggNog mapper.
6.3 Point d'étape du 05 octobre 2022 :
Merge ok, release ok juste avant ECCB le 15 septembre.
Tous les tests passent correctement.
Reste quelques conflits sur les tests et des trucs mineurs. A corriger cependant bientôt.