Maëva Caillat

Thèse de Maëva Caillat (2025-2028)

Méta-analyse et agrégation de données hétérogènes en vue de consolider des modèles de prédiction : application en microbiologie alimentaire et sécurité sanitaire des aliments (Encadrement : Jeanne-Marie Membré et Louis Delaunay)

Maeva Caillat

Les producteurs, transformateurs et distributeurs du secteur agroalimentaire doivent garantir la sûreté et la qualité des denrées alimentaires qu’ils mettent sur le marché. Pour cela, ils peuvent utiliser des prévisions mathématiques basées sur les connaissances en microbiologie et les données issues de la littérature. Le GIS Sym’Previus met à disposition des outils de prévision en microbiologie alimentaire qui peuvent être utilisés par ces acteurs (https://symprevius.eu/fr/). Ces outils peuvent également faciliter le développement de nouvelles recettes, identifier des dangers microbiologiques sur de nouveaux produits ou qualifier l’utilisation de nouveaux ingrédients. Ces besoins sont de plus en plus importants dans un contexte de transition écologique qui implique une transition industrielle, alimentaire et énergétique.
Dans ce cadre, il est important de diversifier et massifier l’information utilisée pour produire les simulations du comportement microbien, en vue d’assurer la sécurité et la qualité des denrées alimentaires. Il existe peu d’outils mis à disposition des acteurs sur secteur agroalimentaires et ils nécessitent une mise à jour continue. La littérature regorge de données à exploiter. Néanmoins, elles sont difficiles à exploiter directement car elles sont issues de différents produits, de différentes stratégies ou méthodologies autant biologique que statistique, sont de natures différentes car les comportements étudiés sont diverses (croissance, inactivation).

Les modèles utilisés en microbiologie prévisionnelle doivent être enrichis de façon continue par les données issues de la littérature scientifique ou de la littérature grise (ex. EFSA, FDA). 
Néanmoins, il existe une grande diversité de réponses étudiées (taux de croissance, latence, croissance/non-croissance) qui de plus sont sujettes à variabilité due aux conditions expérimentales (souches, espèce, milieux, reproduction en laboratoire du process ou de la formulation, etc), et de l’incertitude (erreur de mesure,, plan d’expérience plus ou moins optimisés, etc). Il est nécessaire de mettre en place une méthodologie statistique robuste et rigoureuse pour enrichir, en continu, les outils existants en microbiologie prévisionnelle tout en s’affranchissant de ces “biais” éventuels.

Les travaux se découperont en 3 phases :

  1. Développer des méthodes statistiques pour agréger des données de différentes natures. 
    Il s’agit de collecter de façon semi-automatisée les données (data mining) 
  2. Développer des approches quantitatives (modèles) pour estimer les paramètres de microbiologie prévisionnelle 
    Afin d’enrichir la base de données produites par le GIS Sym’Previus, il faudra intégrer les données collectées à l’étape 1 et les agréger aux données existantes. Cette étape de modélisation (avec potentiellement ) extrapolation recourra aux modèles probabilistes pour intégrer la variabilité biologique des microorganismes, la variabilité physico-chimique des aliments, et l’incertitude des prévisions.  
  3. Explorer différentes approches issues du Machine Learning ou Intelligence Artificielle :
    En dehors de ces méthodes statistiques, il s’agira d’explorer des approches numériques de type Machine Learning ou Intelligence artificielle afin d’évaluer si elles peuvent apporter un complément d’information ou se substituer, en partie, aux outils de modélisation / simulation mis en place jusqu’ici dans le logiciel Sym’Previus.