HEMIC

HEMIC Méta-analyse et agrégation de données hétérogènes en vue de consolider des modèles de prédiction: application en microbiologie alimentaire et sécurité sanitaire des aliments

Projet de thèse de Maëva Caillat

Contexte :

Les producteurs, transformateurs et distributeurs du secteur agroalimentaire doivent garantir la sûreté et la qualité des denrées alimentaires qu’ils mettent sur le marché. Pour cela, ils peuvent utiliser des prévisions mathématiques basées sur les connaissances en microbiologie et les données issues de la littérature. Le GIS Sym’Previus met à disposition des outils de prévision en microbiologie alimentaire qui peuvent être utilisés par ces acteurs (https://symprevius.eu/fr/). Ces outils peuvent également faciliter le développement de nouvelles recettes, identifier des dangers microbiologiques sur de nouveaux produits ou qualifier l’utilisation de nouveaux ingrédients. Ces besoins sont de plus en plus importants dans un contexte de transition écologique qui implique une transition industrielle, alimentaire et énergétique.
Dans ce cadre, il est important de diversifier et massifier l’information utilisée pour produire les simulations du comportement microbien, en vue d’assurer la sécurité et la qualité des denrées alimentaires. Il existe peu d’outils mis à disposition des acteurs sur secteur agroalimentaires et ils nécessitent une mise à jour continue. La littérature regorge de données à exploiter. Néanmoins, elles sont difficiles à exploiter directement car elles sont issues de différents produits, de différentes stratégies ou méthodologies autant biologique que statistique, sont de natures différentes car les comportements étudiés sont diverses (croissance, inactivation).

Objectifs :

Les travaux se découperont en 3 phases :

1-    Développer des méthodes statistiques pour agréger des données de différentes natures. 
Il s’agit de collecter de façon semi-automatisée les données (data mining) et notamment des données parcellaires, de prendre en compte de nouveaux facteurs environnementaux expliquant la croissance ou l’inactivation des microorganismes, d’estimer et prendre en compte la variabilité expérimentale (sp., souches, serovar, milieux…) et d’appliquer un indice de confiance en fonction de la qualité des données
2-    Développer des approches quantitatives (modèles) pour estimer les paramètres de microbiologie prévisionnelle 
Afin d’enrichir la base de données produites par le GIS Sym’Previus, il faudra intégrer les données collectées à l’étape 1 et les agréger aux données existantes. Cette étape de modélisation (avec potentiellement ) extrapolation recourra aux modèles probabilistes pour intégrer la variabilité biologique des microorganismes, la variabilité physico-chimique des aliments, et l’incertitude des prévisions.  Des simulations du comportement  de différents sérovars, souches, espèces sur une plus grande variété d’aliments pourront être réalisées. 
3-    Explorer différentes approches issues du Machine Learning ou Intelligence Artificielle :
En dehors de ces méthodes statistiques, il s’agira d’explorer des approches numériques de type Machine Learning ou Intelligence artificielle afin d’évaluer si elles peuvent apporter un complément d’information ou se substituer, en partie, aux outils de modélisation / simulation mis en place jusqu’ici dans le logiciel Sym’Previus.

Date de démarrage : Octobre 2025

Durée : 3 ans

Coordination : Jeanne-Marie Membré

Financement : Thèse Cifre financée par l'ADRIA