Retour aux ressources

Modèles de rendements agricoles : comment validons-nous les résultats que nous mettons entre vos mains ?

Florent Baarsch

Fondateur & CEO

Science

Personne ne dispose d'une boule de cristal. Projeter les rendements agricoles à horizon 10, 20 ou 30 ans dans un contexte de changement climatique revient par définition à travailler avec de l'incertitude. Pourtant, ces projections servent de base à des décisions aux conséquences bien réelles. La question qui en découle est donc inévitable : comment garantir que nos modèles sont suffisamment robustes pour permettre une prise de décision éclairée ?

Des projections au service de décisions réelles

Pour les banques, les projections de rendement permettent de mesurer l'évolution du risque climatique pesant sur leur portefeuille de prêts agricoles. Pour les agriculteurs, elles éclairent les choix d'adaptation du système de production, essentiels pour sécuriser la viabilité économique de l'exploitation à long terme. Pour les organisations professionnelles et les pouvoirs publics, elles guident l'allocation des financements en faveur de la souveraineté alimentaire.

Face à cette responsabilité, chez finres, nous ne prétendons pas prédire l'avenir. En revanche, nous nous sommes donné pour obligation de vérifier de manière rigoureuse, mesurable et transparente que nos modèles comprennent bien le passé, le présent, et qu'ils se comportent de manière cohérente face à des situations inédites. C'est l'objet de notre processus de validation.

Trois piliers pour une validation exigeante

Notre processus de validation repose sur trois piliers complémentaires : appliquer les standards de la recherche scientifique, suivre les principes du référentiel bancaire BCBS 239, et fournir à nos clients et partenaires une transparence totale sur le processus et ses résultats.

Les standards de la recherche scientifique

La majorité de l'équipe finres est issue du monde de la recherche. Nous appliquons à nos modèles le même niveau d'exigence que celui attendu pour une publication dans une revue scientifique. Notre méthodologie fait l'objet d'une revue par des pairs externes, indépendants et sans intérêt commercial dans nos résultats - à titre d'exemple, un chercheur de l'INRAE a intégralement audité notre approche pour la modélisation des rendements. Chaque modèle est en outre soumis à une batterie de 18 tests couvrant trois dimensions : statistique, agronomique et climatique.

Les principes du référentiel bancaire BCBS 239

Ce choix peut sembler inhabituel pour une entreprise du secteur agricole. Il est délibéré : nos données alimentent des décisions financières, elles doivent donc répondre aux mêmes exigences que les données financières elles-mêmes. Deux principes du BCBS 239 guident directement nos travaux: le principe d'exactitude et d'intégrité impose que les données soient fiables en conditions normales comme en période de stress.

Nos 18 tests vérifient cela, y compris dans des configurations climatiques extrêmes - sécheresses prolongées, canicules, excès de précipitations. Le principe d'exhaustivité impose quant à lui que les données puissent être désagrégées par type de risque : nos tests vérifient que le modèle capture correctement les différents facteurs de stress climatique et leur impact respectif sur les rendements, sans produire un chiffre moyen qui masquerait la diversité des risques.

Transparence totale auprès de nos partenaires

Un processus de validation n'a de valeur que s'il est partagé. Chaque culture modélisée par finres fait l'objet d'un rapport de validation complet d'environ 80 pages, documentant l'intégralité des tests réalisés, leurs résultats et les éventuelles limites identifiées. Nous ne demandons pas à nos clients de nous croire sur parole. Nous leur donnons les moyens de vérifier par eux-mêmes la robustesse de chaque modèle.

Les 18 tests : description et organisation

Notre validation se déroule en trois étapes successives. Chacune répond à une question précise et mobilise des indicateurs différents. L'ensemble forme un dispositif qui teste le modèle sous toutes ses coutures - statistiquement, climatiquement et agronomiquement.

Le modèle reproduit-il correctement le passé ?

La première étape mesure la capacité du modèle à reproduire les rendements historiques observés. Le principe est celui de la validation croisée : environ 20 % des données sont mises de côté et n'entrent pas dans l'entraînement. Les tests sont ensuite réalisés sur ces données « inconnues » du modèle, conformément aux travaux de Cerqueira et al. (2020). La validation croisée est répétée 10 fois avec des découpages différents, garantissant que les résultats ne sont pas le fruit d'un découpage chanceux.

Les indicateurs mesurés couvrent deux dimensions. Sur le plan statistique, nous mesurons le R², le RMSE, le MAE et le MAPE, aussi bien sur les rendements en valeur absolue (kg/ha) qu'en variation (%), calculés sur l'ensemble de la distribution - années extrêmes incluses. Sur le plan agronomique, nous vérifions que le modèle capture correctement l'impact des événements climatiques extrêmes aux différents stades du cycle cultural, ainsi que l'effet positif de l'irrigation en conditions de stress hydrique.

Tests de validation sur les données observées

Indicateur Type de testExplication
R² sur le rendement en niveau (en kg / ha)Statistique Mesure les écarts entre séries observées et modélisées, en différenciant données d'entraînement et de test
R² sur le rendement en variation (%)Statistique Mesure les écarts entre séries observées et modélisées, en différenciant données d'entraînement et de test
R² / RMSE / MAE / MAPE sur les rendements en niveau et variation pour l’ensemble des déciles de la distributionStatistique Mesure les écarts entre séries observées et modélisées sur l'ensemble de la distribution
Effet de l’irrigationAgronomique Mesure la capacité du modèle à prendre en compte l’effet positif de l’irrigation dans les conditions de sécheresse

Le modèle se comporte-t-il de façon cohérente face à des situations inédites ?

La deuxième étape pousse le modèle au-delà des données historiques. Il est soumis à des configurations climatiques inédites mais plausibles, proches des conditions observées au cours des vingt dernières années. L'objectif : vérifier qu'il ne produit pas de résultats aberrants - qu'il n'« hallucine » pas, pour reprendre un terme désormais courant dans le monde de l'intelligence artificielle.

Parmi les tests mobilisés : l'erreur absolue moyenne des quantiles (QMAE), qui mesure la précision du modèle sur l'ensemble de la distribution et non uniquement sur la moyenne ; la corrélation de Moran, qui vérifie la cohérence spatiale des prédictions (un modèle prédit la chute d'un rendement dans une région sans que les voisines soient affectées soulèverait une incohérence manifeste) ; et la distance de Mahalanobis, qui identifie les configurations algorithmiques produisant des résultats statistiquement aberrants.

Tests de validation sur les données inédites

Indicateur Type de testExplication
Erreur absolue moyenne des quantiles (QMAE) de la variation du rendementStatistique Mesure les erreurs - dans les quantiles - entre les séries observées et modélisées, en différenciant données d'entraînement et de test
Quantiles consécutifs de la variation de rendement préditeStatistique Identifie les incohérences dans la distribution des résultats avec un modèle qui viendrait à répéter la même valeur
Corrélation de MoranStatistique Mesure la capacité du modèle à représenter la distribution spatiale des rendements
Distance de MahalanobisStatistique Identifie des configurations algorithmiques conduisant à des résultats aberrants
Effet des extrêmes des variables climatiques sur les variations de rendementAgronomique Mesure la capacité du modèle à représenter les conséquences des extrêmes climatiques passés, aux différentes périodes du cycle phénologique
Effet de l’irrigation Agronomique Mesure la capacité du modèle à prendre en compte l’effet positif de l’irrigation dans les conditions de sécheresse

Le modèle représente-t-il correctement les effets des leviers d'adaptation ?

Cette étape illustre une conviction centrale : la performance statistique ne suffit pas. Un modèle peut afficher un excellent R² et produire des résultats agronomiquement absurdes. Contrairement aux étapes précédentes, cette dernière série de tests est éliminatoire : un modèle qui produit des résultats agronomiquement erronés ne peut pas être conservé.

Le principe consiste à vérifier que les effets attendus des mesures d'adaptation sont correctement restitués par l'algorithme. L'irrigation doit réduire les pertes de rendement quand les précipitations sont faibles ; l'ombrage doit limiter les dégâts liés aux températures ou au rayonnement excessifs. Si le modèle ne restitue pas ces effets, il est rejeté.

Tests de validation sur les leviers d'adaptation

Mesure d'adaptationStress climatique testéEffet attendu
IrrigationFaible cumul de précipitationsRéduction des pertes de rendement
DrainageFort cumul de précipitationsRéduction des pertes de rendement
Ombrage (température)Températures élevéesRéduction des pertes de rendement
Ombrage (rayonnement)Rayonnement élevéRéduction des pertes de rendement

Le rapport de validation par culture : un outil de transparence essentiel

L'ensemble des 18 tests, leurs résultats détaillés et les limites identifiées sont compilés dans un rapport de validation complet, d'environ 80 pages, pour chaque culture modélisée. Ces rapports sont mis à disposition de nos clients et partenaires au même titre que les données de rendement elles-mêmes. C'est, à notre connaissance, un niveau de transparence sans équivalent dans notre secteur.

Vers un standard de marché pour le secteur agricole ?

À ce jour, le secteur agricole ne dispose d'aucun référentiel commun définissant les principes de validation des modèles et des données agro-climatiques. Chaque acteur définit ses propres standards. Les banques, coopératives, chambres d'agriculture et décideurs publics qui s'appuient sur ces projections n'ont souvent aucun moyen objectif de comparer la fiabilité des sources qu'ils utilisent.

Dans un contexte où le changement climatique multiplie les incertitudes et où les décisions d'adaptation engagent des investissements importants à long terme, la question de la fiabilité des données n'est plus un sujet technique réservé aux scientifiques. C'est un enjeu collectif. Le secteur gagnerait à se doter de principes communs - non pas pour uniformiser les approches, mais pour garantir un socle minimal d'exigence permettant à chaque utilisateur de décider en connaissance de cause.

C'est dans cet esprit que nous partageons notre approche aujourd'hui. Non pas comme la seule voie possible, mais comme une contribution à un débat que nous espérons voir émerger à l'échelle du secteur.

Les rapports de validation de nos modèles de rendement sont disponibles sur demande. Pour en savoir plus sur notre méthodologie ou consulter un rapport, contactez-nous.