La question revient en permanence dans les directions financieres : quel modele d'IA choisir pour de l'analyse financiere serieuse ? Le debat se cristallise souvent entre Mistral, modele francais positionne sur l'entreprise, et Claude, considere comme une reference sur le raisonnement analytique. Mais peu de gens prennent le temps de les comparer sur un cas concret.

Chez Findfi, on a voulu trancher autrement qu'avec des avis generaux.

On a construit un cas pratique de controle de gestion realiste, base sur des situations rencontrees en PME industrielle. Une analyse d'ecarts budget vs reel, avec une chute d'EBITDA de 77 %, plusieurs effets imbriques (volume, prix, mix, couts) et la demande explicite d'un livrable orient comite de direction. Le meme prompt a ete soumis aux deux modeles, dans leur version grand public la plus accessible.

Voici ce que ca donne.

Le cas NORDIA Industries

NORDIA est une PME industrielle francaise fictive mais credible : 18 M€ de CA, 95 salaries, composants techniques B2B pour l'automobile, l'aeronautique et l'energie. A fin avril 2026, l'EBITDA cumule annuel chute de 870 K€ budgetes a 200 K€ reels, soit un ecart de -670 K€ ou -77 %.

Le contexte est riche en signaux : ralentissement automobile francais de 15 %, deux clients qui reportent des commandes de Q2 a Q4, un nouveau contrat aeronautique en cours d'execution, une baisse des matieres premieres de 8 %, une hausse salariale conventionnelle de 2,5 % appliquee en mars, l'embauche d'un responsable qualite, et une migration ERP exceptionnelle de 25 K€.

Le prompt demande cinq livrables : identifier les causes en distinguant prix, volume, mix et couts ; hierarchiser les ecarts par criticite ; proposer trois actions correctives ; projeter la trajectoire annuelle ; et rediger un commentaire de gestion synthetique pour le CODIR en dix lignes maximum.

Chaque reponse est notee sur cinq criteres : precision quantitative, analyse qualitative, pertinence des actions, projection et anticipation, synthese executive.

Mistral : la clarte mais la surface

Mistral repond vite et structure correctement. Le plan suit l'ordre des questions, les tableaux sont propres, le ton est professionnel. A premiere lecture, le livrable a l'air convaincant.

Le probleme apparait quand on regarde sous le capot.

Sur la decomposition des ecarts, Mistral identifie bien les categories prix, volume, mix et couts. Mais il reste a un niveau descriptif. Il rappelle que l'automobile baisse de 860 K€ et que les achats baissent de 150 K€, sans aller chercher la mecanique de cascade entre la chute du CA, l'absorption des charges fixes sur une base reduite, et la degradation du mix produit. Le diagnostic est juste mais reste en surface.

Sur les actions correctives, les propositions sont raisonnables mais generiques : relancer les clients automobile, ajuster les couts, accelerer sur l'aeronautique. On dirait des recommandations de manuel. Aucune quantification de l'impact attendu, aucun delai precis, aucun responsable suggere. Un directeur financier qui presente ca au CODIR se fera ressortir la meme question : combien ca rapporte, quand, et qui le fait.

La projection annuelle est l'endroit ou la difference se voit le plus. Mistral extrapole lineairement la tendance d'avril sur le reste de l'annee, sans interroger les hypotheses : est-ce que les reports Q2 vers Q4 vont se materialiser ? Est-ce que la baisse des matieres premieres va se maintenir ? Est-ce que le ramp-up aeronautique est lineaire ou progressif ? Le chiffre tombe, sans scenario alternatif.

En revanche, et c'est la qu'il faut etre honnete, le commentaire de gestion pour le CODIR est tres bon. Synthetique, structure, rythme. C'est probablement la meilleure version des cinq livrables, et c'est sur cette partie que Mistral surprend agreablement.

Claude : la profondeur analytique

Claude prend plus de temps, produit plus de texte, et la difference se voit immediatement sur la qualite du raisonnement.

Sur la decomposition des ecarts, Claude ne se contente pas de lister. Il quantifie chaque effet separement : la chute du volume automobile compte pour -860 K€ en haut, mais il reconstitue l'impact reel sur la marge brute apres absorption des achats variables. Il identifie l'effet mix produit comme une cause distincte du volume : l'aeronautique pese plus dans le CA reel que dans le budget, mais ses marges sont probablement inferieures, ce qui explique une partie des -3,4 points de taux de marge brute. Cette distinction echappe completement a Mistral.

Sur la hierarchie des ecarts, Claude ne se contente pas de classer par ordre de valeur. Il introduit une dimension de criticite et d'horizon : un ecart est critique non pas seulement par son montant, mais par sa persistance probable. La chute automobile est priorite 1 parce qu'elle peut durer plusieurs trimestres. La hausse salariale est priorite 2 parce qu'elle est structurelle. La migration ERP est priorite 3 parce qu'elle est ponctuelle. Cette hierarchisation est exactement celle qu'un controleur de gestion senior produirait.

Sur les actions correctives, Claude quantifie. Chaque action a un delai, un responsable, un budget estime et un impact attendu chiffre. La reactivation client doit recuperer 150 a 200 K€ de CA sur le T2. L'ajustement de la structure de couts doit generer 50 K€ d'economies mensuelles a partir de juillet. L'acceleration aeronautique vise 100 K€ de CA additionnel sur T3-T4. Ce sont les actions telles qu'on les ecrirait dans un plan d'action operationnel, pas des recommandations theoriques.

Sur la projection annuelle, Claude construit deux scenarios. Un scenario tendanciel qui prolonge la situation sans correction, et un scenario avec les actions deployees. Il chiffre l'ecart entre les deux : 490 K€ d'EBITDA recuperable sur l'annee, soit 49 % du deficit comble. Il identifie ensuite les points de vigilance : et si l'automobile ne rebondit pas au T4, et si l'aeronautique ne suit pas, et si la baisse des matieres premieres ne tient pas au-dela du T3. Trois facteurs de risque chiffres, qui transforment la projection en outil de pilotage.

La ou Claude est moins bon, c'est sur la mise en forme du commentaire CODIR final. Le texte est dense, parfois lourd, et necessite un passage de retouche pour rentrer dans le format dix lignes demande. Pour un livrable destine a etre lu en cinq minutes par une direction generale, ce n'est pas anodin.

Le verdict par critere

Sur la precision quantitative, Claude l'emporte largement. Il calcule, croise, distingue les effets imbriques. Mistral reste descriptif.

Sur l'analyse qualitative, meme constat. Claude identifie le mix produit comme cause distincte, separe les effets de cascade, contextualise. Mistral ne va pas au bout du raisonnement.

Sur la pertinence des actions, Claude propose un plan operationnel chiffre. Mistral propose des recommandations generiques.

Sur la projection, Claude construit des scenarios avec points de vigilance. Mistral extrapole en ligne droite.

Sur la synthese executive, Mistral l'emporte. Son commentaire CODIR est plus rythme, plus concis, plus facile a lire. Claude est dense et lourd.

Quatre points pour Claude, un pour Mistral.

Ce que ca veut dire en pratique

Ce benchmark ne dit pas que Mistral est mauvais. Il dit que les deux modeles ne servent pas la meme chose.

Claude est l'outil pour la phase d'analyse. Quand un controleur de gestion doit comprendre ce qui se passe vraiment dans les chiffres, identifier les leviers, construire un plan d'action defendable devant un comite, Claude apporte une rigueur analytique que Mistral n'a pas encore atteinte. C'est l'outil de la profondeur.

Mistral est l'outil pour la phase de redaction. Quand le diagnostic est pose et qu'il faut maintenant le presenter en deux paragraphes pour un mail au CEO, un slide de comite ou un commentaire de gestion serre, Mistral produit un texte plus naturel, plus francais, plus rythme. C'est l'outil de la forme.

Le workflow optimal n'est donc pas "choisir entre les deux", mais les utiliser en sequence : Claude pour l'analyse et la construction du plan d'action, Mistral pour la mise en forme finale du livrable executif.

Pour un professionnel de la finance qui veut s'equiper, la conclusion est claire. Un seul outil suffit rarement. La vraie productivite vient de l'enchainement, pas du choix unique.

Vous voulez tester ce workflow ?

Si vous souhaitez etre accompagne dans la mise en place d'un workflow IA pour votre direction financiere, ou si vous avez besoin d'un agent IA specialise pour votre activite, contactez-nous directement.

Nous contacter →