Optimum local vs optimum global et théorie des contraintes : pourquoi vos gains de productivité ne servent parfois à rien

-

Eliyahu Goldratt, quoique physicien de formation, a profondément marqué le management industriel avec des livres comme Le But (1984), puis The Haystack Syndrome (1990). Son apport repose sur l’idée selon laquelle la performance d’un système est toujours bornée par son goulot d’étranglement. Peu importe les gains obtenus par ailleurs ce goulot fixe à lui seule la performance du système.

A ce stade vous vous demandez surement ce que le « vieux » monde des usines vient faire sur un blog qui parle beaucoup de tech et de travailleurs du savoir mais c’est justement parce que, comme le faisait remarquer un article de The New Yorker :

« Peter Drucker a fait remarquer qu’au cours du XXe siècle, la productivité des travailleurs manuels dans le secteur manufacturier a été multipliée par cinquante, car nous sommes devenus plus intelligents quant à la meilleure façon de construire des produits. Il a fait valoir que le secteur de la connaissance, en revanche, avait à peine entamé un processus similaire d’auto-examen et d’amélioration, existant à la fin du XXe siècle alors que le secteur manufacturier l’avait été cent ans plus tôt  » (Slack Is the Right Tool for the Wrong Way to Work).

C’est donc de celle réflexion qu’est née la théorie des contraintes que j’ai évoqué de nombreuses fois ici et qui propose une démarche assez simple : identifier le goulot, concentrer les efforts sur lui, en tirer le meilleur parti possible, puis passer au suivant car une fois le problème réglé le goulot se déplace. Mais ce qu’il faut en retenir est que la performance ne se mesure pas à l’aune de chaque acteur intervenant sur une activité mais de l’ensemble. Comme l’écrit Goldratt : « Local optimum is not global optimum » (L’optimum local n’est pas l’optimum global).

En bref :

  • La performance d’un système est déterminée par son goulot d’étranglement, et non par l’efficacité de ses composants individuels. Améliorer une ressource non contrainte n’améliore pas la performance globale.
  • La théorie des contraintes propose une démarche séquentielle : identifier la contrainte, concentrer les efforts pour la résoudre, puis recommencer avec la suivante, car toute contrainte déplacée en révèle une autre.
  • Dans les organisations du savoir, les goulots sont immatériels (processus, personnes, coordination) mais leur impact est équivalent à ceux observés en milieu industriel, souvent masqués par une illusion de gain de productivité.
  • L’optimisation locale, si elle n’est pas synchronisée avec le reste du système, génère des déséquilibres, des stocks, des délais et des coûts sans bénéfice global, un phénomène observable dans la gestion, l’algorithmique ou la stratégie.
  • Les projets d’automatisation ou d’IA ne produisent de gains réels que s’ils s’inscrivent dans une démarche systémique, sinon, ils amplifient les inefficiences en créant du surplus inutile au lieu d’améliorer le flux global.

La « loi du maximum local »

Si la théorie des contraintes est une discipline à part entière la doctrine managériale, cette dernière n’a jamais formalisé de manière spécifique une quelconque loi de Goldratt sur les goulots d’étranglement ou l’opposition entre performance globale et locale ni de loi du maximum global et je vais donc le faire par moi même : atteindre un maximum à un endroit de d’un chaîne n’améliore pas nécessairement l’optimum global, et peut même accentuer les déséquilibres.

L’amélioration locale n’a de sens que si elle se propage tout au long de la chaîne sans rupture. Autrement, elle ne génère qu’un surplus qui s’accumule sous forme de stocks, de tâches en attente ou de délais supplémentaires, sans pour autant apporter quoi que ce soit à l’entreprise en termes de productivité et donc sans bénéficier à l’entreprise et à ses clients qu’ils soient internes ou externes.

Parler de maximum local ou d’optimum global ne revient pas à jouer sur les mots : c’est mettre en lumière deux logiques radicalement différentes: une qui améliore les choses en apparence et l’autre impacte réellement la performance.

Le système, toujours le système

Vous connaissez mon goût pour la pensée systémique et mon aversion pour toute initiative qui ne s’intéresse qu’aux symptômes et pas aux cause ainsi que pour celles qui oublient que la limite de la performance ne réside pas au niveau d’un contributeur local mais du système dans son ensemble (The Problem Isn’t the Employee, It’s the System et « Vous ne vous élevez pas au niveau de vos objectifs. Vous retombez au niveau de vos systèmes ». (James Clear))

Plutôt que de chercher à optimiser toutes les composantes d’un système, Goldratt propose de concentrer l’attention sur le goulot qui fixe le rythme global. Ce choix repose sur une observation simple : les ressources non contraintes peuvent toujours être ajustées, tandis que la ressource contrainte détermine la capacité effective du système.

Une erreur de gestion fréquente consiste à exiger de chaque ressource, machine ou individu, qu’elle fonctionne en permanence à son maximum. Une intention qui paraît rationnelle et qui, d’ailleurs, m’a longtemps semblé une évidence : plus une ressource est utilisée, plus elle contribue mais, en réalité, cela produit souvent l’effet inverse.

Dans une usine, une machine qui tourne sans interruption alors que l’aval n’est pas en capacité de suivre ne fait qu’accumuler des stocks intermédiaires, des stocks qui génèrent des coûts financiers, logistiques et organisationnels, sans jamais accélérer la livraison au client, augmenter les revenus ou les marges. Dans une entreprise de services, la logique est la même : saturer la charge de travail d’un salarié crée des files d’attente et des retards de validation, qui finissent par ralentir l’ensemble du travail du collectif.

Autrement dit, la pleine utilisation d’une ressource non contrainte n’améliore jamais l’optimum global. Elle aggrave même les inefficacités en produisant du surplus, de la variabilité et des coûts additionnels. C’est pourquoi la théorie des contraintes ne vise pas l’occupation maximale de chaque ressource, mais l’amélioration du flux global en agissant sur la véritable contrainte.

A l’époque où j’ai lu Le But pour la première fois j’avais été marqué par la métaphore utilisée pour illustrer cette idée : celle d’une randonnée de groupe. En effet, la vitesse du groupe n’est pas fixée par celui qui marche le plus vite, mais par celui qui avance le plus lentement et tant que ce dernier n’accélère pas, le groupe progresse à son rythme. Chercher à faire marcher les plus rapides encore plus vite ne sert à rien, sinon à créer un écart croissant entre les deux bouts de la file et ne fera pas arriver l’intégralité du groupe plus vite vu que ceux qui marchent derrière le plus lent ne peuvent le doubler, comme dans un flux de travail. A la fin les plus lents n’arriveront pas plus vite alors que les plus rapides les attendront en étant à l’arrêt, désoeuvrés.

Ceci résume parfaitement la logique du goulot : seule la contrainte détermine la performance globale.

Des chaînes industrielles aux flux immatériels

A l’origine, la réflexion de Goldratt s’inscrivait dans un contexte industriel : machines, ateliers, lignes de production. Dans cet univers, les goulots d’étranglement sont visibles, mesurables et tangibles : une machine tombe en panne, une cadence ralentit, un stock s’accumule et l’optimum global dépend directement de la capacité du poste le plus fragile.

Mais dans le travail du savoir, la logique est identique, même si les flux sont immatériels et donc plus difficiles à percevoir. Ici, les goulots ne sont pas des machines, mais des individus, des comités, des process. Un rapport qui attend d’être validé, un manager saturé de réunions, une procédure interminable de conformité : chacun de ces blocages joue exactement le rôle d’un goulot industriel (Ca n’est pas parce que le travail est invisible qu’on ne peut l’améliorer). Goldratt a d’ailleurs écrit plus tard sur le cas spécifique de la gestion de projets mais on en parlera une autre fois.

Quoi qu’il en soit, l’illusion de productivité est encore plus forte dans ce secteur, car les activités immatérielles ne laissent pas de traces visibles. Un salarié peut remplir ses journées, produire toujours plus de documents ou de données, sans que rien n’avance réellement (Quelques idées pour être sûr d’être plus productif qu’occupé et Créer des documents, est-ce vraiment travailler ?). Le surplus se traduit en surcharge cognitive, en empilement de tâches « non terminées « à faire » et en délais qui s’allongent lentement mais surement (Infobésité Numérique : Quand les Outils de Collaboration Dégradent Productivité, QVT et Amplifient la Charge Mentale). Tout comme une machine qui accumule les encours sans accélérer le flux, un travailleur du savoir peut donner l’impression d’être intensément productif alors qu’il ne fait qu’alimenter un goulot invisible.

La collaboration introduit d’ailleurs une dimension supplémentaire. Le goulot n’est pas toujours un individu isolé mais la manière dont les équipes travaillent ensemble. Une validation qui passe par une chaîne interminable de responsables, une réunion qui retarde une décision, ou des outils numérique qui multiplie les versions d’un même document et les doubles ou triples saisies sont autant de contraintes invisibles. Et je ne parle même pas des mauvais usages d’outils collaboratifs supposés nous rendre plus efficaces mais ne font que saturer nos capacités (L’interview fictive d’Eliyahu Goldratt sur l’infobésité et les goulots d’étranglement dans le travail du savoir). Chacun peut donner l’impression d’être productif dans son périmètre, mais l’ensemble s’enlise. Dans ce cas, l’illusion de performance individuelle masque une inefficacité collective : le flux global se dégrade non par manque d’effort, mais par défaut de synchronisation ou de coordination.

Ainsi, ce que Goldratt observait sur une ligne de production se transpose parfaitement dans l’économie de la connaissance. Le goulot est simplement moins visible, mais ses effets sur la performance globale restent identiques : toute organisation est limitée par le maillon humain ou décisionnel le plus saturé.

Dit autrement : quand le travail impose des liens de dépendance/interdépendance entre des personnes ou des services, la productivité de l’ensemble est égale à la productivité du moins productif. Le temps perdu par les autres n’a aucun impact tant qu’ils restent moins productifs que le moins productif par contre le temps perdu par le moins productif est perdu pour l’ensemble et cela de manière irreversible. Rien ne permettra jamais de le récupérer.

En poussant la logique au bout cela veut également dire qu’au lieu de « tirer » au maximum sur une personne « non goulot » vous pouvez, en fonction du nombre de taches en retard sur la ressource goulot, leur dire d’aller prendre un café ou prendre des vacances car les faire travailler ne vous apporte absolument rien. Cela questionne d’ailleurs certaines approches de la productivité en entreprise : augmenter le ratio quantité produite/cout horaire peut ne jamais se traduire dans les comptes de l’entreprise, et pour cause.

Des résonances dans d’autres disciplines

Cette distinction entre maximum local et optimum global se retrouve bien au-delà du management industriel.

En algorithmique, les chercheurs distinguent les approches dites gloutonnes (greedy), qui choisissent à chaque étape l’option la plus avantageuse localement (Algorithme glouton). Ce rationnel en apparence est en fait hautement inefficace : un algorithme glouton peut s’enfermer dans une réflexion partielle qui empêche de voir des solutions bien meilleures à l’échelle globale. L’exemple classique est celui du voyageur de commerce qui s’est rappelé récemment à mon bon souvenir dans le cadre d’une certification IA pour comprendre la différence entre l’analyse combinatoire et les modèles probabilistes : choisir la ville la plus proche à chaque étape aboutit à un parcours qui multiplie les détours et coûte finalement plus cher (Problème du voyageur de commerce). C’est comme un randonneur qui ne regarde qu’à dix mètres devant lui : chaque bifurcation paraît optimale sur le moment, mais l’ensemble du trajet devient incohérent.

En gestion des organisations, la logique des silos illustre la même dynamique. La finance cherche à réduire ses coûts, la production à accélérer ses délais, les ressources humaines à maximiser la satisfaction interne. Chacun atteint son objectif propre, mais ces stratégies peuvent se contredire et s’annuler : des réductions de coûts peuvent freiner l’innovation, des gains de vitesse peuvent dégrader la qualité, et la multiplication de projets internes peut désorganiser la production. Le résultat global se dégrade, comme dans un orchestre où chaque musicien jouerait plus fort pour « mieux faire entendre son instrument » : chacun tire le meilleur de son instrument, mais l’ensemble devient cacophonique.

En stratégie, Herbert Simon a montré que la rationalité des décideurs est limitée par les informations dont ils disposent (Rationalité limitée). Face à la complexité, ils se contentent d’une solution jugée « suffisante » dans leur périmètre immédiat, ce qu’il appelait le satisficing. Mais cette solution « assez bonne » à l’échelle locale enferme l’organisation dans logique sub-optimale. L’exemple type est celui des entreprises qui privilégient des gains rapides dans une division pour satisfaire des objectifs trimestriels, au détriment d’investissements lourds qui auraient amélioré la performance globale à long terme. C’est l’équivalent d’un joueur d’échecs qui saisit la première pièce qu’il peut prendre : le coup paraît satisfaisant immédiatement, mais il compromet la partie entière.

Piqûre de rappel à l’heure de l’IA

Il est fort utile d’avoir ces notions en tête à l’heure où les entreprises multiplient les projets d’IA sans voir la promesse de gains de productivité se concrétiser (MIT report: 95% of generative AI pilots at companies are failing). Les technologies d’automatisation et l’intelligence artificielle permettent des gains spectaculaires sur des tâches spécifiques : générer un texte, produire du code, analyser des données mais ces gains, pris isolément, ne disent rien de la performance globale de l’organisation (IA en entreprise : aller au delà de l’augmentation pour enfin transformer).

Si des goulots persistent ailleurs (validation, intégration, adoption par les utilisateurs) l’optimum global ne progresse pas et, dans certains cas, il régresse même : la surproduction locale génère une accumulation d’informations ou de livrables qui ralentit la prise de décision.

L’illusion de productivité devient alors un facteur d’inefficacité et un générateur de coûts additionnels, financiers et cognitifs.

Conclusion

Ce que Goldratt a formulé dans un contexte industriel est toujours on ne peut plus pertinent aujourd’hui. En effet, qu’il s’agisse d’une chaîne de production, d’une organisation en silos, d’un processus immatériel ou d’une entreprise qui déploie l’intelligence artificielle, la logique reste identique : la performance se joue toujours au niveau du goulot. L’obsession d’optimiser chaque ressource, chaque tâche ou chaque service ne fait que multiplier des maxima locaux sans valeur pour le client final et donc pour l’entreprise.

La véritable rationalité consiste à accepter que le progrès n’est jamais uniforme, mais séquentiel : comme le suggère Goldratt il s’agit d’identifier la contrainte, la traiter, puis recommencer car à ce moment apparaitra la contrainte suivante dans le flux de travail. C’est ce chemin qui quoique long et répétitif permet d’atteindre l’optimum global. La loi du maximum local nous rappelle qu’en matière de performance, l’illusion est facile, mais que seule une approche systémique évite de prendre des coûts pour des gains.

Pour répondre à vos questions

Qu’est-ce que la théorie des contraintes de Goldratt et en quoi se distingue-t-elle des approches classiques d’optimisation ?

La théorie des contraintes repose sur une idée clé : la performance d’un système est toujours limitée par son goulot d’étranglement. Plutôt que d’optimiser toutes les ressources, elle recommande de se concentrer sur la contrainte principale, car elle fixe le rythme global. Une fois ce point traité, une nouvelle contrainte apparaît et le cycle recommence. Contrairement aux approches classiques centrées sur chaque maillon, cette logique vise l’optimum global et non des gains locaux trompeurs.

Pourquoi l’optimisation locale peut-elle nuire à la performance globale d’une organisation ?

Améliorer une ressource isolée sans tenir compte du flux global produit souvent des effets pervers. Dans l’industrie, cela crée des stocks coûteux. Dans les services, cela engendre retards et files d’attente. Chaque ressource semble performante, mais l’ensemble n’avance pas plus vite. Ces « maxima locaux » donnent une illusion de productivité sans valeur pour le client final. Seule une vision systémique assure des gains réels.

Comment la logique du goulot s’applique-t-elle au travail immatériel et aux métiers de la connaissance ?

Dans le travail du savoir, les goulots ne sont pas matériels mais organisationnels et cognitifs : validation interminable, manager saturé, procédure complexe. Ces blocages invisibles ralentissent le flux global, même si chaque individu paraît occupé. Résultat : surcharge cognitive, tâches en attente et délais qui s’allongent. Identifier et alléger ces contraintes est essentiel pour améliorer la productivité collective, bien plus que d’exiger une activité maximale de chacun.

Pourquoi peut-il être pertinent de ne pas utiliser une ressource à 100 % de sa capacité ?

Lorsqu’une ressource n’est pas le goulot, la faire produire davantage ne sert à rien si la contrainte ne suit pas. Au contraire, cela génère du surplus inutile, des retards en aval et des coûts cachés. Il peut même être plus rationnel de ralentir, voire de donner du temps libre à la ressource non contrainte, plutôt que d’entretenir une illusion de productivité. La performance vient du flux global, pas de l’occupation permanente de chaque individu.

Quels parallèles peut-on faire entre la loi du maximum local et d’autres disciplines comme l’algorithmique ou la stratégie ?

L’idée se retrouve ailleurs : en algorithmique, les méthodes « gloutonnes » privilégient des choix immédiats mais mènent à des solutions globalement inefficaces. En stratégie, des gains rapides dans une division peuvent nuire à l’ensemble de l’entreprise. Dans les organisations en silos, chaque service optimise ses propres objectifs, au détriment du collectif. Dans tous ces cas, le local semble efficace mais le global en pâtit.

En quoi la théorie des contraintes éclaire-t-elle les limites actuelles des projets d’intelligence artificielle en entreprise ?

L’IA permet des gains spectaculaires sur des tâches précises, mais ces progrès isolés ne garantissent pas une meilleure performance globale. Si des goulots subsistent ailleurs – adoption, validation, intégration – l’organisation ralentit malgré la technologie. L’excès de livrables ou d’informations peut même créer de nouveaux blocages. La théorie des contraintes rappelle donc que l’IA ne transforme réellement une entreprise que si elle s’inscrit dans un flux optimisé.

Crédit visuel : Image générée par intelligence artificielle via ChatGPT (OpenAI)

Bertrand DUPERRIN
Bertrand DUPERRINhttps://www.duperrin.com
Directeur People & Operations / Ex Directeur Consulting / Au croisement de l'humain, de la technologie et du business / Conférencier / Voyageur compulsif.
You don’t speak french ? No matter ! The english version of this blog is one click away.
1,743FansJ'aime
11,559SuiveursSuivre
27AbonnésS'abonner

Récent