Qu'est-ce que le prompting chain-of-thought ?
Dans sa forme la plus simple, chain-of-thought (CoT) signifie demander au modèle de montrer son travail. Au lieu de « Quelle est la réponse ? », vous demandez « Raisonne étape par étape, puis donne la réponse. » Le modèle génère une séquence d'étapes intermédiaires, et la réponse finale en découle.
Il y a deux formes courantes. Le CoT zéro-shot ajoute une phrase déclencheur comme « Pensons étape par étape » sans exemples. Le CoT few-shot montre au modèle un ou plusieurs exemples travaillés qui incluent le raisonnement, puis lui demande de résoudre un nouveau problème de la même manière. L'article original Wei et al. 2022 a démontré la forme few-shot ; le déclencheur zéro-shot est venu peu après et est maintenant la norme quotidienne.
Le mécanisme est simple : générer des tokens intermédiaires donne au modèle plus de calcul à allouer au problème et force chaque conclusion à être conditionnée par une étape antérieure explicite. Les erreurs qui glissent dans une réponse unique surgissent souvent — et se corrigent — quand le raisonnement est détaillé.