Chapitre 1 : Problématique

Comment l’humain résout-il des problèmes ? Avant de chercher à répondre à une aussi délicate question, nous pouvons nous interroger sur la manière dont chacun d’entre nous résout des problèmes. Il est possible d’enseigner la manière d’aborder les problèmes d’un domaine donné, en communiquant à son interlocuteur les différentes étapes de la résolution et en lui montrant par quels outils réaliser chacune de ces étapes. Il semblerait donc que l’homme dispose d’une certaine connaissance des mécanismes de résolution qu’il met en œuvre.

Cependant, nous nous montrons incapable de reproduire ce comportement sur des machines. On ne programme pas une machine comme l’on parle à un individu. Il est certes possible de programmer la résolution d’un problème (ou d’une classe de problème) particulier, mais cela demande un effort important d’analyse de la tâche à résoudre, et le résultat de ce travail ne peut en général pas être réutilisé pour d’autres problèmes. Les langages de programmation ont connu une évolution permanente leur permettant d’atteindre un niveau d’abstraction toujours plus élevé. Pourtant cette évolution ne permet toujours pas d’indiquer de manière naturelle à un ordinateur comment résoudre un problème.

Un domaine de recherche s’est indirectement intéressé à la résolution de problème. Il s’agit de l’Enseignement Intelligemment Assisté par Ordinateur. Le paradigme de ce domaine était qu’une modélisation correcte de l’apprenant permettrait de comprendre quelles étaient les causes des problèmes rencontrés au cours d’une résolution, et donc de remédier à ces causes.

1.1 Quelques questions difficiles en EIAO

Un système d’EIAO est classiquement découpé en quatre modèles [WEN 87] (p. 14, p. 24) :

· Le modèle du domaine, qui contient les connaissances nécessaires pour résoudre les problèmes.

· Le modèle du tuteur (ou modèle pédagogique) qui contient les connaissances nécessaires à la modélisation

· Le modèle de l’interaction, qui contient les connaissances nécessaires pour mener à bien l’interaction entre l’apprenant et le système

· Le modèle de l’élève, qui contient les connaissances censées expliquer le comportement de l’apprenant.

Un certain nombre de modélisations ont été proposées pour représenter les connaissances de l’élève (modèle des misconceptions, modèle par overlay, modèle de mind-bugs…). Aucune ne réussit pourtant à emporter l’adhésion de la communauté EIAO, au point que l’idée de modèle de l’élève finit par être remise en cause : si pour certains, le modèle de l’élève peut représenter la structuration interne des connaissances d’un sujet donné, pour d’autres, un tel modèle «a plutôt une valeur explicative à l’intérieur d’une théorie» [BAL 94] (p. 23).

Pour résumer le sentiment de la communauté, on peut considérer que chercher à découvrir quelles étaient les causes des erreurs d’un apprenant aurait sans doute permis de remédier à ces causes, mais que la tâche se révéla trop difficile pour être menée à bien.

1.1.1 La contrainte de pertinence

La première difficulté rencontrée est de présenter chaque information au moment opportun. La présentation encyclopédique d’un domaine est certes possible, mais n’apporte rien de plus à l’apprenant qu’un volume encyclopédique classique consacré au domaine considéré. Des systèmes auteurs, permettant de développer des présentations multimédias, ont vu le jour. Ces présentations peuvent éventuellement remplacer un livre de cours, mais la nature de l’aide apportée n’est pas différente dans l’un ou l’autre cas[1].

Des applications d’aide à l’apprentissage en situation de résolution de problème ont alors été développées. Le principe d’une telle application est de surveiller l’apprenant au cours de la résolution, et d’intervenir au moment opportun en délivrant un message approprié. Ce principe pose deux problèmes. Le premier est de réussir à déterminer quand l’intervention doit avoir lieu. Le second est de déterminer quelle doit être l’intervention du système, tant dans la forme que dans le fond.

1.1.1.1 Argumenter au bon moment

Le choix du moment de l’intervention du système joue un rôle capital dans la réussite ou l’échec de l’émission d’une critique. Si le système intervient trop tôt, il ne laisse pas à l’apprenant le temps d’explorer le problème et de découvrir par lui-même une partie des règles du domaine étudié. Le risque est alors grand de voir l’apprenant développer une stratégie passive, consistant à essayer la première idée venue en attendant la correction du tuteur. Si le système intervient trop tard, en revanche, l’apprenant ne voit plus ce qu’il lui apporte. Il se retrouve bloqué, et le système critique qui est censé l’aider reste alors silencieux. Le risque est ici de voir l’apprenant abandonner le système.

Mais en dehors de cette question de rythme des interventions se pose un problème plus important. Le véritable enjeu est de déterminer à quel moment la critique émise sera la mieux comprise par l’apprenant. Si le problème que soulève le système critique n’est pas le sujet de préoccupation actuel de l’apprenant, ce dernier aura du mal à le comprendre, puisqu’il devra momentanément oublier les réflexions qu’il était en train de mener afin de prendre en compte la problématique du système. L’objectif du système critique doit être l’inverse de cette situation : la critique doit être émise quant elle répond à la question que se pose l’apprenant. En d’autres termes, le système critique se doit, pour être efficace, d’être pertinent.

1.1.1.2 Génération d’arguments pertinents

Sans prétendre être exhaustif, nous considérons que la critique émise sera pertinente si :

· Le système indique à l’apprenant un sous-objectif lui permettant d’atteindre son objectif courant. Si l’on désire apporter une aide moins directe, on peut utiliser un dialogue Socratique dont l’objectif est de faire réaliser à l’apprenant quelles sont les conditions prérequises pour la réalisation de l’objectif courant.

· Le système indique à l’apprenant une action ou le début d’une suite d’action permettant à l’apprenant d’atteindre son objectif courant.

· Le système signale à l’apprenant une erreur, qu’il s’agisse d’une simple erreur de calcul ou d’une erreur plus grave comme une violation de contrainte.

On se rend donc compte que pour pouvoir être pertinent, le système se doit, dans une certaine mesure, d’être capable de comprendre les actions de l’apprenant.

1.1.2 Comprendre l’apprenant

On peut considérer qu’il existe deux manières de comprendre l’apprenant. La première consiste à vouloir comprendre dans le détail les représentations qu’a celui-ci du problème qu’il cherche à résoudre et, plus généralement, du domaine sur lequel il travaille. L’idée est ici de découvrir les erreurs et omissions dans la connaissance de l’apprenant, afin de pouvoir les corriger de manière active. La seconde se contente de chercher à comprendre ce que l’apprenant est en train de faire, en identifiant l’objectif ou le sous-objectif qu’il cherche à résoudre. On considère dans ce cas que le fait d’aider l’apprenant à résoudre le problème sera suffisant pour le faire progresser. Précisons qu’il ne s’agit pas ici de se contenter d’indiquer les erreurs, mais plutôt de pointer les problèmes qu’elles génèrent et de remonter par le biais d’une discussion Socratique vers les erreurs en question.

On pourrait penser que la distinction qui est faite ici n’est pas fondée, puisque dans les deux cas, on cherche à remonter du problème de surface vers la cause de ce problème. Mais dans le premier cas, ce travail est effectué avant la critique, alors que dans le second, il est effectué par la critique, dans l’interaction avec l’élève. En outre, dans le second cas, le système ne cherche pas à se représenter ce que croit l’apprenant. Il se contente de pointer un problème de surface et de le discuter avec l’apprenant jusqu’à ce que ce problème de surface disparaisse. Dans cette vision des choses, on ne maintient pas un modèle de l’élève mais plutôt un modèle de la résolution, et on se contente de discuter la résolution de l’apprenant sur la base de ce modèle.

Afin de réaliser cette reconnaissance, il suffit de pouvoir déterminer quels sont les objectifs de l’apprenant. Mais comme les seules informations dont on dispose sont les actions de celui-ci, il devient nécessaire d’être capable de les interpréter. La reconnaissance consiste alors à remonter de l’action à l’objectif l’ayant entraîné.

1.1.2.1 La reconnaissance des actions de l’apprenant

Reconnaître le pourquoi d’une action élémentaire est une tâche difficile. Hormis quelques cas simples (l’action effectuée permet de résoudre complètement le problème), de multiples raisons peuvent être invoquées. Il est même possible que l’action effectuée ne soit pas motivée par un but particulier. En effet, l’apprenant peut vouloir simplement explorer le problème, en effectuant les actions qui lui apparaissent légales dans la situation, et sans avoir d’attente particulière quant au résultat de ses actions. De fait, il se peut même qu’il effectue une action nécessaire pour la résolution sans avoir conscience de cette nécessité.

Cependant, si l’apprenant est effectivement en train d’explorer le problème, il n’est pas nécessaire d’émettre une critique. On ne cherchera donc pas à reconnaître les objectifs de l’apprenant à partir d’un nombre de coups trop faible. La reconnaissance des objectifs de l’apprenant doit être envisagée à partir d’une quantité de données suffisantes.

1.1.2.2 La reconnaissance des objectifs de l’apprenant

Une première détection peut être effectuée simplement. Si l’apprenant se trouve en situation de blocage, c’est qu’il n’est pas capable de résoudre le problème qui lui est posé. On peut supposer qu’il n’a pas réussi à calculer un sous-objectif à sa portée. Dans ce cas, le système l’aidera à en calculer un.

Comment détecter que l’apprenant est en situation de blocage ? Plusieurs indices permettent de retenir cette hypothèse, citons à titre d’exemple :

· L’apprenant effectue peu d’actions, et ces actions sont espacées dans le temps. Il défait éventuellement ce qu’il vient juste de faire.

· L’apprenant «tourne en rond». Il effectue des suites d’actions qui le ramènent à l’état initial du problème.

· L’apprenant effectue des suites d’actions qui n’apportent rien à la résolution du problème. Dans ce cas, l’apprenant est sans doute en train d’explorer le problème. Il n’est pas nécessairement indispensable d’intervenir à ce stade. Si l’apprenant cesse alors son exploration (en n’essayant plus rien), on peut considérer qu’il est en situation de blocage.

Une fois la situation de blocage détectée, le système va aider l’apprenant à calculer un sous-objectif. Cela nécessite que le système soit lui-même capable de calculer un tel sous-objectif.

Si le système est capable de tels calculs, on peut utiliser cette fonctionnalité dans la reconnaissance des objectifs de l’apprenant en dehors des situations de blocage. En effet, si les actions de l’apprenant l’amènent à résoudre un des sous-objectifs calculables par le système, on peut supposer que ce sous-objectif était poursuivi par l’apprenant. Dans ces conditions, on peut considérer que la planification où intervient ce sous-objectif est celle retenue par l’apprenant. On en déduit les sous-objectifs que va se fixer l’apprenant dans la suite de sa résolution.

Cela suppose cependant que l’apprenant effectue une planification complète de sa résolution. Ce fait peut apparaître comme évident, mais nous allons remettre en cause cette évidence. Afin de savoir si la stratégie que nous venons de présenter peut-être efficace, nous allons donc chercher à déterminer comment les humains résolvent des problèmes.

Répondre à cette question nous permettra peut-être même de supprimer la nécessité de la compréhension des motivations de l’apprenant en situation de résolution de problème. En effet, nous pourrons alors développer des applications qui ne soient plus des systèmes tuteurs mais des systèmes pairs. Le critique se comporte alors comme un bon élève qui résout le même problème que l’apprenant et qui discute les divergences qui surviennent entre les deux résolutions.

1.2 La résolution de problèmes

La question qui nous intéresse ici n’est pas de savoir comment résoudre un problème donné de manière efficace, mais plutôt de savoir comment s’y prennent les humains. Nous nous intéresserons plus particulièrement aux sujets débutants, puisque nous espérons appliquer les résultats de notre recherche au développement de systèmes d’aide à l’apprentissage.

1.2.1 Résolutions envisageables

Il existe a priori deux manières de résoudre un problème. La première consiste à partir des données disponibles afin de se rapprocher de la solution. La seconde consiste à partir de la solution que l’on cherche à atteindre et à découper le problème en sous-problèmes, puis à recommencer cette résolution en considérant chaque sous-problème comme un problème indépendant.

1.2.1.1 Résolution ascendante

La résolution ascendante consiste à essayer de résoudre le problème en modifiant la situation courante afin de se rapprocher de la solution. Les systèmes experts en chaînage avant constituent des exemples de résolution ascendante. De tels systèmes effectuent toutes les déductions possibles à partir des données fournies et des données qu’ils ont précédemment calculées. Si la réponse à la question qui leur est posée est accessible à partir des données initiales, on a l’assurance que ces systèmes sauront la calculer. Du point de vue de la résolution de problème, cela revient à examiner la totalité de l’arbre de recherche du problème visé.

Contrairement à un système expert, un humain n’est pas capable d’effectuer une recherche exhaustive sur un arbre de taille conséquente. Si on admet l’hypothèse que les humains effectuent des résolutions ascendantes, il faut admettre que les sujets seront amenés à choisir des branches particulières dans l’arbre de résolution. Dans cette hypothèse, il faut donc expliquer comment les sujets, et notamment les sujets novices, effectuent de tels choix.

1.2.1.2 Résolution descendante

La résolution descendante consiste à découper le problème que l’on cherche à résoudre en sous-problèmes, et de réitérer cette opération sur les sous-problèmes ainsi obtenus, jusqu’à ce que la résolution de chacun des sous-problèmes puisse s’effectuer par une action élémentaire. On notera que cette méthode de résolution est différente d’une résolution ascendante où l’on prendrait l’état solution comme état initial et réciproquement : cette manière de résoudre serait une résolution ascendante, comme l’illustre le problème de la tour de Hanoï puisqu’à un renommage des pitons près, le problème est identique que l’on parte de l’état initial ou de l’état final. Une résolution ascendante est une résolution où on explore le voisinage de l’état courant en essayant de se rapprocher du but, alors qu’une résolution descendante part du but et cherche une hiérarchie de sous-buts telle que le sous-but de plus bas niveau soit accessible à partir de l’état courant. Les systèmes experts en chaînage arrière constituent des exemples de résolution descendante.

On peut éventuellement admettre l’hypothèse qu’un sujet expert peut résoudre un problème par une résolution descendante. Mais ce type de résolution est inaccessible à un novice, car demandant trop de connaissances sur le domaine pour quelqu’un qui en ignore à peu près tout. La résolution descendante ne peut donc, à elle seule, expliquer les résolutions humaines.

Il semblerait donc que la résolution ascendante soit l’unique candidat pour expliquer le comportement des novices. Toutefois, ce type de résolution ne permet pas d’expliquer un bon niveau de performance, dont les sujets novices sont pourtant capables, comme nous le verrons dans la suite de ce document.

Afin de sortir de ce paradoxe, nous allons maintenant envisager une résolution tirant bénéfice des deux types de résolution déjà envisagés.

1.2.1.3 Résolution mixte

L’analyse que nous venons de mener semble indiquer que la méthode de résolution naturelle pour un sujet novice est une résolution de type ascendant. Cependant, une résolution de ce type ne permettant pas d’obtenir les performances dont sont capables les sujets, nous allons envisager quels éléments permettent d’améliorer cette performance. Une première explication peut être l’utilisation d’heuristiques permettant de s’orienter pendant le parcours de l’arbre. Cette explication n’est cependant pas complètement satisfaisante. Certes, l’emploi d’heuristiques peut expliquer quels choix sont faits par le sujet au cours de la résolution. Cependant, ces heuristiques doivent être performantes si elles doivent expliquer à elles seules les bonnes performances des novices. Mais si les sujets sont novices, comment expliquer alors que les heuristiques soient déjà performantes ?

Une hypothèse alternative consiste à considérer que les sujets emploient simultanément les deux types de résolution, en effectuant des aller-retour entre eux. Il faut dans cette hypothèse expliquer comment s’effectuent ces deux types de résolution et ce que peut apporter la résolution ascendante à la résolution descendante.

1.2.2 Planification en situation d’exploration

La résolution descendante consiste à découper un problème en sous-problèmes. Il est bien sûr possible de pousser cette logique à l’extrême et de proposer comme résolution une résolution uniquement descendante. Cependant, un autre scénario est envisageable.

1.2.2.1 La résolution descendante comme outil de planification

La résolution descendante permet de découper un problème en sous-problèmes. Ces sous-problèmes sont par définition plus facile à résoudre que le problème dont ils rendent possible la résolution. Nous pouvons alors imaginer un aller-retour entre les deux résolutions que nous venons de présenter.

Dans un premier temps, le sujet cherche à résoudre le problème par une résolution ascendante. Si cette tâche apparaît comme trop difficile, il peut alors chercher un problème plus simple qu’il sera éventuellement capable de résoudre. Nous voyons donc se dessiner un modèle de résolution où alterneraient des phases d’exploration du problème et des phases de simplification du problème courant. La résolution descendante devient alors l’outil de planification de la résolution ascendante.

1.2.2.2 Apprentissage

Est-il possible d’expliquer par une unique modélisation le comportement des sujets novices et des sujets experts ? Si on émet l’hypothèse que le découpage en sous-problèmes effectué au cours d’une première résolution est mémorisé, on peut envisager que ce découpage est réutilisé au cours des résolutions suivantes. Un sujet expert n’aura alors plus à planifier sa résolution puisqu’il disposera déjà d’un plan de résolution.

En outre, si les successions d’actions fréquemment effectuées dans une situation donnée sont mémorisées, on peut également envisager une optimisation de la résolution ascendante. Le principe d’optimisation consiste à choisir dans une situation déjà rencontrée une suite d’actions qui a été couronnée de succès par le passé.

Les travaux que nous allons présenter maintenant ont eu pour objectif de répondre aux questions que nous venons d’introduire. Nous allons donc proposer un modèle du comportement des sujets humains en situation de résolution de problème, et nous nous efforcerons de voir quelles conséquences cette modélisation entraîne sur la construction de systèmes critiques.

1.2.3 La tour de Hanoï

Un des problèmes référence que nous avons utilisé au cours de notre travail est le problème de la tour de Hanoï. Nous présentons donc ici un rappel des règles de ce jeu, puis nous définissons les notations que nous utiliserons dans la suite de ce document.

Le lecteur pourrait s'interroger sur la pertinence du choix de ce problème pour mener une partie de notre expérimentation. La tour de Hanoï est en effet un des problèmes les plus étudiés dans la littérature, et qui semble en outre aujourd'hui passé de mode. C'est précisément parce que ce problème a été très étudié que nous l'avons choisi comme problème de référence. Cela nous a d'abord permis de disposer d'une large base de modèle auxquels nous avons pu comparer le nôtre. Compte tenu de l'originalité de notre modèle, il nous a paru important de pouvoir effectuer cette comparaison sur un problème bien étudié par les modèles classiques de la littérature. En outre, cette abondante littérature nous a fournit de nombreux protocoles de résolution, acquis et transcris sans prendre en compte notre modélisation, ce qui nous permettait d'éviter les risques de biais dans la collecte des données.

Par ailleurs, le fait que les études menées en utilisant la tour de Hanoï soient en quelque sorte passées de mode ne nous paraît pas un argument fort contre le choix de ce problème en tant qu'outil de validation. L'approche originale que nous défendons nous permet d'envisager ce problème sous un angle nouveau. L'idée que tout a déjà été dit sur ce problème nous paraît donc erronée.

Enfin, la simplicité des règles, la bonne connaissance de l'espace-problème et les relatives difficultés qu'éprouvent les sujets novices à le résoudre sont des points facilitant une première étude d'un modèle. En cela, nous avons suivit l'approche d'un grand nombre de modèles présentés dans la littérature.

Le problème de la tour de Hanoï à N disques consiste à déplacer une pile de N disques de tailles croissantes (numérotés de 1 à N) d’un piton initial vers un piton cible en s’aidant d’un piton intermédiaire. Trois contraintes constituent les règles du jeu. Il n’est possible de prendre que le plus petit disque placé sur un piton, il est interdit de placer un disque sur un piton contenant un disque de taille plus petite et il est interdit de déplacer plus d’un disque à la fois.

Le dispositif physique classique de la tour de Hanoï renforce ces règles, en présentant les disques empilés en ordre décroissant (le plus gros en bas). Si le sujet n’effectue aucun mouvement illicite, pour chaque piton, le seul disque que le sujet peut légalement prendre est le disque situé au sommet de la pile posée sur ce piton.

Dans toute la suite de ce chapitre, nous utiliserons la notation suivante pour représenter l’état du problème (présentée ici dans la situation initiale du problème, à savoir les 5 disques sur le piton initial) :

(1 2 3 4 5) () ()

La première liste représente le piton initial (noté A), la deuxième le piton intermédiaire (B) et la troisième le piton cible (C).

Retour au Plan

[1] Il est bien sûr possible d’intégrer à une présentation multimédia tous les systèmes d’aide que l’on désire, mais on sort alors de la présentation à proprement parler.