ÉVALUATION COMPORTEMENTALE
Au cours des dernières décennies, l’évaluation comportementale a été l’un des développements les plus passionnants à émerger dans le domaine de l’évaluation psychologique (Bellack & Hersen, 1988, 1998). Bien que ses graines aient été plantées bien avant que la thérapie comportementale ne devienne un mouvement thérapeutique populaire, c’est avec l’avènement de la thérapie comportementale que les stratégies d’évaluation comportementale ont commencé à fleurir (cf. Hersen & Bellack, 1976, 1981). Comme cela a été noté ailleurs (Barlow & Hersen, 1984; Hersen & Barlow, 1976a, 1976b), l’évaluation comportementale peut être conceptualisée comme un réaction à un certain nombre de facteurs. Parmi ceux-ci figuraient (a) des problèmes de manque de fiabilité et d’invalidité des aspects des schémas de diagnostic DSM-I et DSM-II, (b) des préoccupations concernant la relation indirecte entre ce qui a été évalué dans les tests traditionnels (par exemple, les projectifs) et la manière dont il a été utilisé dans la planification et l’application du traitement, (c) l’acceptation croissante de la thérapie comportementale par la communauté professionnelle comme une série viable de modalités thérapeutiques, et (d) des développements parallèles dans le domaine du diagnostic en général, impliquant une plus grande précision et une plus grande responsabilité (par exemple, le dossier axé sur le problème).
Nous examinerons brièvement chacun des quatre facteurs tour à tour et verrons comment ils ont contribué historiquement au développement de l’évaluation comportementale. Pour commencer, le DSM-I et le DSM-II ont été la cible de nombreuses critiques de la part des psychiatres (Hines & Williams, 1975) et des psychologues (Begelman, 1975). En effet, Begelman (1975), dans une veine plus humoristique, a qualifié les deux systèmes de «contes à deux reprises». Ils ont été « deux fois informés » dans le sens que ni l’un ni l’autre n’a abouti à des systèmes de classification très fiables lorsque les patients ont été évalués indépendamment par des enquêteurs psychiatriques distincts (cf. Ash, 1949; Sandifer, Pettus, & Quade , 1964). Les problèmes étaient particulièrement évidents lorsque des tentatives visant à obtenir une fiabilité inter-évaluateurs étaient faites pour les groupes diagnostiques plus mineurs des schémas DSM. Fréquemment, les psychologues cliniciens étaient consultés pour effectuer leurs procédures de test afin de confirmer ou d’infirmer les impressions diagnostiques des psychiatres sur la base du DSM-I et du DSM-II. Mais ce faisant, ces psychologues, opérant essentiellement comme des techniciens en radiologie, utilisaient des procédures (tests objectifs et projectifs) qui n’avaient qu’une relation tangentielle avec les descripteurs psychiatriques pour chacun des groupes nosologiques d’intérêt. Ainsi, avec le temps, la futilité de ce type de stratégie d’évaluation est devenue de plus en plus apparente. De plus, non seulement il y avait des problèmes de fiabilité pour DSM-I et DSM-II, mais des études empiriques ont également documenté des problèmes considérables en ce qui concerne la validité externe des systèmes (Eisler & Polak , 1971: Nathan, Zare, Simpson, & Ardberg, 1969).
Probablement plus important que tout ce qui précède était le fait que l’évaluation psychologique compliquée avait une relation limitée avec un traitement éventuel. Au moins dans l’arène psychiatrique, la relation isomorphique habituelle entre l’évaluation et le traitement trouvée dans d’autres branches de la thérapeutique ne semble pas tenir. L’examen psychologique isolé et prolongé s’est souvent avéré être un exercice académique vide, ce qui a abouti à un jargon poétique dans le rapport qui a abouti. Son utilité pratique était malheureusement limitée. Le traitement ne semblait pas lié aux résultats des rapports.
Tout ce qui précède a abouti à des tentatives de psychologues cliniciens pour mesurer les comportements d’intérêt de façon directe. Par exemple, si un patient présentait une phobie particulière, l’objectif de l’évaluation n’était pas d’évaluer le «complexe névrotique» sous-jacent ou la «psychodynamique présumée». Bien au contraire, l’objectif principal était de quantifier à distance à quelle distance notre patient pouvait s’approcher de l’objet phobique (c’est-à-dire la tâche d’approche comportementale) et comment sa fréquence cardiaque (évaluation physiologique) augmentait à mesure qu’il se rapprochait. De plus, les cognitions du patient (auto-évaluation) ont été quantifiées en lui faisant évaluer son niveau de peur (par exemple, sur une échelle de 1 à 10 points). Ainsi, la triade de l’évaluation comportementale, constituée de systèmes moteurs, physiologiques et d’auto-évaluation (Hersen, 1973), a été établie comme alternative à la mesure indirecte.
Commentant l’utilisation de la mesure directe, Hersen et Barlow (1976) soutient que
alors que dans la mesure indirecte, une réponse particulière est interprétée en termes d’une disposition sous-jacente présumée, une réponse obtenue par la mesure est simplement considérée comme un échantillon d’une grande population de réponses similaires suscitées dans ces conditions de stimulation particulières….Ainsi, il n’est guère surprenant que les partisans de la mesure directe privilégient l’observation des individus dans leur milieu naturel chaque fois que cela est possible. Lorsque de telles observations naturalistes ne sont pas réalisables, des situations analogues s’approchant des conditions naturalistes peuvent être développées pour étudier le comportement en question (par exemple, l’utilisation d’un test d’évitement comportemental pour étudier le degré de peur des serpents). Lorsqu’aucune de ces deux méthodes n’est disponible ou possible, les auto-évaluations des sujets sont également utilisées comme critères indépendants et, parfois, peuvent fonctionner sous le contrôle d’ensembles de contingences totalement différents de ceux régissant les réponses motrices, (p. 116 )
Nous avons déjà évoqué le système tripartite de mesure directe privilégié par les comportementalistes. Mais c’est dans le domaine du comportement moteur que les thérapeutes comportementaux ont apporté les plus grandes contributions en plus d’être les plus innovants (voir Foster, Bell-Dolan, & Burge, 1988; Hersen, 1988 ; Tryon, 1986). Avec une acceptation accrue de la thérapie comportementale, les praticiens des stratégies ont trouvé leurs services nécessaires dans une grande variété de milieux éducatifs, de réadaptation, de médecine communautaire et de psychiatrie. Très souvent, on leur a présenté des cas d’éducation, de réadaptation et de traitement extrêmement difficiles, tant du point de vue de l’évaluation que du point de vue thérapeutique. De nombreux clients et patients nécessitant des remédiations ont présenté des comportements qui auparavant n’avaient pas été mesurés directement. Ainsi, il y avait peu de directives sur la façon dont le comportement pouvait être observé, quantifié et codé. Dans de nombreux cas, les systèmes de mesure du «siège du pantalon» ont été conçus sur place, mais sans se soucier des qualités psychométriques chères aux testeurs traditionnels.
Prenons l’exemple suivant d’une stratégie de mesure pour quantifier le «torticolis spasmodique», un trouble de type tic (Bernhardt, Hersen, & Barlow, 1972):
Un enregistreur vidéo Sony modèle AV-5000A, une caméra de télévision MRI Keleket modèle VC-1 et un écran de télévision Conrac de 14 pouces ont été utilisés pour enregistrer le torticolis. Une minuterie universelle de 60 minutes de Gra Lab a été utilisée pour obtenir le pourcentage de torticolis…. Une lampe plus légère a servi de source de rétroaction négative. Deux à trois sessions quotidiennes de dix minutes ont été programmées pendant l’expérience dans laquelle le sujet a été filmé alors qu’il était assis dans un arrangement de profil. Un morceau de plastique transparent contenant des lignes horizontales scellées Chart-Pac superposées (espacées d’un quart à un demi-pouce) a été placé sur le moniteur. Un observateur blindé a enfoncé un interrupteur activant la minuterie chaque fois que la tête du sujet était positionnée à un angle où la narine était au-dessus d’une ligne horizontale coupant le conduit auditif externe. Cette position a été définie sur le plan opérationnel comme un exemple de torticolis, le pourcentage de torticolis par session servant de mesure expérimentale. Inversement, lorsque la ligne horizontale croisait à la fois la narine et le méat auditif ou lorsque la narine du sujet était sous la ligne horizontale, il était considéré comme tenant sa tête dans une position normale, (p. 295)
Si l’on parcourt les pages du Journal of Applied Behavior Analysis, Behavior Research and Therapy, Journal of Behavior Therapy and Experimental Psychiatry, et Behavior Modification, en particulier dans les numéros précédents , on trouve de nombreux exemples de mesures comportementales innovantes et de systèmes plus complets. Conformément à l’approche idiographique, bon nombre d’entre eux ne s’appliquent qu’au cas en question, ont une certaine validité interne ou apparente, mais, bien sûr, ont peu de généralité ou de validité externe. (D’autres commentaires sur cet aspect de l’évaluation comportementale sont faits dans une section ultérieure de ce chapitre.)
Un dernier développement qui a contribué et coïncidé avec l’émergence de l’évaluation comportementale a été le dossier orienté problème (POR) . Il s’agissait d’un système d’archivage institué pour la première fois dans les services médicaux des hôpitaux généraux pour affiner et identifier les pratiques diagnostiques (cf. Weed, 1964, 1968, 1969). Plus tard, ce système a été transféré dans des unités psychiatriques (cf. Hayes-Roth, Longabaugh, & Ryback, 1972; Katz & Woolley, 1975; Klonoff & Cox, 1975; McLean & Miles, 1974; Scales & Johnson, 1975 ), avec sa pertinence pour l’évaluation comportementale de plus en plus évidente (Atkinson, 1973; Katz & Woolley, 1975). Lorsqu’il est appliqué à la psychiatrie, le POR peut être divisé en quatre sections: (a) base de données, (b) liste des problèmes, (c) plan de traitement, et (d) données de suivi.Il ne fait aucun doute que ce type de tenue de registres favorise et améliore la relation entre l’évaluation et le traitement, obligeant essentiellement l’évaluateur à cristalliser sa réflexion sur les problèmes diagnostiques. À cet égard, nous avons précédemment souligné que
Malgré le fait que la POR représente, pour la psychiatrie, une grande amélioration par rapport au type de dossier -pratique de maintien et de diagnostic précédemment suivie, le niveau de précision dans la description des comportements problématiques et les traitements à utiliser de manière curative ne se rapproche pas encore du type de précision atteint dans l’analyse comportementale soigneusement menée. (Hersen, 1976, p. 15)
Cependant, le POR peut certainement être conceptualisé comme un pas majeur dans la bonne direction. Dans la plupart des contextes psychiatriques, un certain type de ROP (le reliant à des plans de traitement spécifiques) a été ou est actuellement utilisé et, dans une large mesure, a légitimé davantage les principes de l’évaluation comportementale en liant clairement la liste des problèmes à un traitement spécifique (cf. Longabaugh, Fowler, Stout, & Kriebel, 1983; Longabaugh, Stout, Kriebel, McCullough, & Bishop, 1986).