Chapitre 4. Suivi axé sur les résultats
Annexes
|
7.5 Méthodologie de l’évaluation
Les méthodes d’évaluation doivent donc être choisies selon leur rigueur à produire des données empiriques destinées à aborder les critères d’évaluation et répondre aux questions d’évaluation. Le rapport initial d’évaluation doit contenir une matrice d’évaluation qui expose, pour chaque critère d’évaluation, les questions et sous-questions auxquelles l’évaluation apportera une réponse et, pour chaque question, les données à collecter qui renseigneront celle-ci ainsi que les méthodes à suivre pour la collecte de ces informations (voir encadré 40). Le rapport initial d’évaluation doit en outre mettre explicitement en relief, la théorie ou hypothèses sous-jacentes sur la manière avec laquelle chaque donnée contribuera à comprendre les résultats de développement – imputabilité, contribution, processus, mise en œuvre et ainsi de suite – et la raison de la collecte d’information et des méthodologies choisies pour l’analyse et la rédaction de rapports.
Encadré 40. Questions pour les évaluateurs
Le bureau commissaire doit garantir au minimum que les méthodes exposées dans le rapport initial des évaluateurs répondent à chacune des questions suivantes :
Méthodes de collecte de donnéesLes données à collecter et la méthode à suivre à cet effet seront déterminées par : les éléments nécessaires pour répondre aux questions de l’évaluation ; l’analyse utilisée pour traduire ces données en conclusions significatives pour répondre aux questions de l’évaluation et ; les jugements sur quelles données il faudra collecter au vu des contraintes de temps et de ressources. Les évaluations du PNUD puisent énormément dans les données (indicateurs de performance) générées à travers le suivi pendant le cycle de mise en œuvre du programme ou projet. Les indicateurs de performance sont des moyens simples et fiables de documenter les changements des conditions de développement (effets), de la production, ou de la réalisation de produits et services (résultats), liés à une initiative de développement (voir chapitre 2). Les indicateurs de performance sont utiles mais ont des limites : ils indiquent, ils n’expliquent pas. Les indicateurs ne répondront pas à l’ensemble des questions auxquelles l’évaluation cherche à répondre. Ainsi, ils pourront mesurer le progrès, par exemple, mais ne pourront donner une explication sur la raison de ce progrès ou déterminer les facteurs ayant contribué à ce progrès. Les évaluations du PNUD font en général appel à un mélange d’autres sources de données, collectées selon différentes méthodes, pour donner un sens aux informations fournies par les indicateurs de performance à propos d’une initiative. Les données de base consistent en un ensemble d’informations observées par les évaluateurs ou collectées directement auprès des parties prenantes, et concernent leur premier contact avec l’initiative. Ces données constituent en général un ensemble d’observations sur les valeurs, les croyances, les attitudes, les opinions, les comportements, les motivations et les connaissances des parties prenantes, réunies à travers des questionnaires, des enquêtes, des entretiens, des groupes d’experts, d’informateurs-clés, de panels d’experts, d’observations directes et d’études de cas. Ces méthodes permettent d’effectuer une étude plus approfondie et fournissent plus d’information pouvant apporter une meilleure compréhension des changements observés dans les effets et les produits (aussi bien voulus que non), et des facteurs ayant contribué à un renforcement du contexte opérationnel des résultats. Les données secondaires sont les données de base qui ont été collectées puis qui ont été compilées et publiées par quelqu’un d’autre. Ces données peuvent adopter plusieurs formes mais consistent en général en une série d’éléments de documentation ayant un intérêt direct pour les objets de l’évaluation. Les sources de ces éléments comprennent : des données démographiques locales, régionales ou nationales ; des rapports publiés à niveau national ou international ; des indicateurs économiques, sociaux ou sanitaires ; des plans de programme ou projet ; de rapports de suivi ; d’examen, d’évaluations et autres rapports antérieurs, de plans stratégiques de pays et ; de rapports de recherches pouvant avoir un intérêt pour l’évaluation. Les éléments de documentation sont particulièrement utiles lorsque le projet ou programme manque d’indicateurs et de cibles de référence pour mesurer le progrès des produits et des effets. Malgré que ce ne soit pas la méthode la plus conseillée, les données secondaires peuvent être utilisées pour recréer des données et des cibles de références. Elles viennent enfin en complément et en supplément aux données de base mais ne remplacent pas la collecte de données de sources primaires. Le tableau 28 présente de brèves descriptions des méthodes de collecte de données qui sont le plus communément appliquées pour les évaluations du PNUD aussi bien pour les évaluations de projet que pour les évaluations des effets. Tableau 28. Récapitulatif des méthodes de collecte de données communément appliquées pour les évaluations du PNUD53
Les bureaux mandatés doivent garantir que les méthodes et les instruments (questions, enquêtes, protocoles, listes de vérifications) utilisées pour la collecte ou l’enregistrement des données sont : cohérentes avec les normes de qualité en termes de validité et de fiabilité,54 sensibles à la culture et en adéquation avec les populations concernées et, pertinentes et appropriées aux différents types d’informations recherchées et aux questions sur l’évaluation auxquelles elles doivent apporter une réponse. Dans le cas de situations en milieux de conflits, les facteurs tels que les questions de sécurité, le manque d’infrastructures, l’accès limité aux populations détenant les informations ainsi que les sensibilités et considérations éthiques en termes de travail avec des populations vulnérables doivent alors être prise en ligne de compte pour déterminer les méthodes de collectes de données les plus adéquates. Questions sur la qualité des donnéesLes bureaux mandatés du PNUD doivent s’assurer que l’évaluation collecte des données liées aux objets fixés et qu’elle emploie les méthodologies et procédures de collecte d’information rigoureuses et défendables et qu’elles donnent lieu à des éléments empiriquement vérifiés, qui soient valides, fiables et crédibles. La fiabilité et la validité sont également des aspects importants de la qualité d’une évaluation. La fiabilité fait référence à la cohérence des mesures effectuées – s’assurer par exemple qu’un instrument de collectede données particulier, tel qu’un questionnaire, donnera lieu aux mêmes réponses s’il est mené dans des conditions similaires. La validité fait référence à la précision des mesures effectuées – s’assurer par exemple qu’un instrument de collecte de données particulier mesure bien ce qu’il était censé mesurer. C’est également le degré auquel les déductions et conclusions tirées des données sont fondées et justifiables. La crédibilité concerne le degré perception des parties prenantes, et particulièrement les utilisateurs des résultats de l’évaluation, de la validité, fiabilité et impartialité des éléments d’évaluation et des résultats. Il existe trois grandes stratégies pour améliorer la fiabilité et la validité qu’une bonne évaluation devrait aborder :
Améliorer la qualité de l’échantillonnageLes évaluations du PNUD rassemblent souvent les éléments d’informations d’un échantillon de populations ou de lieux. Si cet échantillon n’est pas représentatif de la portion d’une population, il y a un risque que les conclusions tirées sur la population en question soient fausses. Ainsi, si un entretien de groupe par exemple, ne réunit que les personnes vivant en ville et pouvant donc facilement accéder au lieu ou se tient l’entretien, les intérêts et expériences de ceux vivant en dehors de la ville pourraient ne pas être tenu en compte. L’échantillon doit donc être sélectionné sur la base d’un raisonnement ou d’un but directement lié aux objets de l’évaluation et est censé garantir une précision dans l’interprétation des conclusions et de l’utilité des résultats de l’évaluation. Les bureaux mandatés doivent donc s’assurer que l’élaboration de l’évaluation retrace clairement les caractéristiques de l’échantillon, la manière avec laquelle il sera sélectionné et les raisons de cette sélection et enfin les limites de l’échantillon pour l’interprétation des résultats de l’évaluation. Si un échantillon n’est pas utilisé, les raisons et les répercussions sur l’évaluation doivent être discutées. Garantir la consistance du rassemblement des donnéesQue ce soit à l’heure d’utiliser des questionnaires, de fixer des entretiens, de suivre des protocoles d’observation ou autres outils de rassemblement de données, les équipes d’évaluation doivent tester tout d’abord les outils de collecte de données et s’assurer qu’ils rassemblent des éléments à la fois précis et cohérents. Quelques démarches à suivre seraient :
‘Trianguler’ les données pour vérifier leur précision: utiliser plusieurs sources de donnéesUn bon élément d’évaluation doit être à la fois cohérent et précis. Concevoir des stratégies destinées à vérifier les données améliorera la fiabilité et garantira des résultats valides.
Le défi pour les évaluations du PNUD est d’utiliser des méthodes d’élaboration d’évaluations rigoureuses qui donneront lieu à des informations utiles et basées sur des faits crédibles et défendables face au défi que représente la précision et la validité des déductions tirées de ces faits. Considérations éthiquesLes évaluations doivent être élaborées et menées dans le respect et la protection des droits et du bien-être des populations et des communautés auxquelles elles appartiennent, conformément à la Déclaration Universelle des Droits de l’Homme des Nations Unies55 et autres conventions sur les droits de l’Homme. Les évaluateurs doivent donc respecter la dignité et la diversité des participants aux évaluations au moment de sa planification, de son déroulement et de la rédaction des rapports, en partie grâce à l’utilisation des instruments d’évaluation appropriés au milieu culturel. Plus encore, les éventuels participants à l’évaluation doivent être considérés comme autonomes, que le temps et les informations nécessaires leur soient donnés pour décider de leur participation ou pas, et qu’ils puissent prendre une décision libre et sans aucune pression. Les responsables de l’évaluation et les évaluateurs doivent être conscients des implications liées à la conduite d’une évaluation en zones de conflit. Les évaluateurs doivent particulièrement savoir que leur manière d’agir, y compris dans les messages explicites et implicites qu’ils transmettent, peut avoir des répercussions sur la situation et faire courir de plus grands risques aux personnes avec lesquelles ils interagissent.56 Lorsque les évaluateurs doivent s’entretenir avec des groupes vulnérables, ils doivent s’assurer que les personnes interrogées sont conscientes des implications potentielles de leur participation à l’évaluation et qu’ils ont reçu suffisamment d’informations leur permettant de décider de leur participation à cet exercice. Tous les évaluateurs mandatés par les unités de programme du PNUD doivent s’accorder à signer le Code de conduite des évaluateurs du système des Nations Unies.57 Pour de plus amples informations sur les questions déontologiques dans le cadre des évaluations, veuillez consulter: ‘UNEG Ethical Guidelines for Evaluation’.58
Encadré 41. Droits de l’Homme et égalité des sexes dans l’élaboration de l’évaluation
Les évaluations au sein du PNUD sont guidées par les principes du respect des Droits de l’Homme et de l’égalité des sexes. Ceci a des répercussions sur l’élaboration et la conduite des évaluations et requiert une compréhension mutuelle de ces principes et une attention particulière de part des évaluateurs, des responsables des évaluations et des parties prenantes. Ainsi, lors de la collecte de données par exemple, les évaluateurs doivent s’assurer que les femmes et les groupes les moins avantagés sont représentés de manière adéquate. Afin de faire apparaître les groupes exclus ou les moins avantagés, les données doivent être ventilées par sexe, âge, handicap, ethnicité, caste, richesse et toute autre différence pertinente. De plus, les données doivent être analysées, à chaque fois que cela est possible, sous différents points de vue, y compris le sexe, le groupe socio-économique, l’ethnicité et le handicap. Les groupes marginalisés sont souvent sujets à différentes formes de discriminations, et il est donc important de comprendre comment ces discriminations se croisent et privent ces groupes de leurs droits.
| ||||||||||||||||||||||||||||||||||||||||
|
|
54. Voir la discussion sur la validité et la fiabilité dans la section ‘Questions sur la qualité des données’ du présent chapitre. 55. Nations Unies, ‘Déclaration Universelle des Droits de l’Homme’. Disponible sur le site: http://www.un.org/en/documents/udhr/. 56. Guide de l’OCDE pour l’évaluation des activités de prévention des conflits et de construction de la paix – Document de travail pour la période d’application, 2008. 57. UNEG, ‘Code of Conduct’, Juin 2008. Disponible en anglais sur le site: http://www.uneval.org/papersandpubs/documentdetail.jsp?doc_id=100. 58. UNEG, ‘Ethical Guidelines for Evaluation’, Juin 2008. Disponible en anglais sur le site: http://www.uneval.org/search/index.jsp?q=ethical+Guidelines. 59. Basé sur Joint Committee on Standards for Educational Evaluation, ‘Programme Evaluation Standards: How to Assess Evaluations of Educational Programmes’, 2nd ed, Sage Publications, Thousand Oaks, CA.
|