SSudo's Lab

須藤爽のブログです。専門は(英語)教育政策,教育経営。

【読書メモ007】「エビデンス」の4つの意味(亘理, 2020)

書誌情報

亘理陽一「エビデンスに基づく教育は何をもたらすのか」『人間と教育』106, 20-27.

日常語と専門語で大きく意味が異なる用語は複数ありますが、とりわけ「エビデンス」という用語は扱いに注意が必要です。

情報があふれるこの世の中、その情報にどれほど正当性があるのかを確かめるのは、もはやマストな行為。特に政策関連の話になると、この言葉がきわめて頻繁に使われています。「エビデンスを重視して……」「エビデンスに基づき……」とか。

さて、この「エビデンス」という言葉ですが、けっこういろいろな意味があります。というより、それぞれの立場の人が、「エビデンス」という言葉をそれぞれの意味で使っている——と言った方がいいでしょうか。

世間一般で思われている「エビデンス」の意味と、研究者が想定する「エビデンス」の意味が大きく乖離しているだけでなく、研究者の中でもその意味にバラツキがけっこうあります。しかも、たちが悪いことに、著者自身がそれを認識していないことがかなり多い。

これまでは、「あぁ、この人はそういうタイプか」みたいな感じで、都度都度、頭の中で分類していました。とはいえ、一度しっかり体系化した方がいいなぁ——と思っていたところ、本論文を見つけました。エビデンスの意味を4つに分類し、整理してくれています。ありがたく使わせていただこうかと。

エビデンスには4つの意味がある!

著者によると、「エビデンス」は以下の4つに分類できる、とのこと。

  1. 因果関係を示唆する根拠
  2. 主張の拠り所
  3. 意思決定に利用されるデータ
  4. 体験の反省に基づく確実性・不可疑性

以下、詳しく見ていきます。

① 因果関係を示唆する根拠としての「エビデンス

まず最初は、政策決定と密接にかかわる「エビデンス」。著者の説明を引用します。

ここでの「エビデンス」は、ある事象(処遇・介入)が、別の事象(アウトカム)を引き起こす原因、もしくは別の現象に影響を及ぼす要因であるという推論に寄与する分析結果である。(p. 20)

ちまたでは、「データを用いてた分析に基づいて示された根拠」のことを「エビデンス」と呼ぶことがありますが、ここでいう「エビデンス」はもっと厳格な意味で使われます。中室・津川 (2017) は「エビデンス」を「因果関係を示唆する根拠」(p. 48) と定義し、それを単なるグラフやチャート、アンケート結果と明確に区別すべきだと主張しております。

例えば、「朝食を食べると学力が上がる」という説をよく耳にしないでしょうか。確かにその種の研究をみると、朝食を食べている生徒は成績が良く、朝食を食べていない生徒は成績が悪い——という相関関係がみられます。しかし、「相関=因果」ではありません。「朝食を食べている生徒ほど学力が高い」からといって、「朝食を食べると学力が上がる」とは決して言ってはいけない

なぜか。理由はいくつもあるので、一番わかりやすそうなものを紹介します。「朝食を食べている生徒ほど学力が高い」という仮説は、以下の関係になっている可能性があります。

第3の変数

この図が何を意味しているのかというと、「生活習慣が良好な家庭であれば、朝食をとる割合は多いであろうし、子どもの学力も高いのでは?」ということです。要するに、「朝食を食べると学力が上がる」説の問題点は、そのどちらにも影響を与える要素(「第3の変数」とか「交絡因子」と呼ばれています)について、検討がされていないことです。

相関関係があってはじめて因果関係を見いだせることは確かですが、「相関=因果」ではない! たとえ相関関係があっても、因果関係があるとみなすためには、厳格な基準を満たしている必要がある。そのような関門をくぐりぬけて、ようやく「エビデンス」を得ることができる——ということです。

② 主張の拠り所としての「エビデンス

続いては、主張の拠り所として使われる「エビデンス」。①の「エビデンス」と比べると、かなりゆるめです。具体的には、「○○大学の△△教授が、『小学生から英語学習をはじめることは、生徒のモチベーション向上につながる』と言っている」(あくまで例です)といった感じ。ここでは、実証的な裏付けは重視されていない。つまり、エビデンスの質は正直どうでもいい。それよりも、「かの有名な△△も私と同じことを言っています。ね? この考え、良さそうでしょ?」のように、自身の主張を権威者の発言によって、裏付けることを主眼とする。

ちなみに①の「エビデンス」の基準で言えば、「専門家の意見」は最低ランク。根拠のレベルとしてはかなり乏しい。

別に、「専門家の主張を全否定しろ!」と言いたいわけではありませんが、少なくとも、「誰が言ったか」だけでなく、「その発言は何に基づいているのか」を注意することは不可欠かと。

③ 意思決定に利用されるデータとしての「エビデンス

こちらも位置づけとしては②と似ています。②と同じく、自身の主張の裏付けとして使うのが目的。「事象間の因果の厳密さよりも、意思決定や結果を正当化する数字・記述の提示」(p. 21) が求められます。

違いとしては、②はその裏付けとして「専門家の意見」を採用していたのに対して、こちらは「統計指標」——つまり「数字」——を根拠とする点。一見よさげに見えるのではないでしょうか。先の「あの○○氏が言ったことだから、正しいだろう」と比べれば、こちらは数値に基づくわけだから、けっこう信頼できそうではないかと。

その思わせぶりが、本当に厄介。たちが悪い。正直、英語教育を研究し始めたばかりの頃は、この種の「エビデンス」に踊らされていました。本当に時間を返してほしいw

愚痴を言ってもしょうがないので、説明に移ります。③の「エビデンス」とは、たとえばこんな感じです:「○○という指導法を採用した結果、ほとんどの生徒・児童が『授業が楽しかった』と回答した」「生徒の顔が生き生きしていた」「生徒の得点が前回と比べて△点あがった」

少し誇張して書いたので、欠点が見え見えですね。こんなのを「エビデンス」とは言いたくない。しかし、けっこうな人が使っているのが現状。個人で勝手に使うのはかまいませんが、それが多くの人に影響を与える場で、軽々しく「エビデンス」という言葉を使うのは絶対に避けるべきです。特に、政策会議をみていても、「ちゃんと区別して言っているのかなぁ」と心配になることは多々あります。

④ 体験の反省に基づく確実性・不可疑性としての「エビデンス

 最後の「エビデンス」。まずは本書の説明箇所を引用します。

「振り返ってみると、私が英語学習を続けられたのは、イタリア語の授業が楽しかったからだ」。ここではむしろ、他に代替され得ない個別的な現象の把握が他者にも了解可能なものであることが重視されている(小林・西編, 2015)。(p. 21)

④を詳しく見ていく前に、これまで上げた4分類の「エビデンス」を表にまとめてみました。

エビデンス4分類

②の「主張の拠り所」、わかりやすく言えば「専門家の意見」は、モノによると思うので入れていません。

「一般的」⇔「個別的」とは、前者が母集団全体に当てはまるという意味で、後者が該当する個人のみに当てはまるという意味です。

「実践的」⇔「理論的」とは、前者が実際にそれを教育現場で実施しやすいという意味です。後者は、その知見は特定の環境下で得られたものであるため、実際の現場で同じような効果を発揮するかは不明という意味です*1。これについては以下の説明が参考になります。

意味①のエビデンスが可能にするのは、あくまで確率論的な因果推論である。RCTが重要視されるのは、他の(ここでは、宿題と成績の関係に影響する可能性のある)要因を既知・未知によらず統制するからであるが、他の要因が消えてなくなったわけではない。特定の児童・生徒は右記の要因を様々に抱えており、宿題を課したからといって成績が必ず偏差値換算で三割程度伸びるとは限らない。この点で、個々の児童・生徒・教師にこうしたエビデンスを当てはめても、教育実践の確実性が保証されるわけではない。むしろ意味③のエビデンスが、実績に信頼の置ける経験値として参照され続ける所以である。(p. 25)

上記で説明されているように、意味①のエビデンスの欠点は、あくまでそこで得られた知見は「限定的」であるという点です。さまざまな要素が絡む実際の教育現場で、実験と同じ効果が得られるわけではない。あくまで意味①のエビデンスの目的は、事象の因果関係を把握することであり、複雑な事象を説明をすることではないからです。

その欠点を補うのが意味④のエビデンスです。意味④は、個人の体験を重視します。したがって、一般性は高くはないものの、そこで得られた知見はきわめて実践的です。そのため、①と④を適切に使い分けることが、良質なエビデンスを手に入れる上で、きわめて重要なことだと思います。

*1:【追記】「理論的」という用語の選定は不適切だった気がします。単純に「限定的」とかの方が良いかも