SSudo's Lab

英語入試改革について修論を書く予定の大学院生です。読んだ本・論文のログを残していきます。

高校生の勉強時間は〇〇で決まる!

f:id:Sudos:20210317185655p:plain
書誌情報:山村滋・濱中淳子・立脇洋介 (2019) 『大学入試改革は高校生の学習行動を変えるか:首都圏10校パネル調査による実証分析』ミネルヴァ書房

どうすれば高校生は勉強をするのか——大学入試があるからといって、簡単には勉強してくれない。なおかつ、推薦入試やAO入試など、入試の選択肢が増えたことで、「大学受験のために勉強をする」高校生はどんどん減ってきているかと思われます。だからこそ、入試以外の要素で、高校生のモチベーションを上げてあげることが大事かと。


本研究では、埼玉県の進学中堅校3校と進学校2校、千葉県の進学中堅校3校と進学校2校、計10校の協力のもと、行われました。3年にわたる計5回の追跡調査により、高校生の学習行動の実態について分析されております。


調査の結果、学習時間を延ばすために有効なこととして第一に、「高校1年次の学習時間」をあげています。要するに、高校1年生の時に学習習慣を形成できるかどうかで、高校生活後半の学習時間の伸びが大きく左右される——ということです。


しかも、これに関しては、学校のレベルは関係がなかったとのこと。つまり、高校入学時点の学力に関係なく、高1の頃からコツコツ勉強をする習慣をつけることができれば、「学習時間」に関しては抜きんでることができる——ということです。


では、「高校1年次の学習時間」を延ばすにはどうすればいいのか? 重要な要素として筆者らは次の2点をあげています。


まずは、誰かと一緒に勉強をする「場」の提供です。塾や予備校以外で友達と一緒に勉強する「場」の存在が、生徒の学習時間を延ばすことが確認されています。定期テスト前はもちろん、ふだんの学習時間にも影響を与えているのは特筆に値するかと*1


もう一点は、「友人」の存在です。これについては「ピア・エフェクト」なんて名前もあるくらい有名な話ですね。要するに、学力の高い友達の中にいると、自分の学力にもプラスの影響が与えられる——という話です。よく高校生の合格体験記に、「競い合える友だちを持つことがダイジ!」なんてコメントがありますが、まさにその通り! ということです。


ただし、これには注意が必要! というのも、「学力の高い同級生の存在が、学力の低い生徒に悪影響を与えた」——ことを示す研究もあるからです (Jonson & Mood, 2008)。まぁ確かに、「こいつスゲー。絶対かなわねー……」と思ってしまうと、そりゃ自信も無くすでしょうし、「(その人と比べて)こんなバカな私が、大学に行く意味なんてあるんだろうか……」と思っても無理はありませんよね。


ってことで、「学力の高い友人」を持つことは大事だが、あまりにもレベルの違い過ぎるグループには入らない方が良い——ということです。


以上をまとめると、

  • 高1年次に学習習慣をつけさせることがきわめてダイジ
  • そのための戦略として、お互いの学習に刺激を与え合えるような友人と共に勉強できる「場」を提供してあげるのが有効


ということです。個人的には、「場」を提供するだけでなく、生徒たちが誰かと一緒に勉強をする「きっかけ」を作ってあげるのもダイジかと。

*1:ただし、この結果については、進学校と進学中堅校で差があったそうです。具体的には、進学校の方が、学習の「場」がある割合が15~20% 高いみたいです。やはり、周囲の同級生の勉強に対する意識の程度が、高校レベルによって違うってことですね。

「エビデンス」の4つの意味(亘理, 2020)

書誌情報

亘理陽一「エビデンスに基づく教育は何をもたらすのか」『人間と教育』106, 20-27.

あなたの好きな言葉は?——と聞かれてたら、「エビデンス!」と最近は答えようと思っております。
情報があふれるこの世の中、その情報にどれほど正当性があるのかを確かめるのは、もはやマストな行為。特に政策関連の話になると、この言葉がきわめて頻繁に使われています。「エビデンスを重視して……」「エビデンスに基づき……」とか。

さて、この「エビデンス」という言葉ですが、けっこういろいろな意味があります。というより、それぞれの立場の人が、「エビデンス」という言葉をそれぞれの意味で使っている——と言った方がいいでしょうか。

世間一般で思われている「エビデンス」の意味と、研究者が想定する「エビデンス」の意味が大きく乖離しているだけでなく、研究者の中でもその意味にバラツキがけっこうあります。しかも、たちが悪いことに、著者自身がそれを認識していないことがかなり多い。

これまでは、「あぁ、この人はそういうタイプか」みたいな感じで、都度都度、頭の中で分類していました。とはいえ、一度しっかり体系化した方がいいなぁ——と思っていたところ、本論文を見つけました。エビデンスの意味を4つに分類し、整理してくれています。ありがたく使わせていただこうかと。

エビデンスには4つの意味がある!

著者によると、「エビデンス」は以下の4つに分類できる、とのこと。

  1. 因果関係を示唆する根拠
  2. 主張の拠り所
  3. 意思決定に利用されるデータ
  4. 体験の反省に基づく確実性・不可疑性

以下、詳しく見ていきます。

① 因果関係を示唆する根拠としての「エビデンス

まず最初は、政策決定と密接にかかわる「エビデンス」。著者の説明を引用します。

ここでの「エビデンス」は、ある事象(処遇・介入)が、別の事象(アウトカム)を引き起こす原因、もしくは別の現象に影響を及ぼす要因であるという推論に寄与する分析結果である。(p. 20)

ちまたでは、「データを用いてた分析に基づいて示された根拠」のことを「エビデンス」と呼ぶことがありますが、ここでいう「エビデンス」はもっと厳格な意味で使われます。中室・津川 (2017) は「エビデンス」を「因果関係を示唆する根拠」(p. 48) と定義し、それを単なるグラフやチャート、アンケート結果と明確に区別すべきだと主張しております。

例えば、「朝食を食べると学力が上がる」という説をよく耳にしないでしょうか。確かにその種の研究をみると、朝食を食べている生徒は成績が良く、朝食を食べていない生徒は成績が悪い——という相関関係がみられます。しかし、「相関=因果」ではありません。「朝食を食べている生徒ほど学力が高い」からといって、「朝食を食べると学力が上がる」とは決して言ってはいけない

なぜか。理由はいくつもあるので、一番わかりやすそうなものを紹介します。「朝食を食べている生徒ほど学力が高い」という仮説は、以下の関係になっている可能性があります。

f:id:Sudos:20210316120510p:plain
第3の変数

この図が何を意味しているのかというと、「生活習慣が良好な家庭であれば、朝食をとる割合は多いであろうし、子どもの学力も高いのでは?」ということです。要するに、「朝食を食べると学力が上がる」説の問題点は、そのどちらにも影響を与える要素(「第3の変数」とか「交絡因子」と呼ばれています)について、検討がされていないことです。

相関関係があってはじめて因果関係を見いだせることは確かですが、「相関=因果」ではない! たとえ相関関係があっても、因果関係があるとみなすためには、厳格な基準を満たしている必要がある。そのような関門をくぐりぬけて、ようやく「エビデンス」を得ることができる——ということです。

② 主張の拠り所としての「エビデンス

続いては、主張の拠り所として使われる「エビデンス」。①の「エビデンス」と比べると、かなりゆるめです。具体的には、「○○大学の△△教授が、『小学生から英語学習をはじめることは、生徒のモチベーション向上につながる』と言っている」(あくまで例です)といった感じ。ここでは、実証的な裏付けは重視されていない。つまり、エビデンスの質は正直どうでもいい。それよりも、「かの有名な△△も私と同じことを言っています。ね? この考え、良さそうでしょ?」のように、自身の主張を権威者の発言によって、裏付けることを主眼とする。

ちなみに①の「エビデンス」の基準で言えば、「専門家の意見」は最低ランク。根拠のレベルとしてはかなり乏しい。

別に、「専門家の主張を全否定しろ!」と言いたいわけではありませんが、少なくとも、「誰が言ったか」だけでなく、「その発言は何に基づいているのか」を注意することは不可欠かと。

③ 意思決定に利用されるデータとしての「エビデンス

こちらも位置づけとしては②と似ています。②と同じく、自身の主張の裏付けとして使うのが目的。「事象間の因果の厳密さよりも、意思決定や結果を正当化する数字・記述の提示」(p. 21) が求められます。

違いとしては、②はその裏付けとして「専門家の意見」を採用していたのに対して、こちらは「統計指標」——つまり「数字」——を根拠とする点。一見よさげに見えるのではないでしょうか。先の「あの○○氏が言ったことだから、正しいだろう」と比べれば、こちらは数値に基づくわけだから、けっこう信頼できそうではないかと。

その思わせぶりが、本当に厄介。たちが悪い。正直、英語教育を研究し始めたばかりの頃は、この種の「エビデンス」に踊らされていました。あぁ、むかつく!

愚痴を言ってもしょうがないので、説明に移ります。③の「エビデンス」とは、たとえばこんな感じです:「○○という指導法を採用した結果、ほとんどの生徒・児童が『授業が楽しかった』と回答した」「生徒の顔が生き生きしていた」「生徒の得点が前回と比べて△点あがった」

少し誇張して書いたので、欠点が見え見えですね。こんなのを「エビデンス」とは言いたくない。しかし、けっこうな人が使っているのが現状。個人で勝手に使うのはかまいませんが、それが多くの人に影響を与える場で、軽々しく「エビデンス」という言葉を使うのは絶対に避けるべきです。特に、政策会議をみていても、「ちゃんと区別して言っているのかなぁ」と心配になることは多々あります。

④ 体験の反省に基づく確実性・不可疑性としての「エビデンス

 最後の「エビデンス」。まずは本書の説明箇所を引用します。

「振り返ってみると、私が英語学習を続けられたのは、イタリア語の授業が楽しかったからだ」。ここではむしろ、他に代替され得ない個別的な現象の把握が他者にも了解可能なものであることが重視されている(小林・西編, 2015)。(p. 21)

④を詳しく見ていく前に、これまで上げた4分類の「エビデンス」を表にまとめてみました。

f:id:Sudos:20210316131300p:plain
エビデンス4分類

②の「主張の拠り所」、わかりやすく言えば「専門家の意見」は、モノによると思うので入れていません。

「一般的」⇔「個別的」とは、前者が母集団全体に当てはまるという意味で、後者が該当する個人のみに当てはまるという意味です。

「実践的」⇔「理論的」とは、前者が実際にそれを教育現場で実施しやすいという意味です。後者は、その知見は特定の環境下で得られたものであるため、実際の現場で同じような効果を発揮するかは不明という意味です。これについては以下の説明が参考になります。

意味①のエビデンスが可能にするのは、あくまで確率論的な因果推論である。RCTが重要視されるのは、他の(ここでは、宿題と成績の関係に影響する可能性のある)要因を既知・未知によらず統制するからであるが、他の要因が消えてなくなったわけではない。特定の児童・生徒は右記の要因を様々に抱えており、宿題を課したからといって成績が必ず偏差値換算で三割程度伸びるとは限らない。この点で、個々の児童・生徒・教師にこうしたエビデンスを当てはめても、教育実践の確実性が保証されるわけではない。むしろ意味③のエビデンスが、実績に信頼の置ける経験値として参照され続ける所以である。(p. 25)

上記で説明されているように、意味①のエビデンスの欠点は、あくまでそこで得られた知見は「限定的」であるという点です。さまざまな要素が絡む実際の教育現場で、実験と同じ効果が得られるわけではない。あくまで意味①のエビデンスの目的は、事象の因果関係を把握することであり、複雑な事象を説明をすることではないからです。

その欠点を補うのが意味④のエビデンスです。意味④は、個人の体験を重視します。したがって、一般性は高くはないものの、そこで得られた知見はきわめて実践的です。そのため、①と④を適切に使い分けることが、良質なエビデンスを手に入れる上で、きわめて重要なことだと思います。

Washback effects 関連のメモ① (Dong, 2020)

2. リサーチクエスチョン

RQ1. テストの妥当性・影響・重要性に関する学習者の認識は、どのように、かつ、どの程度、学習に影響するか?
RQ2. 学習者の取り組みは、どのように、かつ、どの程度、学習のアウトカムに影響するか?

3. 先行研究の問題点

・これまでのウォッシュバック研究のほとんどが質的研究 (qualitative research) であり、量的研究 (quantitative research) が不足している。質的研究は、ウォッシュバックのメカニズムに影響を与える諸要因を特定することには向いているが、要素間の関係を統計的に分析することはできない (Xie, 2015)。

・量的研究もあるにはあるが (e.g., Xie, 2013, 2015; Xie & Andrews, 2013)、これらの研究では、学習内容がテスト勉強 (test preparation)のみに限定されている。そして、テストに対する認識がテスト勉強にどのように影響するか、また、テスト勉強がテストのスコアを上げるか、を調査している。確かに、テスト勉強は、最も直接的で観察しやすいウォッシュバック効果ではあるが、テストによるウォッシュバック効果の全体像をつかみ取れてはいない、という問題点がある (Zhan & Wan, 2014)。

・複数の研究 (e.g., Green, 2007; Xiao, Gu, & Ni, 2014; Xie, 2015)により、テストの妥当性・影響・重要性に関する学習者の認識が、学習に影響を与えることが確認されているが、そういった認識がどのように学習に影響するのかは不明のままである。

・これまでのNMETに関する研究はテストの妥当性の検証に主眼が置かれており、ウォッシュバック効果に関する研究はきわめて少ない。

・NMETを対象にウォッシュバック効果を分析した研究もあるが (e.g., Qi, 2004; Wu, 2012)、そこでは教員・指導法へのウォッシュバック効果のみを分析対象としている。一方、「学習」へのウォッシュバック効果については、ほとんど注目されていない。

・NMETがどのように学習者の英語学習に影響するか、について調べた実証研究は、現状、存在しない。

・学習者のテストに対する認識・態度が学習行動にどのような影響を及ぼすか、学習行動がどのようなアウトカムを生み出すか——これらを個別に検討している先行研究はあるものの、包括的に、「認識」「学習行動」「アウトカム」の関係を検証した実証研究は現状存在しない。

4. 方法

(1) ケースセレクション

中国の重慶市 (Chongqing) から、学校ランキング、その地区の経済・教育レベルをもとに、6つの高校を選出(計4地区)。内訳は次の通り。
・a top high school (N= 429, 13.8%) [municipality level]
・a key high school (N=716, 23.1%) [municipality level]
・a key high school (N= 551, 17.7%) [district level]
・an ordinary high school (N= 642, 20.7%) [district level]
・an ordinary high school (N= 303, 9.8%) [country level]
・a high school (N= 464, 15.0%) [town level]

(2) 処置

反実仮想モデルではないため、「処置」は考慮されていない。

(3) 処置の割当メカニズム

同上

(4) 結果変数の測定方法

・テストの妥当性の認識 (Pvalidity)、テストが与えるインパクト (Pimpact)、テストの重要性の認識 (Pimportance) を質問紙により調査。質問内容の例は以下の通り。Pvalidityだと「NMETは私の英語力を科学的に・客観的に測定している」、Pimpactだと「NMETは私の英語学習の方法に影響を与えている」、Pimportanceだと「私のNMETのスコアは、将来の英語学習を考慮すると重要だ」——といった質問項目が設定されている。

・「学習者の取り組み」は以下の4つを構成要素とする。すなわち、①「授業に基づく学習(例:授業の内容を復習する)」、②「テスト勉強(例:NMETの疑似問題を演習する)」、③「娯楽的学習(例:洋楽を聴く)」、④「コミュニカティブ・ラーニング(例:ネイティブスピーカーと英語でコミュニケーションをとる)」。

・「学習者の成績」は、学習者に、1年間における自身の平均的な点数の幅を選択してもらうことで測定する。指標としては、150点満点中、①75点以下 (poor)、②76~90点 (comparatively poor)、③91~105点 (average)、④106-119 (comparatively good)、⑤120点以上 (good)、の5区分。このような方法を採用した理由は以下の3つ。まず、参加者の学年・所属校・地区がバラバラなため、統一的なテストを実施するのは現実的ではないという点。それから、学習者の学力を一つのテストで計測することはできないという点。最後に、複数のテストを統一的にやるには、サンプルの数からして、あまりにもコストがかかりすぎるという点。以上の理由から、学習者の英語力を、学習者の平均的なテストスコアの幅で計測する方法が、合理的であると判断した。

(5) 実験の実施方法・データ収集の方法

・3,278人に質問紙の回答を依頼した結果、3,215人 (98.1%)から回答を得ることができた。

5. 結果

RQ1. テストの妥当性・影響・重要性に関する学習者の認識は、どのように、かつ、どの程度、学習に影響するか?

→ どの要素も同様に学習者の取り組みに影響することが確認された。しかし、テストに対する認識の良し悪しにより、学習行動に違いが生まれ、結果として正のウォッシュバック効果だけでなく負のウォッシュバック効果が生じている——ということも確認された。

RQ2. 学習者の取り組みは、どのように、かつ、どの程度、学習のアウトカムに影響するか?

→ 4つの取り組みが学習者の成績にどの程度影響したか。結果は以下の通り。
1位 授業に基づく学習 (β= .27)
2位 娯楽的学習 (β= .15)
3位 テスト勉強 (β= .10)
3位 コミュニカティブ・ラーニング (β= .10)

※ コミュニカティブ・ラーニングの数値は、その実施回数の少なさを考慮すれば、決して低いものではない。

6. インプリケーション

・正のウォッシュバック効果をもたらせるかどうかは、学習者のテストに対する認識が大きく影響する

・中国における(一部の地域の)EFLでは、教師による指導が、英語学習において重要な役割を有していた

・学習者が「コミュニカティブ・ラーニング」に取り組まなかったのは、スピーキング能力がNMET のテスト項目で設定されていないから——という可能性がある

7. 研究の限界

・すべてのデータが参加者の自己申告に基づいているため、信頼性は低い。

・本研究では、学校レベル、地区の経済的・教育的レベルを考慮し、サンプルの抽出を行ったが、データを高度に処理する作業 (multi-level analysis) は行っていない。

・多くの先行研究で、ウォッシュバック効果は静的なものではなく動的なもの(=時間と共に変化する)と指摘されているが (Zhan & Wan, 2014)、本研究ではこの点をクリアしていない。

・本研究はかなりのサンプル数が確保されているものの、母集団全体から抽出したわけではなく、ある一つの都市(重慶市)から抽出したものである(=外的妥当性が担保されていない)。したがって、本研究の結果を母集団全体に一般化するには、さらなる研究が必要だ。

8. 今後の研究の方向性

・サンプル抽出後に、更なる統計的処理を加えた研究をすべきではないか(直接は書かれていないが、おそらく「マッチング」などのことを言っているのだろう)。

・ウォッシュバック効果の「移り変わり」を分析するためにも、縦断的研究 (longitudinal study) が必要。

・外的妥当性が保証されたリサーチが必要だ。

ブログ人の感想

・Xie (2013) で使用されている、全サンプルをランダムで半数に分割し、交差検証 (cross-validation) する手法が採用されている。どの程度この方法が有効なのかわからないので、とりあえず Xie (2013) を読もうかと。
 
・波及効果と「学習者の認識」の関係、という関係は面白い。これまでの波及効果研究は、波及効果の有無に焦点がいきがちで、波及効果を引き起こす・引き起こさない、要因については、あまり分析されていない。また、波及効果関係の論文で、SEM(因子分析とかパス解析とか)を使っているのは見たことがなかったので、その点は参考になった。

・学習者の成績を、「一年間を通して、テストの平均的な点数のレンジを自己申告させる」という手法をとっていたが、これは妥当性が低いのではないだろうか。

・インプリケーションで、「学習者がコミュニカティブ・ラーニングをあまり行わなかったのは、NMETにスピーキングテストが含まれていない可能性がある。よって、NMETにスピーキングテストを導入すべきだ」と書かれているが、この主張にはムリがある。本研究は、「学習者の認識が、NMETの波及効果にもたらす影響」について調べているものであり、「テストにスピーキングを導入することで、学習者の学びが変わる」という因果効果の解明を目指したものではない。後者を測定したいならば、因果推論の知見を基にしたリサーチデザインを設定する必要がある。したがって、本研究の知見だけでは、学習者がコミュニカティブ・ラーニングを行わなかった理由が、テストにスピーキングが含まれていないという点にあることを保証できないため、この主張にはかなりの疑問を持った。

・高校の区分がよくわからない(だから英語でそのまま書いておいた)。a top high school は「上位進学校」、an ordinary high school は「普通の高校」とかで良いと思うが(もっとも、なにを「普通」と言っているのかわからないが)、a key high school って一体なんだ?? それから、何もついていないただの high school は 一体なんぞや?? 特に説明がないということは、中国人ならわかるってことなのだろうか。

「大学入試改革」に関する研究テーマをメモしておこうかと ② (文部科学省, 2021)

書誌情報

文部科学省 (2021) 「これまでの主な意見の概要(第1回~第20回)」

前回sudos.hatenablog.jpに引き続き、今回は「2. 高校教育、大学教育と大学入試との関係」から気になったところをチェックして参ります!

第2章全体の傾向

この章は、タイトルの通り、大学入試が高校教育・大学教育に与える影響についての記述が多い。例えばこんな感じ。

[委員意見]大学入試改革により高校教育を変えるという点を強要し過ぎてはいけないが、他方、大学入試の在り方が高校教育や高校生の学習の在り方に影響を与える側面もある。(p. 8)

本章で使用されている専門用語に、「波及効果」(washback effects) というものがある。簡単に説明すれば、波及効果とは、「テストが指導法や学習法に与える影響」のことを意味する。例えば、「大学入試に民間試験導入を!」論を唱える人は、「民間試験を導入することで、学校でのスピーキング指導の割合が増加し、高校生のスピーキング能力が上がる!」という考えを前提としている。

波及効果に関する研究には長年の蓄積があり、今でも世界各国で研究対象となるテーマと言える。しかし、日本の高校教育を対象とした波及効果に関する研究は、ほとんど行われていない。行われているとしても、そのリサーチデザインに欠陥があり、良質なエビデンスは全く蓄積されていないと言っても過言ではないだろう。そのため、以下で見ていくように、波及効果に関するほとんどの意見が、発言者の主観的な経験や、発言者の身の回りの声に基づく(例えば、「……といった現場の先生方の声をよく耳にする」みたいな)、かなり危うい、客観性に欠けた主張が展開されている。

以下では、民間試験導入賛成派の意見と反対派の意見を抜粋し、それぞれの主張の正当性を確認していく。

賛成派の意見

まず賛成派の意見で典型的なのが、「大学入試が高校教育に多大な影響を与えている」という主張。例えばこんな感じ。

[外部有識者・団体意見]高校教員の実感として、学校現場は生徒や保護者の意見を酌むように動くところがあるため、大学入試が教育現場に与える影響は大きい。その意味では、入試改革の方向性をなるべく早く決めてほしいと思う一方で、影響力の大きさに鑑みて慎重に検討していただきたいという思いもある。
[委員意見]大学入試の在り方が高校教育の改善の足かせになっている面は否定できない。大学入試によって高校教育に影響を与えるという発想は必ずしも悪いことではない。
[委員意見]入試に過大な期待を寄せたのは反省すべきだが、入試が高校教育のあり方に大きな影響を与えていることに目を背けてはならない。(後略)
[外部有識者・団体意見]予備校関係者の立場から見ると、大学入試は事実上高校までの教育の目標となっており、教育に対して極めて大きな影響を持っている。とりわけ共通テストは決定的な影響力を持っていると考えざるを得ない
(pp. 8-9, 太字は引用者)

「入試が高校での学びに影響を与える」という点は否定しないが、現状、「入試を変えることで、教員の指導法が劇的に変わる」ことを示すエビデンスは一切ない。したがって、この点について今議論しても、不毛なように思われる。
気になったのは、この主張の前提として、「今の入試は高校での学びに悪影響を与えている」という考えが一定数見られることだ。

[委員及び外部有識者・団体意見]大学入試による高校教育への悪影響の排除は、大学入試の原則の一つ。入試改革に当たっては、大学入試に求められる原理原則を厳守した上で、高校教育にできるだけ悪影響を与えない方向で改善していくことが重要ではないか。
[委員意見]高校と大学は目的が異なっており、小・中・高を接続するのと全く同じ発想で高・大接続することはできないかもしれないが、入試が高校に悪影響を与えず、好影響を与えるような改善はしていく必要。(p. 8, 太字は引用者)

ここで言われている「悪影響」とは、明示はされていないものの、文法訳読法への批判と考えて問題ないだろう。要するに、「文法を学び、英文を訳す——なんて勉強やっても、英語をしゃべれるようにはならないよ。これからは、コミュニケーション重視の指導法を!」ということだろう。そして、リーディングを重視する今の大学入試では、高校教育に「悪影響」を与えてしまう。その解決策として、民間試験導入を切り札と考えているのが以下の主張からもよくわかる。

[外部有識者・団体意見]大学入試で英語4技能を課さないと高校教育は変わらない。大学入試で英語4技能を課すことで、教師全体の能力向上につながるのではないか。
[外部有識者・団体意見]英語4技能に限れば、大学入試を変えずに高校教育を変えることは困難。高校教育に英語4技能を育成するうえでの課題を聞くと、生徒や保護者には英語4技能の重要性を理解してもらうことが大変だという声が多い。保護者からは、入試で使わないのに必要なのかという声があると聞く。(p. 9, 太字は引用者)

以上が賛成派意見のまとめである(筆者自身が民間試験導入反対派であるため、多少偏りのある抜粋の仕方になってしまった感は否めないが)。次は「反対派」の主張。

反対派の意見

まず、「入試を変えることで高校での学びが変わる」という波及効果論についての批判の声がこちら。

[外部有識者・団体意見]1990年代から世界各地で行われた実証研究によれば、テストの質が教育に対し直接的な波及効果を与えるわけではなく、教員の指導方法等の影響が大きいため、単にテストを変えるのみでは、教育が改善する効果は限定的。

ご指摘の通り、波及効果研究は、Alderson & Wall (1993) を嚆矢として、今日に至るまで世界各国で行われている——が、この主張には重大な問題が2つある。まず、日本における波及効果の研究が不足していること。海外の事例を参考にするのを完全には否定しないが、その事例が日本にも当てはまるか(外的妥当性が保証されているか)、注意して該当する研究結果の知見を利用しなければならない。
次に、波及効果研究のリサーチデザインの不備だ。これについては、寺沢 (2019) で詳述されている。
www.hituzi.co.jp
詳しくはそちらを参照されたいが、ざっくり言えば、これまでの波及効果研究は、テストの妥当性 (validity)——テスト作成者がテストで測りたいと思う能力が、実際どの程度測れているか―—を検証することを主眼としており、「入試が変わる→学校での学びが変わる」という因果効果を検証することを目的としていない。また仮に因果効果の検証を目的としていても、因果推論の知識に欠損がある研究者が大多数なため、リサーチデザインに問題がある。そのため、先の外部有識者・団体意見による主張は、一見研究データに基づいているようにも思われるが、実際のところかなり根拠が薄い主張と言える。

お次はこちら。

[外部有識者・団体意見]「入試を変えれば高校生の学習方法が変わる」という議論の前提についても、進学中堅校には当てはまらないという研究成果も出ており、慎重に検討する必要。
[外部有識者・団体意見]高校教育の改善も進みつつあるが、大学入試の影響を受けないということにはならない。入試が変われば、高校生の学修行動が変わるという話は進学中堅校では当てはまらないというが、むしろ、いわゆる進学校の方が大学入試の影響を受けにくいのではないか。(p. 9, 太字は引用者)

ひとつめの主張は、研究成果を紹介しているが、どの研究のことを言っているのだろうか(どなたかわかる方がいましたら、ぜひご教示お願いします)。
どちらも、「学校のレベル」が波及効果に影響を及ぼすのでは? という主張ですな。確かに興味深い視点ではあるが、学校のレベル以外にも、波及効果の程度に影響を与えそうな要素はいくらでもある。例えば、教員の年齢とか、教員の英語力、公立・私立の違い、等。こういった要素を俯瞰的に捉えている研究は今のところ無さそうなので、ぜひやってみようかと。

冒頭でも述べたが、ほとんどの主張が発言者の経験や知人の声をもとに、発言されている、という現状。お金も手間もえげつないほどにかかる大学入試改革を、データじゃなくて「勘」に基づいてやっていると思うと…… いちはやく、実証研究の蓄積が必要です。

「教育政策」って誰がどうやって決めるの?

今回は、「教育政策はどのようにして形成されるのか」をテーマに、上記文献の読書メモを書いていきます。最近だと、「小学校英語導入」「大学入試英語に民間試験を導入」「共通テストに記述式を!」等が話題になりましたが(内、「小学校英語導入」のみが実現)、これってどんな経緯で話が進んでいったのか、よくわかっていませんよね。このことについて考えるうえで、やはり「政策形成のプロセス」については一度きっちり学んでおかねば! と思い、本稿を書いてみることにしました。最終的に教育政策の話に戻ってきますが、まずは公共政策学の文献を参考に、政策が形成・決定されるプロセスについてまとめていきます。

アジェンダとは何か

飲食店に入って最もワクワクすることは何か。それはお店のメニューを見ることである——というのは私だけではないだろう。何か食べたいものがあってその店に入るということもあるが、たいたいはその店のメニューをみて、食べたいものを選ぶことが多い。「あ、このハンバーグ、テレビで紹介されてたやつだ」とか「今日は寒いからもつ煮でも頼もうかなぁ」とか、その時々のブームに影響されることもあるだろう。

なんだかヘンテコな導入になってしまったが、政策決定のプロセスもこれと似ている。飲食店と同様に、政策にも ”メニュー” があり、その時々のブーム*1に応じて、何を俎上にのせるかを決める。

この政策の ”メニュー” のことを政治学では「アジェンダ」と呼ぶ。アジェンダの定義は次の通り。

アジェンダとは、政策決定者や政策決定に密接にかかわる政府内外の人々が注意を払う論点、課題、因果関係に関する知見、シンボル、代替案・解決策のリストであると定義される(Birkland, 1997, p. 8)。(秋吉他, 2015, p. 50)

したがって、ある対策が検討されるためには、まずその課題がアジェンダにのることが必要条件となる。そうして、ある課題が政策課題と認定されて初めて、政策案の形成が行われる。

「公衆アジェンダ」と「政策アジェンダ

アジェンダは、大別すると、「公衆アジェンダ (public agenda)」と「政策アジェンダ (policy agenda)」の2つに分けられる。

公衆アジェンダとは一般大衆が注目する課題のリストであり、政策アジェンダとは政策決定に関与する政府内部のアクターが注目する課題のリストである。政策アジェンダは公衆アジェンダから絞り込まれた、より短いリストであるが、一部の課題は大衆の注目を集めないうちに政策決定者に注目され、政策アジェンダにのってしまう場合もある。(同上, p. 53)

上記の2つに加え、「決定アジェンダ (decisional agenda)」と「メディア・アジェンダ (media agenda)」というのもあるらしい。

(決定アジェンダとは)政策アジェンダが意思決定に向けてさらに絞り込まれた短いリストである。課題が決定アジェンダにのったとしても、同様の課題が決定を待って列をなしているため、必ず政策出力につながるわけではないが、政策決定の対象として真剣に考慮されるという意味で、政策出力に至る可能性は高くなる。(中略)
 マス・メディア研究では、マス・メディアが報道する段階のアジェンダをメディア・アジェンダ (media agenda) と呼び、公衆アジェンダから区別することがある。マス・メディアが世論にどれほどの影響をもつかが興味の中心だからである。しかし、公衆アジェンダをとらえるのは困難であるため、公共政策研究では、マス・メディア報道を指標とする事が多い。事実上メディア・アジェンダと公衆アジェンダが同一視されてきたのである。(同上, pp. 53-54)

以上を図にまとめると、こんな感じだろうか(余計わかりにくい?)。

f:id:Sudos:20210221195126j:plain
アジェンダ4種類

アジェンダと選挙の関係

アジェンダを左右するのは政治家だが、その政治家の行動に最も大きな影響を与えるのは選挙だ。だからこそ、アジェンダに影響する要素として、政権交代や首相交代は重要な意味を持つ。もちろんこれは教育政策にも当てはまることで、例えば寺沢 (2020) は、第二次安倍政権(2012年12月)以前と以降では、政策過程の流れが大きく異なると指摘している。

 極端な話、2000年代までは文科省内部の動きを見るだけで大方の流れを理解できた。一方、2010年代は、政策過程が複雑化する。第一に主導権を握った官邸サイド、第二にその要求の具体化を担う文科省、第三に2012年以降政権与党となった自由民主党の文教政策に注目する必要がある。その結果として、関係する政策会議も多様化した。(中略)
 この原因は、直接的には第二次安倍政権(2010年12月)以降の官邸主導の教育改革、特に同内閣に設置された教育再生実行会議(2013年1月発足)である。(pp. 110-111)

このように、政策過程の分析には、議事録の分析だけでなく、そもそもなぜその課題がアジェンダにのったのか、影響を与えた要因は何か、といったことを様々な視点から考える必要がある——ということですな。重大事件・社会的指標の発表・選挙の前後を比較することの重要性はよくわかったので心がけようかと。

ただ、「政策過程を左右する要因はいろいろあるから、気をつけよう!」とだけ言われても、なんだかパッとしないと思うんですよね。例えば「○○政策に影響を与えたのは、△△と◇◇と◎◎ と考えられる」と誰かが言えば、「私は特に△△が影響を与えたと思う」とか「私はむしろ✖✖だと思う」みたいに、意見もいろいろ出てしまうような気がします。やはりここは研究者らしく ”理論” が欲しい! ってことで、次回はアジェンダを用いた政策過程の理論で有名な、キングダンの「政策の窓モデル」についてまとめていこうと思います。

*1:具体的には、重大事件(COVID-19や3.11 など)、社会指標(交通事故死亡者数や高齢化率)、選挙、政策案などがアジェンダに影響する)

定期的にチェックしたいジャーナルの一覧(随時更新)

「英語教育」「教育経済学」「教育社会学」などに関して、定期的にチェックしておきたいジャーナルをここにまとめていきます。あまりに多くを載せすぎると目がまわりそうなので、10誌程度にとどめたいと思います。あくまで私的なメモではありますが、関心が近い方は参考にしてください。また、ご指摘・ご助言があれば、ぜひお願いします。

英語教育

教育経済学

教育社会学

「理論と方法」(東京大学社会科学研究所)[3, 9月]

毎月発行されるジャーナルはいいとして、偶数月とか奇数月とか3n-1月とかはいちいち覚えてられないので、表にしてみました。部屋に貼っておこ。

f:id:Sudos:20210220193703p:plain

「大学入試改革」に関する研究テーマをメモしておこうかと ① (文部科学省, 2021)

書誌情報

文部科学省 (2021) 「これまでの主な意見の概要(第1回~第20回)」


「大学入試のあり方に関する検討会議」は、2020年1月15日に第1回が実施され、本稿執筆時点までに計21回行われてきました(ちなみに、第22回は3月4日に開催される模様)。これまでの議事録は、文科省のホームページに掲載されているものの、さすがに21回分をすべて見るのは面倒だなぁ——と思っていた矢先、「これまでの主な意見の概要(以下、「本資料」と呼ぶ)」というナイスな配布資料が公開されていました。本稿ではこの資料をもとに、大学入試改革に関する研究テーマを洗い出そうと思います。

 本資料の構成は次の通り。

  1. 入試改革全体の経緯
  2. 高校教育、大学教育と大学入試との関係
  3. 大学入試のあり方と現状
  4. 大学入学共通テストの位置付けと各大学の個別入試との関係
  5. 英語4技能の育成・評価
  6. 記述式問題の導入
  7. 格差の解消・障碍者への配慮
  8. その他

計65ページにわたって、これまでの会議内での発言がまとめられています。すべてを取り上げるのは大変だし、そんなに興味もないので、私の研究テーマと関連のある章に絞って、ログとして残しておきたい内容と、それに対するコメントを記していきます。

今回は、「1. 入試改革全体の経緯」から気になったところをいくつか。

「入試改革全体の経緯」から抜粋

[委員意見]英語民間試験の導入と記述式が2つの目玉政策になっていった経緯が不明。議論が始まった頃は、学力不問入試などが大きなテーマであったが、議論の中心が学力の不問から、国公立を中心とした共通試験に変わっていったのはなぜか。

たしかに、この種の政策過程に関する研究は不足しているように思われる。特に民間試験導入に関しては、南風原 (2018)鳥飼 (2020) で指摘されているように、2016年3月31日に発表された「高大接続システム改革会議」の最終報告から、文科省が2016年8月31日に発表した「高大接続改革の進捗状況について」の5か月の間に飛躍的な変化が生じており、「謎の5か月間」(鳥飼, 2020)と表現されている。

[外部有識者・団体意見]これまでの議論では、理念やエビデンスの検証が十分ではなかった。例えば、「思考力・判断力」「英語4技能をバランス良く」といった理念の定義が曖昧であり、英語4技能が日本の大学で学ぶうえで均等に必要なのかといった議論も十分に行われなかった。

「理念やエビデンスの検証が十分ではなかった」という指摘は、筆者も全面的に賛成する。特に、「英語民間試験を導入することで、高校での英語指導をコミュニケーション重視に変えられる」ことを示すエビデンスは、現状一切ない*1

また、ご指摘の通り、大学で研究活動をするうえで、果たして4技能が均等に必要なのだろうか。もっとも、「4技能」とは言っているものの、その中で「スピーキング」が重要視されているのは周知のことであろう。それをふまえて話を広げれば、「何のために・どの程度、日本人の英語を話す力を向上させたいのか」はっきりしない部分が多い。このことに関連して、苅谷 (2020) は以下のように述べている。

 この性急とも言える英語入試改革を後押ししているのは、英語を何年も学んでいるのに「日本人は英語を話せない」というコンプレックスである。小学校教員のほとんどが英語を教えるだけの十分な知識を持たないにもかかわらず、小学校への英語教育への導入が多くの支持を集めるのも、生徒や教員の能力を無視して、中学校や高校での英語の授業は英語だけで行うことを求めるのも、この、英語を話せない日本人という根強い劣等感があるからだ。
 だが、万事がうまく運んだとしても(そうはならないだろうが)、「英語を話せる日本人」が今よりずっと増えた後に、いったい何が期待されているのか。その点は、いたって曖昧なままである。(中略)
 たとえ改革がうまくいったとしても、多少の英会話ができる日本人が増える程度の変化しか起こらないだろう。頭の中で複雑な事柄を英語で考える能力抜きには、「英会話」を超えたコミュニケーションの道具として、英語を使いこなせる水準には到達できないからだ。
 「英語を話せる日本人」を増やしたい、だがその後の見通しは曖昧なまま。万事うまくいき、たとえ英会話が多少できる日本人が増えたとしても、改革にかけるコストとリスクは膨大すぎる。それでも改革が断行されるのは、「英語が話せる日本人」が増えた「その後」への想像力が貧困なためだ。
 英語を話せるようになった後に、日本人・日本社会は何がしたいのか。劣等感の裏返しは、空虚な理想の実現でしかない。(pp. 196-197, 太字は引用者)

外国語を「完璧に」習得するのは不可能に近く、たとえ可能だとしてもコストが割に合わない。だからこそ、自分がどの程度のスキルを身につけたいのか把握したうえで、学習に取り掛かることが重要だと思う。しかし、現在の日本における英語教育はゴールがきわめて曖昧だ。多くの学習者が「英語がペラペラにしゃべれること」を理想としており、その理想と現実のギャップに日々苦しんでいる。「何のために英語を勉強するのか」と聞かれれば、「外国の人とお友達になれるから」とか「将来の役に立つから」といった答えが一般的*2で、想定される英語の使用場面もかなり曖昧だ。現状の教育改革を多少誇張して表現すれば、


「何で俺らは英語が話せないんだ!」→「学校教育が悪いからだ!」→「よし! 小学校から英語学習を開始しよう!」「よし! 中高の授業、オールイングリッシュでやってみようぜ!」


とか


「何で俺らは英語が話せないんだ!」→「『受験英語』のせいだ!」→「お? じゃあ入試にスピーキングぶち込んでやればいいんじゃね?」→「間違いないとプール! ポンポンポーン!(^^)!」


みたいな感じになるだろうか。考え方がきわめて楽観的で、アマアマすぎ。

「入試改革の検討のあり方」から抜粋

[委員意見]従前の入試の何が課題だったのかをよく整理する必要。例えば、英語のスピーキングについて、読解力である程度のレベルの学生を採った上で、大学でしっかり教育していくことには限界があったのか、それとも入試段階で欲しい人材が選抜できていなかったからなのか。

約30年にわたり実施されてきた大学入試センター試験は、2021年をもって、突如廃止された。ここで問題なのが、ご指摘の通り、センター試験の功績についての研究がほとんどなされていない——という点だ。センター試験により達成されたこと、あるいは、達成されなかったことを整理せずして、どうして入試改革と呼べるのだろうか。

[外部有識者・団体意見]大学入試改革は副作用が大変大きい。理念から出発すると必ず混乱が起こるし、意図しない影響が生じる。このため、こういう改革をしたらこういう影響が生じる、という出口からの議論が必要。

試験で4技能を測定するのとしないの、どちらが良い?——と単純に考えてはならない。ご指摘の通り、大学入試改革のようなコストの高い政策を考察する際には、その正の効果だけでなく負の効果を考慮する必要がある。近年の教育政策はこの視点が大きく欠けているように思われる。苅谷 ・増田 (2006) も同趣旨の指摘をしている。

苅谷 これは日本の教育というものを論じる本質的な問題だと思っているんだけど、要するに教育を論じるときに、ポジティブリストで考えるかネガティブリストで考えるかということです。
増田 ポジティブリストとネガティブリストですか?
苅谷 つまり、いいと思うものをどんどん挙げて、リストに付け加えていくわけです。「こんなふうに、できたらいいな」ということをつぎつぎと書いていくと、そのリストのすべてのことができたときには完璧な人間が育つみたいな考えが、ポジティブリストの考え方です。反対に、そんなことは無理だから、「最低限こんなことにはならないようにして、あとは放っておけ」というふうに考えてリストを作るのがネガティブリストの考え方。やらなきゃならないこと(やりたいこと)をすべてリストアップするのと、最低限のことだけ書いて、あとは放っておけばいいというのとでは、物事の考え方が違う。
 日本の教育って、完成品をつくるための完全なポジティブリスト主義に、どんどんなっているように見えます。(p. 45)

日本の教育は、ネガティブリストの視点が欠けている。いいと思うものをリストにどんどん付け加えていくのではなく、その効果に関するエビデンスはどれほど確かなものなのか、さらに、その政策を行うことで犠牲になるものはないのか。これらの点について冷静に考慮されるべきだ。同様の指摘が本資料でも見られる。

[外部有識者・団体意見]改革には、それによって得られるメリットと、その実現に掛かるコストがある。教育も例外ではなく、費用対効果のバランスを取って議論する必要がある。
[委員意見]大学への入試の実態把握は重要であり、現状のリサーチとアセスメントから始めるべき。政策決定過程の問題として、意思決定としてのエビデンスが活用されておらず、記述試験の合理性や必要性、ステークホルダーの参加がなかった。今回の実態調査のように、入試実態の検証を踏まえて、改革の検討を行っていくべき。

費用対効果の視点の欠如エビデンスの軽視、今回の入試改革の「失敗」の原因は、これらの二つに大きく関係しているのではないだろうか。後者については、以前とある学会でこの問題についての質問をしたところ、次のような回答を得られた。「確かに『結論ありき』で議論が進められている傾向は否めない。ただし、すべての官僚がこのような精神をもっているわけではない。中には、こちらの意見に耳を傾けてくれる官僚もいる。そういった官僚と出会った際に、その機を活かすことが重要だ」との回答をいただいた。今できることは、その機に備え、研究を蓄積しておくことではないかと思う。

この点については次項で扱う「専門的知見や当事者の意見」でも指摘されている。

「専門的知見や当事者の意見」から抜粋

[委員意見]英語4技能も記述式も、何年も前から専門家が問題を指摘し続けたにもかかわらず、意見が反映されることなく、土壇場で見送りとなり大混乱を招いた。犯人捜しをするという意味ではなく、同じ失敗を繰り返さないために、経緯の検証を徹底的に行う必要。
[外部有識者・団体意見]入試改革の経緯として、文科省の会議体から慎重論の専門家が排除され、これらの会議の一部は非公開にされた。さらには、学会等からの提言やパブリックコメントの結果も無視された。
[外部有識者・団体意見]共通テスト記述式について、高大接続システム改革会議においては様々な課題が指摘されていたにもかかわらず、テストの専門家がいない検討・準備グループにおいて、テスト実施の具体策が決められていった。

このように、入試改革の「経緯」について、不透明性や専門的知見の軽視が問題であったとされている。
以上の内容をもとに、今後検討されるべき研究課題を提示したい。

研究テーマのまとめ

1. 英語民間試験と記述式の導入は、どのようにして2020年度の入試改革の目玉政策となったのか
 - どのような利害関係が発生していたのか
 - 「謎の5か月間」で何が起きたのか
 -学会等からの提言、専門家の指摘はその経緯にどのような影響を与えたのか


2. 「英語が話せる日本人」を増やすことの目的とその妥当性の検証
 - 何のために「英語が話せる日本人」を増やしたいのか
 - その目的は妥当なものか
 - そこで想定される英語力はいか程なものか

3. 大学入試センター試験の功罪
 - センター試験の何が問題だったのか
 -センター試験の導入により、どのようなことが達成されたか
 -共通テストはその問題点を克服できているのか

4. 民間試験導入による正の効果・負の効果は、どのようなものが想定されるか
 - 期待される正の効果の確からしさはどれくらいか(エビデンスはあるのか)
 - この改革により、犠牲になるものはないのか
 - もっと費用対効果の高い教育政策はないのか

*1:詳しくは、須藤 (2021) をご覧ください。3月中には公開される予定です。

*2:英語学習の目的について、国ごとの違いを分析した研究ってないですかね? もし知っている方いましたら、ご教示お願いします。