SSudo's Lab

須藤爽のブログです。専門は英語教育政策。重要だと思った文献のログ・感想を残していきます。

村上・橋野 (2020) を英語教育政策に照らして読む:序章と1章

書誌情報:村上祐介・橋野晶寛 (2020) 『教育政策・行政の考え方』有斐閣

本書は教育政策・行政における重要な理論や概念について紹介する「教科書」的文献。教科書というだけあって初学者にも理解しやすく整理されていながら、一般的な教科書レベルの水準ははるかに超えている。理論的な概念の説明をただ体系的に述べるのではなく、それぞれについて切れ味鋭い解説が記されており、「英語」教育政策が専門である私にとっても、かなり勉強になった一冊。

本文献を「言語教育政策に引き寄せて読もう」という趣旨の読書会に参加させていただいた。本ブログではその読書会で得た知識・発想を存分に参考にしながら、本文献を「英語教育政策」に照らして考察してみたい。まずは、序章と1章。

序章

・本書では教育行政の研究目的を大きく3つに整理している:

①教育において望ましい価値や帰結は何か、②望ましい帰結や価値があるとして、一定の制約の中でそれをどのように効率的に実現するのか、③望ましい価値・帰結やそれを実現するための政策は誰がどのように決めるのか。(p. 6)

・この分類は、当書の問題関心を整理するために便宜的に作成されたものにすぎないが、政策研究を整理するうえで有用なものだろう。この分類に基づいて、英語民間試験導入問題を整理した論文を書いてみようかなぁ、なんて思ったり。

・2000年代の教育政策の特徴として、NPMが紹介されている。

2000年代のもう1つの変化は、NPM(新公共管理)と呼ばれる考え方の普及である。端的には、民間部門の理念や考え方を行政に採り入れてその効率化を図ろうとするものであるが、教育分野でもNPM的な改革が一定程度行われるようになった。その1つの例は事前統制から事後統制へのシフト、言い換えれば入口管理から出口管理を重視する変化である。(p. 12, 下線は引用者)


・英語教育の分野でも、NPMの考え方はかなり浸透している。代表的な例が、英語民間試験導入や都立高校へのスピーキング試験導入などを含む、入試制度の改革であろう。その教育課程の「出口」にあたる入試を改革することで、学校教育を改善しよう——という魂胆。出口をいじることで、その過程に間接的に影響を与えることを一つの目的としている。過程それ自体についての議論はほとんどなされていない。教育のナカミの議論は測定ができない。一方で、入試はまさにNPMの発想と親和性が高い。だから、出口をいじる施策ばかりが形成されやすい。

1章

・教育の性質を「個人のため/社会のため」「自己目的/手段」で分類している。前者はもう少し堅い言葉で言えば、「私事性/公共性」とも表せる。
・例えば、2020年度の民間試験導入問題でその根拠として出された「ヨーロッパ・アメリカに追いつくためには、大胆な英語教育改革が必要」という意見は、英語教育を「社会的のため」の「手段」としての教育(=社会の形成・維持としての教育)——と捉えていると解釈できる。一方で、余暇活動としての・楽しみとしての英語学習は「個人のため」の「自己目的」としての教育(=消費としての教育)——ということになる。
・英語教育政策でたびたび話題にあがるのは、「社会の形成・維持としての教育」。ここでは、英語を一つの「人的資本」「言語資本」と考え、日本人の英語力を向上させることで、国家の経済的利益につながる——という言語道具主義の思想が根本にある。
・保護者・生徒は、「個人のため」の「手段」、つまり、私的投資として英語教育を捉えている。一方で、政策立案者・教員が想定するのは、「社会のため」の教育。このギャップが不満・混乱の原因となっている?
・じゃあ、教師と生徒・保護者の「教育の目的」を一致させればいいのだ! というのは早計。当書の記述からは脱線するが、広田 (2022) は学校の社会的機能として、①(子どもたちの)社会化と、②選抜・配分の2つをあげている。そして、NPMが横行する現代では、後者の選抜・配分の機能が暴走し、それ自体が自目的化してしまう傾向にあると警鐘を鳴らしている。その結果、「テストの成績を上げることを目的にした教育・学習」が重視され、本来の「教育の目的」から逸れた教育や学習が発生している。この点について、広田は次のように述べている。

では、どうしたらいいのでしょうか。私は、一つには、教師の理想や理念と生徒の現実的な思惑との間にズレがあればいいのだと思っています。教師は「教育の目的」を見失わないようにしながら、教えていることの意義や面白さを、自分で明確に意識しながら教えるべきだと思うのです。
 教師自身が、「この内容は面白いし学ぶ意義も大きい」と思って教え方を工夫したりすれば、教師が教えてくれることの中身を「面白い」と思う子どもも、もっと増えるでしょう。ただし、子どもたちの多くは、その中身に興味を持たないかもしれません。でも、そういう子どもたちも、「定期試験があるから」「入試があるから」、勉強はしてくれるでしょう。(p. 77)


なるほど、「教師の理想や理念と生徒の現実的な思惑との間にズレがあればいい」という指摘は言いえて妙である。「保護者・生徒と教員が想定する教育の性質のギャップが混乱をもたらす要因の一つとなっている」と先述したが、むしろ、両者が噛み合うことの方が異常なのかもしれない。NPMの影響が特に強い英語教育では、かつ、普段の生活の中で英語学習の意義を感じにくい日本では、「テストの点数を上げるため」以外の学習動機を生徒に持たせることは難しい。教師側にしても、教育の目的を達成するために「テストのために勉強する」ことを全否定することは、「教師 vs. 生徒&保護者」の対立をますます悪化させることにつながるため、建設的な解決策ではない。だからこそ、生徒の意識改変をはかることをある意味であきらめる必要がある。

重要なのは、そこで教師側が教育の目的を生徒と一致させる、つまり、教師側も「テスト・試験のための授業」に専心するのではなく、生徒・保護者側のニーズを受け止めながら、でも完全には受け入れず、本来の「教育の目的」を達成することに注力することである。要するに、生徒・保護者の心が離れないように配慮しつつ、でもそのニーズに多少は抗いながら、教育の目的を達成するための教育活動を行うことが教員に求められている——ということになる。

英語教育の話に戻す。以上を勘案すると、やはり重要になってくるのは、大津 (2021) が指摘するような「しっかりとした言語観(外国語観を含む)と言語教育観」を教員が確立させることである。端的に言えば、教員の腕次第——ということになってしまうのだが、この点を教師個人の責任に転嫁するのではなく、教員養成・研修制度を通じてどのような行政的制度を構築すべきか、どのような行政的サポートが行えるかという点が重要。そして、この投稿の前半でも述べたことだが、そのためには、その取り組みの根本にある「英語教育の目的」つまり「なぜ英語を勉強するのか」を議論することが最重要事項。現状、英語教育界隈では、多種多様な「英語教育の目的」が好き勝手に語られており、想定される「英語教育の目的」はかなり不安定なものになっている。また、英語教育の目的に焦点をあてた研究はゼロではないものの(例えば、寺沢 (2014))、あまり注目されていないことは確か。

「英語教育・日本人の対外発信力の改善に向けて(アクションプラン)」について一言二言

書誌情報:
文部科学省 (2022)「英語教育・日本人の対外発信力の改善に向けて(アクションプラン)」
https://www.mext.go.jp/a_menu/other/mext_01982.html

やっぱ、そうなってしまうわな

私立大学等改革総合支援事業(私立大学等経常費補助金)における調査項目を見直し、4技能の総合的な英語力を評価した入試を行っている大学に対し加点する。(p. 9)

2020年度の共通テストへの民間試験導入は頓挫したものの、その結果、断念されたのは「民間試験の受験資格及び卒業要件としての活用」と「共通テストから民間試験への一本化」の道筋であって、「大学入試における4技能の評価」と「民間試験の活用」という流れは1986年の臨時教育審議会を端緒として今日までなお健在(須藤, 2022)。今後も注視が必要。

つっこみどころ1:「CEFR A1レベル(英検3級)」「CEFR A2レベル(英検準2級)」

中高生の英語力の評価として「CEFRの目標値が未達」(p. 1)と書かれている 。もともとは到達指標であったCEFR が到達目標と曲解されてしまっている点は置いといて、ここで注目したいのは「CEFR A1レベル(英検3級)」「CEFR A2レベル(英検準2級)」という文言。あたかも英検とCEFR がきっちり対応しているかのように見えてしまうが、実際のところ、「A1レベル=英検3級/A2レベル=英検準2級」というのは、かなりあやしい。このことをめぐって、2020年度の大学入試改革に関する政策論議ではけっこう議論されていたと記憶しているが、もはや当たり前のようにサラッと書かれているのは危険なように思う。

もう一言。「CEFRで英語教育の取り組みを評価しています! グローバルスタンダードです!」という意図で、CEFR を使った業績報告をしているのだろうが、実際のところ、中高生の英語力の指標として使われているのは英検がほとんど。CEFR と言われると、2020年度の英語民間試験導入問題で話題となった各試験の対応表が連想され、結果として、TOEFLやIELTS などの民間試験も思い浮かべてしまう。英検もそれらと並ぶ「グローバルスタンダード」な試験である——というイメージが、あの民間試験導入問題により持ちやすくなったのではないだろうか。その意味で、2020年度の民間試験導入の政策は、失敗には終わったものの、英検に箔をつけるという意味では「成功」したと言えるのかもしれない。

つっこみどころ2:中身のない「大学英語教育」議論

大学入学後の英語教育についていろいろ提示されている。

学生の英語力の目標値設定及び達成支援、学修成果・教育成果の把握・可視化など、各大学における総合的な英語力の育成・評価の取組を好事例として周知を図り、各大学の取組を促進する。 (p. 10)

まぁ、言っていることはよくわかるんだけど、「手段」を考える前にまずは「目的」を深く議論すべきではないだろうか。村上・橋野 (2020) の整理に従えば、教育政策の理論的な問いは、①教育において望ましい価値や帰結は何か、②望ましい帰結や価値があるとして、一定の制約の中でそれをどのように効率的に実現するのか、③望ましい価値・帰結やそれを実現するための政策は誰がどのように決めるのか、の3つに大別される。このアクションプランでは、②の「手段」に関する内容のみが記されており、①で記されているような、大学の英語教育は何のためにあるのかという「目的」に関する記述が十分ではない。英語教育の「目的」についての議論が不足しがちなのは、大学英語教育に限らず、英語教育政策あるあるの一つ。

つっこみどころ3:供給サイドから受給サイドへ

こうした取組を進める上では、従来、文部科学省の施策の中心であった授業の改善のみならず、これまでは強く意識されてこなかった、教育課程外・学校外の活動の充実も必要。とりわけ、若者が海外に飛び出して文化や価値観の多様性に触れ、世界中の多様な人々と協働する力や広い視野で課題に挑戦する力を身に付けることが重要。(p. 5)

教育課程・学校の整備もままならないのに、外の活動の充実を求めようとしているのは無謀。教員の多忙化や人員不足など、学校内に関することで早急に解決すべき問題は多数あるはずなのに、教育条件整備にはなかなか目が向かない。小川 (2019) で指摘されているように、教育を提供する側(供給サイド)から教育を受ける側(受給サイド)へと優先順位がシフトしていることを証明する好例。

つっこみどころ4:データがやっぱりひどい

スライド2枚目のデータが本当にひどい。

各国における受験者数や受検者層は異なるため、スコア差が各国の英語力差をそのまま表しているわけではないことに留意が必要ではあるが、各種の英語資格・検定試験において、我が国の平均スコアは諸外国の中で最下位クラス。(下線は引用者)


下線の内容を譲歩として示すことで、なんだか大した問題ではないかのように感じてしまうが、いやいや大問題でしょ。

つっこみどころはたくさんあるが、もっとも興味深いのが、TOEIC のスピーキングテストの日本のスコアが香港よりも高いという点。このデータを「日本人のスピーキング力が低いことの根拠」として本気で使っているなら、このデータが示す「日本人は香港人よりもスピーキング力が高い」という意外過ぎる事実をどう説明するのだろうか。あと、TOEIC って、日本以外の国で需要あるんすか? 受験する動機は何なのだろうか。

外国語教育は「必ずしも英語である必要はない」わけではない:「新英語教育研究会」シンポジウム (2022) の感想

7月30日に開催された新英語教育研究会のシンポジウムを拝聴しました。
最初に、鳥飼玖美子氏、大津由紀夫氏、斎藤兆史氏、江利川春雄氏からそれぞれ20分ずつ問題提起が行われ、その後40分程度で自由討論という流れでした。


全体的に面白かったので満足はしています、が、ひとつ気になったのが、やっぱり「英語」教育の話をするのね――という点(まぁ、学会名が「新英語教育学会」なので、当然と言えば当然なのかもしれませんが)。以下、それについて感想を記します。


斎藤氏を除く3人が「外国語教育」という用語をスライドに含めていたり、鳥飼氏については「異文化コミュニケーション」「多言語多文化主義」、大津氏については「複言語主義」という用語がスライドに記されていたり、3人の論者が多少なりとも英語以外の外国語への配慮を示している点はうかがえたが、それについて深く議論がされることはなく、結局は「これからの『英語』教育はどうあるべきか」という議論に終始していた(特に最後の方は、英語教育における英文法の位置づけであったり、英語教員向けの英語学習法であったり)。英語帝国主義の立場から見た日本の外国語教育の問題点の指摘や、もっと言えば、日本の英語教育における「英語=北米の標準英語・イギリス英語」というモノリンガル・バイアスの話などの議論をもっと聞きたかったなぁ、と個人的には思う。


最後に大津氏が江利川氏に対して、「日本の教育で教科として外国語教育を行うことの最大のメリットは何か」という趣旨の質問を投げかけた。「英語教育」ではなくて「外国語教育」と確かにおっしゃっていた。


これに対して江利川氏は「外国語を学ぶことで、母語の認識を高めることができる点」という趣旨の発言をされた(多少言い方は違ったかもしれないが)。この発言の内容は、大津氏がスライドで提示していた内容と重なる部分が大いにある。


大津氏のシンポジウムでの発表内容を大まかにまとめると、次のようになる。

  • 言語 (a language) とことば (language) を区別することがダイジ
  • しかし、日本の外国語教育では後者の視点が軽視されがち
  • それぞれの言語の「個別性」「多様性」のみに注目するのではなく、ことばの「普遍性」に注目することが重要
  • そのためには、国語教育と外国語教育の接続性を重視し、生徒・児童が「ことばへの気づき (metalinguistic awareness)」を体験できるよう促すことが教員に求められる
  • それは必ずしも英語である必要はない(この点について、発表の際はあまり触れられていなかったが、事前配布のスライドには記されている)


外国語を学ぶことで母語との類似・差異を認識し、「ことばへの気づき」が生まれる——という意見には全面的に賛成する。個人的にも、外国語を学ぶことの最大の意義は、「ことばへの気づき」を通じて母語の理解を深めること——にあると思っているので、この点については大津氏、それから、先述した江利川氏の主張に対して異論は全くない。


一方で、母語との類似・差異を深く理解するためには、その外国語についての知識がかなりの程度必要になる。単純に、語順の違いだとか、発音の違いだとかを母語と比較するだけであれば、表層的な理解でも十分なのかもしれないが、果たしてそのレベルの「ことばへの気づき」で母語の認識が高まったり、母語の理解が深まったりするだろうか。


個人的な経験を述べさせてもらうと、私が英語学習を通じて「ことばへの気づき」が生まれ、結果的に母語の理解が数段高まったと感じた経験のなかで最も鮮明に覚えているのは、以下の日本語文とその翻訳を見たときである。

ゴーシュは町の活動写真館でセロを弾く係でした。けれどもあんまり上手でないという評判でした。上手でないどころではなく、実は仲間の楽手のなかではいちばん下手でしたから、いつでも楽長にいじめられるのでした。(宮沢賢治セロ弾きのゴーシュ」)



Gauche played the cello in the orchestra for the town theater. But his reputation wasn’t very good. In fact he was the worst of all the musicians, so the conductor was always picking on him. (‘Gauche the Cellist’ translated by Paul Quirk)

これは学部生時代に、翻訳の授業で眞野泰先生の授業で紹介されたもの。日本語文とその翻訳を比較して、気づいたことを言ってみよう——という課題だった。


この課題に答えがあるわけではないのだろうが、眞野先生の意図は、日本語の「は」という副助詞の強力さについて痛感させることにあった。見てわかるように、日本語文では一文目で「ゴーシュは」と言ってから、2文・3文目では主語が記されていない。一文目の「は」の残像が残っているからだ。


一方、英語では、いちいち主語を書かないといけない。日本語のように、一文目で「〇〇は」を記し、それ以降は述語を工夫すれば主語を書かなくても自然に読める――というわけにはいかない。個人的にはこの経験を通じて、日本語の「は」と「が」に対する理解が数段高まったと感じている(そのときに高まったというより、自分の母語に対する無知を自覚することができ、その後の勉強につながったのだが)。今では日本語で「は」を使うとき、けっこう注意して使うようになっている。


さて、上記が個人的な「外国語学習を通じて母語の理解が深まった」一例なのだが、このレベルの学習を行うには、その外国語にかなりの程度習熟している必要があるように思う。というのも、先の特徴に気づくためには、少なくとも以下の知識が前提とされるからだ。


・英語の主語が把握できる
・主語を把握するには、品詞(特に名詞)のはたらきについて理解している必要がある
・主語を把握するには、該当する英単語の意味を知っている必要がある


上記の項目に加え、ある程度、英文が「読める」段階になっていないと、ことばへの気づきをもたらすことは難しいのではないだろうか。何を言っているかよくわからない外国語の文章を持ち出されて、「こことここを比較すると日本語と違うよね!」と言われても、あまり感動しない気がする。感動しなければ「気づき」にはつながらず、単に「へー--」で終わってしまう。


もう一つ例を示す。日本語の学習者(日本語を母語としない者)が苦戦する文法事項の一つに「受身」がある。日本語の「受身」の特殊さは、他の言語の「受身」「受動態」と比較してはじめてその特殊さを痛感できるはずである。日本語の受身にはA, B, C という特徴がある一方で、〇〇語の受身にはC, D という特徴がある——という説明を理解してはじめて、日本語の「受身」であったり、その外国語ならではの「受身」の使い方であったりを理解できるはずだ。ここでもその前提として、その外国語の「受身」「受動態」についての知識が求められる。英語に関して言えば、「受動態」を理解するためには、最低限、「be動詞」や「過去分詞」の知識が不可欠であり、そこまで到達するにはそれ相応の時間と労力がかかる。何が言いたいかと言うと、外国語の学習を通じて「ことばへの気づき」を促したいのであれば、ある程度、いや、相当な程度、その外国語に足を踏み入れる必要があるということだ。


逆の例を示すと、私は学部時代にちょっとした興味から、フランス語を2年、ハングルを1年、アラビア語を1年、大学の授業を通じて学んだ。しっかり単位を取るぐらいには学んだのだが、上記のような、母語の認識が深まるような「ことばへの気づき」の経験をしたことはほぼない。もちろん表層的な「ことばへの気づき」はいくらでもあったのだが(例えばアラビア語に関しては、「本当に右から左に書くんだなぁ」とか「母音が3種類しかないんだなぁ」とか「文字で表されるのは子音のみで、子音だけを見て母音を読み取るんだなぁ、すげぇ」とか、そういうレベルの気づきはいくらでもあった)、それらの浅い経験を通じて「母語の認識・理解」の向上という点で寄与した気はあまりしない。いやいや、それはお前の感受性が低いからそうなだけだ——と言われたらどうしようもないのだが、ただ、個人的な感想としては、1年や2年ある外国語を学んだだけで、母語への気づきを促すことはなかなか難しいと思う(もちろん、「母語の理解を深める」という目的以外を考慮するのであれば、上記のような複数の言語を「浅く広く」学ぶ方法も何らかの教育的意義があるのかもしれないが)*1


以上のことから、外国語学習を通じて、「ことばへの気づき」を促す、あるいは、「母語の理解を深める」ためには、その外国語の理解が相当に必要なはず。それにかかる時間と労力を考慮すると、学校教育で扱える言語はやはり一つ(多くても二つ)に絞られ、それは結果的に英語一強へとつながるのではないだろうか。というのも、教員養成課程で、複数の言語を対象に「ことばへの気づき」を生徒に与えられるようなプログラムを組む余裕も、それを指導する側・される側の余裕も、全くないはずだ。この種の理解を生徒にもたらせるかどうかは、かなりの程度、教員の腕にかかってくるはず。教員養成課程で複数の外国語を対象に、「ことばへの気づき」が促せる人材を育成することはきわめて困難であろう。どれかひとつに絞る必要がある。どれかひとつの外国語を深く学ぼう――と言われて、日本の教育事情の中で英語以外の外国語を選択する学習者は果たしてどれくらいいるのだろうか。


よく日本の外国語教育について語られるときに、「必ずしも英語である必要はない」というセリフを耳にする。外国語教育の目的を考えれば、学ぶ外国語は「何でもいい」と。それはおっしゃる通りなんだけど、でも、実際のところ、「何でもいい」と言っている人ほど、英語からは逃げられないという現実をよく理解しているのではないだろうか。「必ずしも英語である必要はない」はだいたい決め台詞として使われることが多く、それを起点として議論が行われることはほぼない。印象としては、「必ずしも英語である必要はない」=「自分は英語帝国主義の理解があります!」という意思表明のフレーズのように聞こえる。この発言が、本気で「日本の外国語教育で、英語以外の外国語を学ぼう!」「そのための方法を考えよう!」ということを意味しているわけではないと思う。みんなうすうすそれに気付いているから、論点として避けられる傾向にあるのではなかろうか。現実は、「『必ずしも英語である必要はない』わけではない」となってしまっていて、おそらくその状態はしばらく変わらない。


外国語教育を通じて、ことば (language) への気づきを得ることの重要性を強く認識する一方で、複言語主義の精神も重視したいというジレンマを抱えている。現実的な案は、英語一強の状態をある程度許容しつつ(=諦めつつ)、その中でも「複言語主義」「異文化理解」に対する精神を養っていく——という感じだろうか。でもそれって、まずは英語を深く学び、それを通じて「ことばへの気づき」を得て母語の理解を深めたうえで、「でも、外国語って英語だけじゃないぜ。他の言語も学ぼうぜ」——みたいなノリなようで、なんか違う気がする。

*1:いやいや、「実感」ではなくそういう「経験」こそがダイジなのだよ。複数の外国語を学んだことで、たとえ「実感」はしていなくても、母語の認識は確かに深まっているから安心したまえ——と言われたらどうしようもないのですが。ただ、学習者がその目的であったり効果を「実感」できない学習に対して、はたして魅力を感じるでしょうか。

兄弟・姉妹の「性別」が子どもの政治・社会的価値観に及ぼす影響

だいぶ前に読んだ文献。因果推論の復習をしたいと思い、改めて読み直した。
以下、要約とコメントを記す。

要約

リサーチクエスチョン

幼少期の経験は、後の政治・社会に対する考え方にどのような影響を与えるか?
=(具体的には)兄弟・姉妹の性別が、子どもの政治・社会に対する考え方にどのような影響を与えるか?

背景

  • 幼少期における家庭環境が後の政治・社会に対する考え方にどのような影響を与えるかは、長年研究されてきたテーマの一つである。しかし、幼少期に個人の選好に影響を与える要因は複数あり、明確に「独立変数:幼少期の家庭環境」→「従属変数:政治的・社会的価値観」という因果関係を示すエビデンスはほぼない。
  • 先行研究のほとんどが、「子ども」と「親」の関係に注目している。つまり、親の考え方が子どもにどれほどの影響を与えるのか――ということをテーマにしている。
  • それに対して本研究では、「親」ではなく、「兄弟」に注目している――と言う意味で、先行研究とのGap がある。具体的には、「兄・弟」と「兄・妹」、「姉・弟」と「姉・妹」を比較することで、兄弟・姉妹のジェンダーの違いがもたらす影響を検証することを目的としている。

方法

(1) ケースセレクション

兄弟・姉妹をもつ者を対象とする。

(2) 処置

以下の組合せが設定されている。
① 「兄・弟」と「兄・妹」
② 「姉・弟」と「姉・妹」

(3) 処置の割当メカニズム

 子どもの性別はランダムに割り当てられる。例えば、第一子として男の子が生まれ、その後、第二子が生まれた際、その性別が男か女かは人為的に操作することはできない。よって、「兄・弟」と「兄・妹」という処置の割当は、無作為に行われており、潜在的結果と独立している、と言える。

(4) 結果変数の測定方法

 本研究では、ミシガン大学の Political Socialization Panel (PSP) とthe children of the National Longitudinal Survey of Youth (NLSY) のデータセットが用いられている。どちらもランダム抽出がされている。これらの質問項目には、対象者の兄弟・姉妹に関する情報に加え、男女の役割についての考え方や、政治に関する考え方を問う項目が含まれている。
 

(5) 実験の実施方法・データ収集の方法

 上述した PSP と NLSY を用いる。PSP は、高校生を対象とし、1965, 1973, 1982, 1997年の4回にわたって追跡調査が実施された。これにより、長いスパンで、兄弟・姉妹の性別が与える影響を観察することができた。さらに、その検証結果のrobustness を評価するために、PSP とは全く異なるデータセットであるNLSY を使用した。本研究では、2006, 2008年に実施された調査結果を用いた。

結果

  • 姉または妹をもつ男性は、そうでない男性と比べて、男女の役割についての考え方が保守的であることがわかった。
  • そしてその傾向は、成人後も変わらない。

インプリケーション

  • 兄弟・姉妹の性別の違いは、子どもの政治的・社会的な考え方に影響を与える。
  • これまでは、「親」から子への影響ばかりが注目されてきたが、「兄弟・姉妹」が子に与える影響も存在する。
  • やはり、家庭環境は、子どもの思想形成に大きな影響を与える。

研究の限界

  • 記載なし

今後の研究の方向性

  • 家庭環境・幼少期の経験が子どもにどのような影響を与えるかを、本実験で用いた自然実験の方法論を参考に研究が行われれば、政治的社会化 [political socialization] の複雑なプロセスを解明することに寄与するだろう。

論文に対するコメント

1. 仮定の妥当性

(1) SUTVA

① No interference between units は満たしていると考えられる。
② Consistency に関しても、満たしていると考えられる。しいて言えば、「年齢の差」について、どのように考慮したのか気になった。例えば、「3歳差の兄と弟」と「10歳差の兄と妹」の場合、「性別」の違いだけでなく「年齢」の違いも影響する可能性があるのではないか。

(2) unconfoundedness

処置が無作為割当であるため、クリアしていると考えられる。

(3) サンプルの代表性

 本研究では、「兄弟・姉妹に女性がいるほど、子どもの社会的・政治的考え方に影響を与える」という仮説を検証するために、PSP のデータセットを用いて検証し、そのうえでNLSY を用いてその結果を再分析している。
しかし、このデータセットについての説明が特に書かれていなく、サンプルの代表性を見極めることができない。もしNLSYやPSP が特定の州からのみサンプルを集めていれば、この研究結果をアメリカ人全体に一般化することはできない。一方で、このデータセットアメリカ人全体から抽出されていれば、この問題はクリアされる。

2. 評価等

(1) 分析結果の解釈の正確性

 リサーチクエスチョン、仮説が明確に記されており、その答えとなるデータと解釈が適切に示されていると思う。

(2) 分析結果の頑健性 (robustness)

 使用したデータセットがランダム抽出であるうえに、一方のデータセットで検証された仮説を、もう一方の全く異なるデータセットで再検証されており、robustness はかなり高いと感じた。

(3) 研究の長所

 「家庭環境が子どもの政治的・社会的考え方にどのような影響を与えるか」という長年テーマとされてきた問いに対して、「生まれてくる子どもの性別」という人間にはコントロールができない割当を用いて自然実験を行い、質の高いエビデンスを提示している。

(4) 研究の短所

① 私が探した限り、「研究の限界」(limitation) が記されていなかった。確かに、uncounfoundedness や robustness が担保されているという点で、研究デザインはかなり優れたものではあるが、本研究の被験者がアメリカ人に限定されているという点(外的妥当性の問題)は指摘しておく必要があったのではないだろうか(まぁ、当たり前の話すぎて書いていないだけかもしれないが)。ジェンダーに対する考え方は、国によって大きく異なる。そのため、本研究はあくまでアメリカ社会の一部地域に限定されるものであり、異なったジェンダー観をもつ地域に本研究の結果を当てはめることはできない――という「限界」は記すべきであろう。
 また、本研究で判明したのは、「姉または妹をもつ男性は、そうでない男性と比べて、男女の役割についての考え方が保守的である」という、ジェンダー観に絞った影響である。兄弟・姉妹の性別が子どもの価値観・考え方にどのような影響を与えるか、というリサーチクエスチョンに詳細に答えるためには、ジェンダーに関する考え方の影響だけでなく、他の要素への影響についても検証する必要があるだろう。

② また、そこまでの重要性はないかもしれないが、兄弟・姉妹間の年齢の差についても検討する余地はあると考える。「1歳差の兄弟・姉妹」と「10歳差の兄弟・姉妹」では、「性別」だけでなく「年齢の差」という要因も、結果に影響するのではないだろうか。

③ 本研究で使用されている2つのデータセット (PSP と NLSY) に関する説明が充分ではないように感じた。本論文中には、両者がランダムサンプルであることが明記されておらず、個人的に調べた結果、そうであることが判明した。私が知らなかっただけで、この2つのデータセットがきわめて有名であるがゆえにわざわざ書かなかった、という可能性もあるが、ランダム抽出かそうでないかはかなり重要な違いだと思うので、書いた方が良いと思う。

(5) 改善案

 (4) の内容をふまえ、以下、改善案を述べる。
① 外的妥当性を担保するには、本研究のような internally valid な研究を様々な環境で行い、それらを比較することが求められる。要するに、地道に事例を積み重ねていくことで外的妥当性を高めていくことが今後の研究で求められる。

② 年齢の差ごとに、グループ化する方法があげられる。例えば、3歳差以下、4歳~5歳差、6歳差以上、といった具合に分類し、クロス表を作成する。その結果、それぞれの効果量に有意な差がないことが確認できれば、その結果が、純粋な「性別」の効果である可能性を高めるのではないだろうか。

(6) 応用可能性

 (4) の① で述べた通り、兄弟・姉妹の性別を使った自然実験は他の項目を調べるうえでも応用できる。本研究で扱われた「ジェンダー観」だけでなく、他のテーマについても家族内の性別が与える影響を調査することができるはずだ。
 

言語政策研究における歴史制度論の活用

書誌情報:Sonntag, S., and Cardinal, L. (2016). State traditions and language regimes: A historical institutionalism approach to language policy. Acta Universitatis Sapientiae European and Regional Studies, 8 (1), 5-21.
https://doi.org/10.1515/auseur-2015-0010

Historical institutionalism(歴史制度論)という理論についての考察論文。
政策科学における「歴史制度論」を使って、言語政策の事例を上手に説明しよう! という考えは全面的に同意する。
ただ、紙幅の関係かは不明だが、理論的な説明が少し不親切である点や、歴史制度論ならではの強み(旧制度論・行動主義論との違い)についての記述が若干薄い気がする。そこを補足説明しながら、簡単に感想を記していく。

引用とコメント

The ‘new’ historical institutionalism of Skocpol and others refocused research on the state rather than society (Skocpol 1985; Hall and Taylor 1996). While states do react to demands and pressures from society, historical institutionalism suggests that the state has a relative degree of autonomy. That autonomy, we argue, is best defined in terms of state traditions – the institutional and normative baggage and patterns of state action. (p. 9)

新制度論(特に歴史制度論)と旧制度論・行動主義論の違いを述べている。「旧制度論・行動主義論」と並べて書いたが、当然この2つのアプローチも性質はまるで異なるので、まずはその違いについて簡潔にまとめておく。

旧制度論の主な目的は、各国の憲法や法律を詳細に分析することで、その前提となっている政治理念や政治哲学を明らかにすることであった。この場合、分析の対象とされているのは、「動かない」制度・規範である。しかし、政治の流れは決して静的なものではなく動的なものである。どのような流れで政治が「動き」、その変化に影響を及ぼした要因は何なのか――こういった政治の動態的性質に注目したのが行動主義論である。

行動主義論で特に重視されるのが「市民」というアクターである。行動主義論は経済学の影響を多分に受けており、市民の行動原理を「自己利益の最大化」と定義する。それぞれが自己利益の最大化という目標を掲げて政治活動を行い、国家は市民からインプットされる多様な利益をもとに政策形成を行う、いわば「調整官」の役割を担っている――これが行動主義論の政策過程のイメージである。

ここまでの前提知識があってはじめて、引用文の趣旨が理解できる。”While states do react to demands and pressures from society, historical institutionalism suggests that the state has a relative degree of autonomy.” とは、「確かに(行動主義論で指摘されているように)国家が社会からの要求・圧力に影響を受けることは間違いない。でも、国家にもある程度の自律性はあるはずだよ!」という指摘。国家を市民の利益の単なる調整官としてではなく、国家自体も市民社会に影響を与える一つのアクターとして認識する。国家は受身的に市民の利益を調整しているのではなく、能動的に政策形成に影響を及ぼしている――これが新制度論の立場である。

‘Critical juncture’ is an analytical tool used by political scientists to home in on pivotal points of interaction between tradition and policy. A critical juncture may be presented by social, political, economic, or environmental crises or dramatic change. Most recently, globalization has precipitated critical junctures as noted by Europeanists studying small nations (see, e.g. Keating 1998). More generally, major historical shifts, such as decolonization, war, redrawing national borders, the dissolution of old states and the emergence of new ones, have instigated critical junctures and provoked the reinvention of state traditions. At critical junctures, new patterns of governance emerge, but never completely divorced from the old patterns and traditions in which they were formed. In other words, state traditions guide policy choices, including language policy choices, along already established pathways, but these pathways can take a different turn at times. State traditions frame how language policy choices are conceived without predetermining the specific content of these choices. (pp. 9-10, 下線は引用者)

いわゆる「経路依存 (path dependency)」「決定的分岐点 (critical juncture)」についての説明。ある時点で、制度・政策についての経路・方向性が決まると、それがその後の方針の決定にも影響を与える――ことを意味する。

例として、キーボードのQWERTY配列がわかりやすい。現在のキーボード配列は、タイプライターのアームが絡まないように、わざと打ちにくい構造で制作されたという説がある(諸説あり)。現代ではそのようなことを心配する必要が無いし、実際のところ、もっと早く打てるキーボードの配列はあるはずだ(というのも、全言語共通で同じキーボードの配列という時点で、効率性よりも他の要素を重視していることがよくわかる)。じゃあ、なぜQWERTY配列に依存するのか。それは「変えるのに多大なコストがかかるから」である。ここでのコストは、費用面だけでなく、人々の認識に関するものも含まれる。現在のパソコン使用者はQWERTY配列にすっかり慣れ親しんでおり、たとえQWERTY配列よりも効率性の高いキーボードがあったとしても、わざわざこれまでの習慣を捨てて、新しい形式に乗り換える人は少ない。たとえそれが非合理的なものであったとしても、歴史による積み重ねがその経路変更を困難なものにする。つまり、これまでの歴史・習慣が現在の選択の幅を狭めているのである。

このような「経路依存」の発想を持ち出すことで、政策研究にどのようなメリットがあるのか。一つは、政治過程の分析を「引き金論」に単純化することの抑止である。ある政策が立案された背景を探る際、直近の事象・出来事のみに注目し、「〇〇という出来事があったから、その政策決定が為された」と済ませるのはきわめて粗雑な分析法である。政策決定の背景を構造的に把握するためには、現状の趨勢を見るだけでなく、歴史・時間的要素を含めた分析が必須となる。

論文全体の感想

  • 「教育政策」ならではの歴史制度論の特徴について、何か言えることはないのか?
  • これについて、村上・橋野 (2020) の指摘が示唆に富む。

1990年代までの日本の中央政府における政策決定システムは合意型民主主義の特徴が色濃かったことがわかる。(中略)しかし、1990年代半ばに衆議院選挙制度中選挙区制から小選挙区比例代表並立制に改められると、比例代表の存在によって多党制の要素も若干残ったものの、徐々に二大政党への収斂が進み、2009年以降は現実に政権交代が起こるようになった。加えて、2000年代初めの省庁再編と同時に内閣府の設置など内閣機能の強化が行われたことで、不十分との批判はあるがそれ以前に比べて内閣への執政権集中が進んだ。日本の中央政府における統治システムは、権力の分立や共有を重視する合意型民主主義から、権力の集中を特徴とする多数決型民主主義へと移行が進みつつある。(中略)
 実証研究による結論を端的に述べると、1つは権力が集中すると与党の政策選考がより実現しやすくなり、過去の経緯に影響を受けるインクリメンタリズム(漸増主義)の要素は弱くなるということである(橋野 2016)。また、権力集中型の民主主義では政策の対立軸は1つに収斂しやすく、選挙もその1つの争点をめぐる賛否に集約されやすい。したがって、教育などの個別政策分野については、それが主要な争点とならない限り選挙に勝利した与党に白紙委任する形になりやすい
 権力集中であれば漸増主義的な政策形成は弱まり、与党の政策選考が実現しやすくなることは直観にも合致し、実証分析も行われているが、問題はそれが政策形成にとっていかなる点で短絡的、さらには中長期的な影響を及ぼすかである。これまでの研究では、教育支出への短期的な影響などは明らかになっているが、例えば、政治への市民参加の様態などの政治行動や、カリキュラムや教科書など、特定の政党や政治的勢力の影響が強くなることが危惧される教育政策・実践への影響はほとんど明らかになっていない。例えば、こうした教育政策について権力集中・分散による影響が明らかになれば、教育政策にとって望ましい政策形成の在り方についても示唆を得ることができよう。(村上・橋野, 2020, pp. 163-168)

  • 政策過程理論におけるインクリメンタリズムや歴史制度論が、教育政策過程においてどの程度適用できるか——という問題。権力集中型の民主主義でにおける教育政策は「与党に白紙委任する形になりやすい」のならば、過去の政策をある程度無視した大胆な教育政策を打ち出すことも可能なのかもしれない。
  • 上記では「教育政策」と一括りにして扱ったが、実際のところもっと細分化して考えるべき場合もあると思う。教育政策の中にも、教育支出、カリキュラム、教科書、入試制度…… というように複数のカテゴリーがある。それらすべてのカテゴリーが同じような制度変更・制度発展の経路をたどるわけではないはず。経路に影響を与える要因もそれぞれ異なることが予想される。このことは岩崎 (2012) でも同趣旨のことが指摘されている。

次に、制度変更の経路を特定する研究を進めるべきだとする。どのような制度であれば、どのような変更経路を辿るのかを明らかにするのである。また、制度同士のつながりが制度発展のパターンにどのような影響を及ぼしているのかも明らかにする必要があるとする。さらに、長期的な過程を組み込むことで、制度発展の分析を引き金論に終わらせないことが重要だとする。最後に、重要な公共政策を制度と考えれば、制度発展の議論は、政策の選択・発展の分析に応用できるとする。(p. 127)


上記のような議論は、教育政策分野で歴史制度論を使った事例研究の蓄積がある程度必要である。現状、私のフィールドである英語教育政策研究で、歴史制度論を用いて事例分析を試みた研究はきわめて少ないので(ゼロではない)、まずは事例研究の蓄積が当分の間の課題かなぁと思う。

「日本のウォッシュバック研究のレビュー論文」をさらにレビューしてみた

書誌情報:Allen, D., & Tahara, T. (2021). A review of washback research in Japan. JLTA Journal, 24, 3-22.
https://doi.org/10.20622/jltajournal.24.0_3


日本における英語試験・テストのウォッシュバック研究のレビュー論文。
中止に終わった大学入試への民間試験導入にせよ、予定されている都立高校へのスピーキング試験導入にせよ、その根本にはテストの波及効果、すなわち、「入試を変えれば教育が変わる」「入試を変えれば日本人の英語力が変わる」という考えが前提としてある。その意味で、ウォッシュバック研究は英語教育研究の中でも今、最もホットな研究テーマの一つと言えるだろう。

タイトル通り、本研究をさらにレビューしていきながら、ウォッシュバック研究の成果と課題について考えたい。

要約とコメント

Introduction

Studies conducted since the 1990s (e.g., Alderson & Hamp-Lyons, 1996; Alderson & Wall, 1993; Bailey, 1996; Hughes, 2003; Green, 2007; Wall, 2005; Watanabe, 1997) have provided researchers with a now reasonably well-developed theory of the washback mechanism, though due to its complexity, predicting washback effects precisely is still an arduous task. (p. 4, 下線は引用者)

ウォッシュバック研究が本格化して今年で約30年。それだけの蓄積があるから、これまでに複数の理論やモデルが提唱されてきたが、それらの成果から言えることは「事態は複雑です!」ということぐらい。


そもそも、後述するように「ウォッシュバック」があまりに多くの事象を包括する語となってしまっており、この用語自体が複雑になりすぎてしまっている印象がある。大半の先行研究では、ひとまずウォッシュバックの定義を引いたうえで、ウォッシュバックの「どの側面」に注目するのかを改めて書くというケースが多い。例えば、「教員の指導法の変化に注目します!」とか「テスト特化型クラスと通常クラスで、テストの成績にどのような違いが生じるか検証します!」とか。あるいは、「〇〇大学の受験をした際に、A方式とB方式で受験した生徒間で、学習内容・方法に違いはあったか?」とか。検討対象が多種多様であるがゆえに、ウォッシュバックに関する理論も多種多様となり、結果的にそれぞれの理論に一貫性・統一性があまり無いというか。同じウォッシュバック研究でも、知見・理論としてはあまり有用でない——と感じるものが多いのは、ウォッシュバック研究の多様性ならではの特徴かと。

Method

2021年より前に発表された論文をGoogle scholar を使って検索。

Results and Discussion

分析の際に使用したカテゴリーは以下の通り。

  • Publication:著者、出版年、使用言語
  • Test(s):試験・テストの目的、対象とするスキル(4技能)、試験の具体性
  • Context and participants:公教育と私教育、教育段階、調査参加者、サンプルサイズ
  • Methodology:データ収集、リサーチデザイン
  • Washback:検討対象(学習の内容・方法・動機づけ・結果)、ウォッシュバック研究のエビデンス
  • Consequences:これまでの日本のウォッシュバック研究をカテゴリーごとに分類
Publication

割愛

Test(s)

割愛

Context and participants

Context of education. The vast majority of reasearch concerned participants and tests within mainstream education, with only two studies exclusively focusing on the shadow education sector, that is, in yobikō ('preparatory schools') and/or juku ('cram schools'; Allen, 2016b; Watanabe, 1996; Table 2). (p. 10)

Participants. Six studies have investigated teachers, 19 have investigated learners, and six have dealt with both (Table2). One paper, Sugino and Tokuda (2008), did not include participants. Taken together, there are over twice as many data sets from learners (n=25) as from teachers (n=12). Other participants, such as school principles, parents, and materials developers, have not been investigated in the washback studies. (p. 10)

塾・予備校を対象にした研究が少ない、教師よりも生徒を対象とした研究が2倍以上多い、教師・生徒以外のアクターへのウォッシュバックについて検討した研究はない、という研究課題が指摘されている。後者の「アクターの多様さをもっと考慮すべき」というのはウォッシュバック研究ではよくなされる指摘(例えば、Bailey, 1996)。一方で前者の「教師よりも生徒を対象とした研究が圧倒的に多い」という指摘は、1993年から2013年までのウォッシュバック研究をレビューしたCheng et al. (2015) とは真逆の指摘となっており、日本のウォッシュバック研究ならではの特徴だと言える。

Methodology

Research design. Wall and Horák (2007) suggest there are two types of impact studies: those that describe the effects of exsiting tests, and those that describe the effects of new/revised tests. The crucial methodological difference concerns whether a test is newly introduced or not; if so, it is more straightforward to demonstrate evidence of change that is brought about by the test, which is necessary for a strong washback argument (Messick, 1996). Wall and Horák suggest that this is best achieved through inclusion of a baseline study, which provides a complete description of the educational situation prior to the introduction of the test. (p. 11)

重要な指摘。Wall and Horák (2007) の二分法に従えば、後者の「新テストの導入による効果」を分析するには、その導入前と導入後のデータが不可欠。しかし、著者らが指摘しているように、日本の波及効果研究では baseline となる「導入前のデータ」を入手せずに、単に「導入後のデータ」のみで新テスト導入のウォッシュバックについて検討している研究が複数ある。


そもそもの問題として、ウォッシュバック研究では上記の2つの区分を明確に区別していないものがきわめて多い印象。というより、この2つをどちらも「ウォッシュバック」と同じ名前で呼ぶことをやめた方が良いと思う。「ウォッシュバック」という用語は「テストによる影響」を何でもかんでも詰め込んだ用語となっており、特に「新テスト導入による効果」のような政策的議論と密接にかかわる議論*1をする際に「ウォッシュバック」「波及効果」という用語を持ち出すことは誤解のある議論を誘発しかねない。




それから、著者らはウォッシュバック研究のデザインを within-participants designs と between-participant(s) designs に分類しているが、正直、何が違うのかよくわからん。3回きちんと読んだけど、やっぱりわからん。ウォッシュバック研究の論文はかなり読んできたが、このような分け方はたぶん初めて見た*2


文脈から察するに、おそらく between-participant(s) designs がアクターを「生徒」のみに絞って検討するデザイン。一方、within-participants designs がアクターを「生徒以外」にまで拡大したときのデザイン(教員だけでなく、クラス環境なども含まれる)かと推測される。within-participants designs についてはさらに2つに細分化されている:

Two other types of within-participants designs were observed in the research. One involves multiple teachers each teaching for multiple tests that differ in content. In this case, it is possible to observe whether the same teacher teaches differently according to a specific test. [...] The second type of within-participants design seeks to investigate whether there is any impact of a test by comparing exam-focused classes with regular classes. (p. 12)

前者が「対象とするテストによって、教員が指導法を変えるか・変えないか」、後者が「テスト対策に特化したクラスと通常のクラスを比較することで、テストのインパクトに違いは生じるか」というタイプ。このような分類をすることで、ウォッシュバック研究の理論的説明にどれほど貢献するのかはよくわからないが、「ウォッシュバック」という用語がカバーする範囲が異常に広いということが改めてよくわかる。


以上のように、ウォッシュバック研究のリサーチデザインについて本論文では色々提案されているが、個人的には最初に挙げた「『既存のテスト』による波及効果か『新テスト』による波及効果か」という区分けをまずは明確に意識して、研究がなされるべきだと思う。特に、ハイステイクスなテスト(主に入試制度)の改訂や新形式のテストの導入による波及効果は、前述したように政策研究と密接に関与する分野であるため、一般的な波及効果研究のノリで研究をして知見を蓄積しても意味がない。意味がないどころか、それを一種の「エビデンス」として使用され、エビデンスとしての価値がほとんどないにもかかわらず(この点については後述)、政策立案者に都合の良いように使われてしまう可能性もある。現状、政策学的に妥当なリサーチデザインに基づき入試のインパクトを評価した研究がほとんどないことを考慮すると、いっそのことそれについて語る際には「ウォッシュバック」という用語は使わずに、政策研究でよく使われる「インパクト」であったり、あるいはわかりやすく「政策効果 (policy effects)」という用語を用いて、明確に区別をした方が良いのかもしれない。

Washback

"Washback" という章立てではあるが、主にリサーチデザインに関する内容。

Evidence of washback. Of the studies reviewed, five did not present clear evidence for either the presence or lack of washback (Kowata, 2016; Oguri, 2009; Shimatani, 2007; Watanabe, 1992, 2004a). The lack of evidence appears to be in part due to a reliance on survey data. For instance, Oguri (2009) did not observe washback from the introduction of the NCT-L on learning behavior, specifically regarding practicing listening to English. This could potentially be explained by the perceived low-stakes of the NCT-L or because all learners regardless of cohort (i.e., 2007 or 2009) had sufficient awareness of the test. Unfortunately, the lack of qualitative data means neither of these possibilities could be confirmed. (p. 14, 下線は引用者)

簡単に行ってしまえば、これまでの日本のウォッシュバック研究のいくつかは「第3の変数」についての考慮が欠けているよ! という指摘。2006年のセンター試験へのリスニング導入の波及効果を検証した研究を例として挙げている。研究の結果、「リスニング試験の導入が生徒の英語学習に波及効果を及ぼさなかった」と結論付けられているが、この結果から「日本の大学英語入試を変えても、生徒の学習行動に影響を及ぼさない」と結論付けるのは不適切。今回波及効果が観察されなかったのは、センター試験におけるリスニング試験の得点比率(当時はリーディング:リスニング= 8:2)、難易度が低かった*3、調査では観察されなかったが実際は意識していた——という可能性があるのではないかというご指摘。この点については特に異論はない。同様の指摘を拙稿でもしている。



In general, studies that failed to provide washback evidence, or provided only very weak evidence, typically provided very restricted data (i.e., only one type of data, or a small number of responses) and/or failed to provide data concerning the role of crucial mediating factors (e.g., whether the test was perceived as important for the learners). Conversely, studies that demonstrated strong evidence of washback typically included multiple sources (i.e., teachers and learners) and/or methods of data collection (e.g., survey and interview data; or observation and interview data). Such studies typically can provide relatively comprehensive coverage of learning and/or teaching, and thus can identify washback effects and explain the factors that mediate them. (p. 14, 下線は引用者)

ウォッシュバック研究における "strong evidence" の条件として、「多様なアクターを検討しているかどうか」「データ収集の仕方は適切か」という点を挙げている。後者についての詳しい言及は結論部分に書かれているので、そちらも以下に引用しておく。

Furthermore, too few washback studies have utilized direct observation as a method of data collection. In fact, some of the most interesting observation data can be found in teaching practice and teacher education studies. However, without a framework for investigating washback built into the research design, such studies cannot provide adequate answers to questions of washback in schools. Moreover, studies should whenever possible triangulate their data collection methods (Alderson & Wall, 1993; Wall, 2005). The use of qualitative data such as that provided by interviews, narrative journals or open-ended surveys, to support quantitative survey and test data is particularly crucial, otherwise there will be no evidence for the mediating factors of washback, which explain why participants do what they do and thus why washback occurs or not. (p. 16, 下線は引用者)

この箇所以外にも、良質なエビデンス生成の条件として、「トライアンギュレーション」の活用を激推ししている。たしかに、量的研究・質的研究にはそれぞれ強み・弱みがあり、どちらかに固執するのではなく目的や研究の実現可能性に応じて使い分ける、あるいは、両方活用する姿勢は重要だと思う。その点については概ね同意するが、それら研究の「中身」についてこの論文ではほとんど議論されていない。量的研究と質的研究を組み合わせても、そのリサーチデザインに欠陥があれば両者を足したところで…… という感じ。せめて量的研究については、(特に「エビデンス」という用語を使いたいのであれば)反実仮想・内的妥当性・外的妥当性については触れてほしかった*4。蛇足だが、ランダム抽出や反実仮想を重視しないのは、ウォッシュバック研究に限らず「言語教育研究あるある」の一つ。

一方、ウォッシュバック研究における質的研究は、なかなか評価が難しい気がする(というより、私自身、その有用性は認めるものの、質的研究のあり方についてよくわかっていない……)。現状では、とりあえずインタビューやフィールドワークを行って、後は書き手の好きなようにつなげる——という印象。どのようにウォッシュバック研究の質的研究が評価されるべきかについてはまだ答えが出ないので、今年中の検討課題としたい。

Consequences

割愛

論文全体に関するコメント


論文中での「エビデンス」という用語の使い方が気になる

日本のウォッシュバック研究のレビュー論文はあまりなかったので、その点では貴重な論文だと思う、が、一点気になったのが「エビデンス」という用語の使い方。本論文中では計10回使用されているが、いわゆる「証拠」とか「根拠」ぐらいの意味で使っていると思われる。テスティング理論やアセスメント関係の文脈でそういった使い方をするのは取り立てて問題ではないかもしれないが、政策的示唆に関する内容があるにもかかわらず、エビデンスをそのような狭義の意味で使ってしまうのはマズい。特に気になった部分を以下に引用する。

If teaching differs in terms of content, methods or materials for each test, this may provide evidence of washback. (p. 12)

Similarly, even if a study reports evidence of a washback effect, without sufficient information about learner perceptions and behaviors it is impossible to confirm the basis of the effect. (p. 14)

In this case, research is required into the use of four-skills tests and the washback that they generate in different micro-contexts, though most importantly those at the senior high school level. There is a particularly crucial requirement to provide evidence of washback at this level because the intended outcome of the reform (and the use of four-skills tests in this context) is to generate positive effects in education. (p. 15, 下線は引用者)

おそらく本論文ではエビデンスを「ウォッシュバックが観察されたか否か」ぐらいの意味で使っていると思われる。ウォッシュバック研究でよくある、テストの妥当性検証を目的とした論文*5であれば、まぁ別にいいかという感じなのだが、最後の引用のような文脈での使用はマズいと思う。最後の引用部分は、入試改革におけるウォッシュバック研究の話をしており、きわめて政策的要素が強い*6。そのような文脈で「エビデンス」という用語を使用する際はそれ相応の注意をしないといけないし、それが政策学研究に足を踏み入れる際の一種の「マナー」だと思う。ウォッシュバック研究は、テスティング理論・アセスメントの観点から研究がなされることが大半ではあるが、そういったノリで政策効果について言及するような「領空侵犯」は犯してはならない。


政策研究における「エビデンス」とは、「『処遇→アウトカム』という因果モデルにおける因果効果を示した実証的データであり、かつ、その確からしさ(エビデンスの質)に関して格付けを経たもの」(亘理他, 2021, p. 29)を意味する。来年度導入が予定されている東京都立高入試のスピーキング試験を例にすると、「入試にスピーキング試験を導入 → 日本人のスピーキング能力が向上」という因果モデルを、実証的なデータに基づきその関係の確からしさを示すものが「エビデンス」となる。さらに、教育政策関連で因果関係をリサーチする目的は、該当する地域・国、究極的には日本人全体に効果のある方法を見つけることであるため、母集団を考慮したリサーチデザインが求められる。つまり、仮に一部の学校で新テスト導入の効果を検証したとしても、その結果を日本人全体に一般化することは不可能であり、したがってその知見を政策的示唆につなげることもできない。エビデンスに基づく教育 (EBE) の観点からすれば、単にウォッシュバックが生じた・生じなかったという表面上の違いだけで、その結果を「エビデンス」として捉えることは御法度である。

baseline data と longitudinal data を!!!

というように、(自分がそのレベルの研究をできていないもかかわらず)上記で「エビデンス」という用語の使い方について不満をたらたら述べたが、全体的にはたいへん勉強になる論文だった。これまでの波及効果研究のまとめなので、だいたいのことは知っていたが、改めてウォッシュバック研究について検討したり、今後の展望を立てるうえでは有用な論文かと。

特に、Conclusion に記されている以下の箇所には激しく同意。

Moreover, it is important for future studies to include a baseline study, if possible, so that the impact of the introduction of a test can be demonstrated (Messick, 1996; Wall, 2005). This combination of baseline data and longitudinal data would provide convincing evidence of washback effects, whether strong or weak, positive or negative. (p. 17)

先述したように、新テスト導入による政策効果をはかりたいのであれば、「導入前」と「導入後」のデータを比較し、その目的が達成されたかを捉えることで「新テスト導入→政策目標達成」という因果モデルを検証することができる。その意味で、該当する施策が実施される前に、baseline study を計画的に行う必要がある。大学英語入試関連で言うと、2006年のセンター試験へのリスニング試験導入はこの点が不十分だったために、説得力のある先行研究が存在しないと思われる。また、2020年度のセンター試験の廃止に伴う共通テスト導入についても、どの程度 baseline data が考慮されていたのかは今のところ不明……


また、入試の影響は常に一定ではなく、時間とともに変化すると考える方が自然。導入直後よりも2,3年後の方がテストの影響が出ているかもしれないし、逆に薄れているかもしれない。教育活動はスタティックなものではなくダイナミックなものであり、その意味で入試の影響を多角的に論じるためにも、(実施がとてつもなく大変だと思うが)longitudinal study を行う価値は十分にある。

*1:新テスト導入は何らかの教育目的・政策目的をもとになされる取り組みであり、その効果検証をするということは一種の「政策評価」を行うことを意味する。政策的示唆につなげるには、当然のことだがそれに足るエビデンスを提供する必要があり、狭義の意味での効果検証とは明確に区別する必要がある。

*2:本論とはあまり関係ないが、within / beyond classrooms という分け方はウォッシュバック研究でよく目にする。

*3:2006年のリスニング試験導入が波及効果を起こさなかった原因として、リスニング試験の難易度が簡単だから——と説明する先行研究はまぁまぁある(例:Hirai et al., 2013)。

*4:この点も拙稿にて詳述してあります。あとは本ブログでも以前言及しました。sudos.hatenablog.jp

*5:ここで言う「妥当性」とは、テスト作成者が意図する測定項目が実際にそのテストで測れているか否かについての指標を意味する。詳しくは小泉 (2018) を参照。

*6:理由は注1で述べた通り。

日本の「英語」教育におけるCEFRの政策借用

先日、とある読書会で以下の論文を読みました。

Nishimura-Sahi, O. (2020). Policy borrowing of the Common European Framework of Reference for languages (CEFR) in Japan: an analysis of the interplay between global education trends and national policymaking. Asia Pacific Journal Of Education. https://doi.org/10.1080/02188791.2020.1844145


私が報告者だったこともあり、関連文献もまぁまぁ読み込みました。読書会での議論内容も含めて、備忘録としてここに記しておきます。

本論文における鍵概念

  • ある国の政策が他国に伝播する現象を「政策移転 (policy transfer)」や「政策借用 (policy borrowing/lending)」と呼ぶ。
  • 政府文書・調査団の派遣の記録に基づき、他国の政策を借用する意図があったことを確認することで、「グローバリゼーションの中でたまたま国家間で政策が共通した」という抽象的結論に済ませるのではなく、意図的な移転行為があったと結論する → 政策決定過程をよりミクロに観察できる。
  • 言語政策研究でもたびたび使用されており、早期英語教育を政策移転に基づいて分析した Enever (2018) が有名。

要約(と簡単なコメント)

RQ

global education policyが日本に借用されるプロセス・メカニズムの解明
——CEFR は日本の外国語教育の政策にどのように借用されたか?

Global education policy and educational policy transfer

[...] other comparativists tend to analyse global education policies through micro-level analysis taking the so-called “Globally Structured Agenda for Education” (GSAE) approach to global education policy (Dale, 2005; see also Verger, 2014). (p. 3)

Importantly, the ultimate goal of educational policy transfer research in comparative policy studies is not to provide a thick description of the local context, but to interpret and understand “the power, legitimacy issues and political processes that explain policy change” in an era of globalization (Steiner-Khamsi, 2012, p. 467). (p. 3)

  • 政策借用はマクロ要素・ミクロ要素と密接に関係している(=メゾレベルの理論)。ここで言う「マクロ要素」とは、新自由主義グローバル化などかなり抽象度の高い理論のこと。一方、「ミクロ要素」とは、個々の国・地域の教育行政機能の体系等を指す。
  • 本論文ではGSAEについてそこまで説明されていないので、簡単に説明しておく。Verger (2014) の説明を借りると、GSAEとは、グローバル化の原動力を「資本主義経済」と捉え、そしてその影響は教育政策にも多大な影響を与えている――という考え方の枠組みを指す。また、教育行政で大きな変化が生じた場合は、local, national, global の視点から、経済状況とのつながりを広くかつ狭く検討することを重視する。後述するように、政策借用という方策は昔から行われてはいたものの、グローバル化がさらにその使用を活性化させている(他国の政策事情を容易に把握でき、なおかつ、「他の国がやっているのだからうちの国も……」という具合にその政策を導入する根拠としても使える)。その意味で、政策借用とグローバル化は密接に関係する。一方、これまた後述するように、政策借用とは必ずしも「そのまま他国の政策を借用する」わけではなく、そのアイディアをもとに少し改変を加えたり、あるいは、アイディアだけもらってほとんど自国で政策を組み直すという場合もある。つまり、借用先のニーズ・事情によって、元の政策から多少なりとも変化が生じる。その意味で、政策借用はローカルな事情とも密接に関係している。だからこそ、政策借用は「メゾレベルの理論」と形容できる。本論文ではこのような関連性を背景に、GSAEについて言及しているのかと思われる。
  • 【参考】「マクロ理論→メゾレベルの理論→個々の教育行政機能→個々の政策過程」(寺沢, 2021

He [Nitta (2008)] points out that the Japanese crisis discourse in the late 1980s took shape in the interplay with a global trend or wide-spread belief that failure in public education threatens the economic competitiveness of the nation state (Nitta, 2008).
(p. 4)

  • 1990年以降の経済低迷を受け、財界をはじめとして焦りが生じる。
  • 【参考】「大胆な教育改革なしでは、ヨーロッパ・アメリカに追いつく・追い抜くことはできない」という危機感が教育改革を大胆に進める原動力となる (Nitta, 2008, p. 115)。特に教育改革は政策の中でも「目立つ」部類に入るため、政治家にとってもアピールの材料として活用されやすい傾向にある。


[...] education politics in Japan during the 1990s and 2000s shifted to the globally diffused New Public Management (NPM) approach: The central government attempted to improve educational performance by conducting quality assurance through external school evaluation and standardized tests rather than by providing “inputs” such as human and financial resources and facilities (Nitta, 2008; see also Fujita, 2010; Gordon & LeTendre, 2010; Rappleye, 2012). (p. 4)

  • 日本におけるNPMの教育の導入により、数値目標による管理など成果主義が強まる → 効果をはかる客観的な指標が必要 → 民間試験やCEFRの導入 ——という流れ (p. 5) 
  • 【コメント】日本におけるNPMの導入は諸外国と比較するとかなり限定的。(村上・橋野, 2020, p. 148)。村上・橋野で指摘されているように、日本の学校は(特に高校以上で)私立学校の割合が多いため、そもそも民間に外部化されていると言える。また、仮に教育の世界で何かしらの結果を収めたとしても、個人の昇進・給与の上昇に結び付くことは稀なこと。とはいえ、成果主義の高まりや教育権限の集中化など、影響が決してなかったわけではない。PDCAサイクルの導入もこの流れの中で行われたと考えられる (Nitta, 2008, p. 139)。というように、NPMの影響は「無くはないが、明確に議論するのは困難」という印象。なので、本論文のpp. 4-5 で指摘されている「NPMがCEFRの導入に影響を与えた」という指摘は、否定もできないが肯定もできないというビミョーな感じ。

Results

The CEFR and the revision of the course of study

[...] I observed that the need for a national framework was first stated in the late 1980. [...] To this end, the Second Report proposed several reform agendas including the introduction of clear goals of English teaching at each school level. (p. 5)

  • 1980年代後半に設置された臨時教育審議会が後の教育行政にきわめて大きな影響を与えた——それはCEFRも例外ではないという指摘。
  • 【コメント】臨教審の第二次答申が後の教育政策に大きな影響を与えたという話は、教育政策研究ではかなり有名な話。例えば、小学校英語・大学入試における民間試験導入・9月入学案などは、すべて臨教審で提案された事項。大学英語入試関連については、拙稿でまとめています。
  • 【コメント】“a national framework” の「フレームワーク」をどのような意味で使っている? おそらく第二次答申の「各学校段階における英語教育の目的の明確化」の箇所を指していると思われるが、ここでの「目的」とは「到達目標」の意味では? 後述するが、「目的」でも「基準」でもない「フレームワーク」という用語の抽象度がかなり高く、これがCEFRの様々な誤解・誤用につながっているのではないかと思う。この点は日本語の「枠組み」でも同様。


[...] the CEFR was introduced as an “international standard” in the new curriculum. The rhetoric of “international standard” has been used in several policy documents since the beginning of the 2000s. [...] This MEXT’s choice of words indicates that the status of the CEFR as an international standard was an appealing aspect for Japanese policymakers who have pursued the reform agenda proposed in the early 2000s. (p. 7)

  • 「国際基準」「21世紀型スキル」「ベストプラクティス」といった用語が教育改革への圧力を高め、たとえこれらの用語が何を意味するかについて共通見解がなくても、改革の根拠として使われる (Steiner-Khamsi, 2014, pp. 156-157)。新自由主義による教育政策の改革圧力により、「国際基準」や「21世紀型スキル」というスローガンを掲げ、何かしらの変化を教育政策にもたらそうとする。しかし、それらのスローガンの抽象度があまりにも高すぎるため、特に具体的な施策を思いつくわけでもない。でも、何かしら改革を起こさないといけない。そこで施策をウチではなくソトに求める(→政策借用)。そうすれば、アイディアを自分で考える必要もないし、予算も削減できる。なおかつ、他国の成功事例があれば、自国で導入する際の根拠としても使える(もちろん、他国での事例がそのまま自国でも当てはまるというのは、それぞれの地域事情の差異を全く考慮していない、きわめて楽観的な発想ではあるが)。
The CEFR and the reform of university entrance examinations

ここで、大学入試における民間試験活用とCEFRのつながりについて述べられている。
「公教育における民間試験の活用」は1980年代後半から議論されてきたが、それが政策として実現するまでに40年近くかかった(結果的に、民間試験の導入は中止になったが)。何が民間試験活用の障壁となったのか。本論文では以下の2点が指摘されている。

  • 民間試験の目的と学習指導要領の不一致
  • 数ある民間試験の中から、どれか一つを選べない

しかし、CEFRを日本の公教育に導入したことでこの障壁が解消され、民間試験の活用は促された——と本論文では指摘する。つまり、

  • CEFRを学習指導要領に取り入れ、かつ、民間試験をCEFR基準で活用することで、CEFRが両者の媒介項となり、「民間試験 ↔ 学習指導要領」という問題を解決(しているかのように見せかける)
  • 民間試験をCEFR基準で活用し、複数の民間試験のレベル調整を行う(ように見せかける)ことで、「どれか一つ選ぶ」という状況から脱する

本論文の内容からはやや脱線するが、上記の内容を大学入試改革の流れと合わせて説明すると、以下のようになる:

もともとの願望として、「入試にスピーキング試験を導入したい」という政策目標があった。当初は大学入試センターによる自前の試験を予定していたが、予算の問題や実施にかかるコストから厳しいと判断。代替案として、昔から提案されている「民間試験の活用」が挙がるが、「学習指導要領との不一致」「特定の民間試験を活用した場合に生じる財界との関係悪化」が障壁となる。その障壁を解決し、本施策のフォーカル・ポイントとなったのが「民間試験とCEFRを紐づけすることで、複数の民間試験の中から受験生に試験を選択させる形で民間試験を導入する」というアイディアだった。

「フォーカル・ポイント」としてのCEFR

コメント

論文全体の評価

  • CEFRが日本で注目されるようになった背景について、「独立変数:新自由主義グローバル化」→「従属変数:政策借用」を政策文書・インタビュー記録をもとに、実証的に分析している
  • また、CEFRが大学入試における民間試験活用の障害を回避するためのアイディアとして使われた——という指摘も興味深い
  • 本研究は「マクロ理論→メゾレベルの理論→個々の教育行政機能→個々の政策過程」(寺沢, 2021)の下線部を主に検証しており、政策が「どの程度」転移したかについての記述は薄い(「独立変数:政策借用」→「従属変数:個々の政策」)。
  • この点について検証しているのが Nishimura-Sahi (2022)

CEFRの政策借用における「程度」

本論文で引用されていたわけではないが、政策借用の重要文献としてEnever (2018) も改めて読んだ。以下は、CEFRの政策借用についての重要な指摘。

A further appeal of the CEFR as a policy document is that it cannot be related to a specific country. Significantly, it cannot therefore be ‘borrowed’ by another country. (Enever, 2018, p. 196, 下線は引用者)

  • CEFRの政策借用は、特定の国で行われている政策を借用しないという意味で「借用」ではない——という指摘
  • 政策移転研究では、「どの程度」政策が移転されるかに応じて類型が提案されている:模倣 (copying)・政策競争 (emulation)・混合 (mixtures)・刺激 (inspiration)(秋吉他, 2015, p. 259)
  • 日本におけるCEFR の政策借用は、当初は自前のCEFRjapan の作成を目指していたが、2007年からフィンランドにおけるCEFRの活用事例を取り入れながら行われた (Nishimura-Sahi, 2022) =「政策競争→混合」という流れ

「外国語」教育ではなく「英語」教育としての政策借用

  • CEFRの理念はplurilingualism / pluriculturalism のはず。しかし日本では 、「複言語主義の思想が参照されることはなく、本来は『評価の尺度』である能力記述だけが取り残され、英語教育における『学習到達度目標』として、CEFRが一人歩きを始めた感がある」(鳥飼, 2013, p. 5)。CEFRの ‘can-do’ descriptors のみに注目が集まり、複言語教育路線は今のところ完全に途絶えているように見える。
  • Nishimura-Sahi (2022) で指摘されているが、どうやら、CEFR の「フレームワーク」が意訳(誤訳?)されているのは日本だけではないらしい。

Although the CEFR authors and experts emphasise that the CEFR is not a standard but a framework for facilitating educational reform projects in different contexts (Council of Europe 2001; Byram and Parmenter 2012; Jones and Saville 2009), the CEFR has been used as the former for benchmarking language proficiency and promoting the outcome-oriented development of curricula and language programmes in Europe and beyond. (Nishimura-Sahi, 2022, p. 2)

英検の独占市場

This finding shows that the CEFR reference levels attracted Japanese policymakers’ attention as a practical tool to enable the use of several external tests in the national standardized university entrance examination. (Nishimura-Sahi, 2020, p. 8, 下線は引用者)

  • TOEFL の活用を提言し、批判を浴びる」→「自前のテストを作成しようとするが断念」→「再び民間試験導入案に戻るが、どれか1つに選べない」→「すべて導入してしまえ!」
  • ある一つの民間試験を導入するとなると、その試験の目的と学習指導要領の不一致や、試験の難易度に批判が集まる。一方、すべての試験を導入して受験者に選ばせる形にすれば、批判が個別の試験の妥当性ではなく、「民間試験導入」という施策に集まりやすくなり、結果的にごまかしやすくなった(?)
  • とはいえ、「複数の試験を併用する」と言っても、多くの受験生が英検を選択することは容易に想像できる。この施策によって、結果的に最も得をする(予定だった)のは日本英語検定協会。
  • 読書会で指摘され気づけたが、英検については学習指導要領との不一致で批判されたことはおそらくない。学習指導要領との不整合が昔から指摘されていたのは主にTOEFL。それが最近では、「民間試験」と学習指導要領との不一致——というように、複数の試験を一括りにして批判が為されている傾向にある。その結果、「民間試験」の一つとして含まれる英検にも批判の矛先が向かっている印象。その意味で、英検はいわば巻き添えを喰らったとも言える。

言語政策研究における政策過程研究理論の活用

  • 本論文では、日本におけるCEFR導入の事例を「政策借用」という政策過程研究の一理論を採用することで、事例をより詳細に記述することを可能にしている
  • 言語教育政策の分野でも、上手に事例を説明するために政策過程研究の理論を活用することが重要。
  • 本論文ではSteiner-Khamsi (2012; 2014) がたびたび引用されている。Steiner-Khamsi (2014) の以下の指摘がなかなか面白かった。

In policy studies, John Kingdon coined the term “policy window” to identify favourable conditions for policy change (Kingdon, 1995, p. 19). He found that the convergence of the three following streams is likely to produce change: the problem stream (recognition of a problem), the policy stream (availability of solutions), and the political stream (new developments in the political realm such as, for example, recent change in government). It is important to point out that Kingdon does not take into account the process of transnational policy borrowing. (p. 156, 下線は引用者)

  • キングダンの「政策の窓」モデル*1は政策過程研究では非常に有名な理論で、英語教育政策でもたびたび使用されている(例えば青田 (2021) など)。しかし、Steiner-Khamsi に言わせると、この理論はもはや「古い」とのこと(そこまできつく言っていないかもしれないが)。「政策借用」についての考慮が抜けている点で、現在の特徴であるグローバル化による影響の視点が抜け落ちているという指摘。
  • このことについて読書会で言及したら、「政策借用は『政策の流れ』に含まれるのではないか?」という指摘があった。たしかに政策の窓モデルは、それぞれの概念についての定義は比較的緩めなので、そのような見方もできてしまうのか…… その意味で、政策の窓モデルは、概念を拡張しやすい・各事例に合わせて柔軟に定義を設定しやすいという点で、使い勝手が良いと言えるかもしれない。と同時に、概念を拡張しやすいがゆえに、筆者の都合に合わせてこのモデルを使用しやすいため解釈が恣意的になりやすいという問題もあるかと思う。とある方の発言だが、その意味で、政策の窓モデルは「使いやすく」かつ「使いにくい」モデルであるというパラドクスを抱えている。

*1:簡単に説明すると、何らかのイベントによって「問題の流れ」「政策の流れ」「政治の流れ」が合流し、その結果「政策の窓」が開くことで政策決定がなされる――というモデル。詳しくは、岩下 (2012) のpp. 31-46 の説明が参考になると思います。