SSudo's Lab

須藤爽のブログです。専門は英語教育政策。重要文献のログ・感想を残していきます。

JSCS2023(7月8日)で発表します

http://jscs.b.la9.jp/meeting/document/34/34th_program_2023_jis.pdf

7月8日(土)に日本カリキュラム学会(@大阪教育大学)で発表します。 教育学系の学会発表は実は今回が初です(「英語教育」の学会は別とすれば)。 以下、提出した発表要旨とちょっとした付け足しです。

タイトル

大学入学共通テスト英語試験の過去と未来

―2025年新課程入試と学習指導要領の整合性に着目して―

1. はじめに

 2022年より施行された高等学校の新学習指導要領に対応して、2025年から大学入試に新課程が反映される。本発表では大学入学共通テスト(以下、共通テスト)英語試験に注目し、(1)共通テスト英語試験が2021年の実施以降どのような評価を受けたか、(2)その評価が新課程入試の試作問題にどう反映されているかについて論じる。

2. 新学習指導要領と共通テスト英語試験

 2017,2018年に告示された新学習指導要領では、すべての教科で資質・能力が3つの柱で整理され、「主体的で対話的で深い学び」の視点から授業の創意工夫や教材改善を引き出すことが意図されている。外国語科では聞くこと、読むこと、話すこと[やり取り]、話すこと[発表]、書くことの「4技能5領域」に基づき目標が設定され、その指導を通して3つの資質・能力を育成することが目指されている。加えて、旧指導要領と比べ「活動」「伝え合う」に相当する文言が増加している点も新課程全体の方針と一致する。また、「論理」という用語が外国語科だけで計55回使用されている点も特筆に値する(旧指導要領では0回)。

 この指導要領改訂に追随する形で、2021年の大学入試改革は推進された(荒井, 2020)。その一環として、大学入試センター試験の廃止、並びに大学入学共通テストが2021年より実施された。2020年の旧試験と2021年の新試験を比較すると、英語試験には次のような変更が生じた。すなわち、(1)リーディングとリスニングの得点比率が4対1から1対1に変更、(2)発音・アクセント問題、語句整序問題の削除、(3)リーディング問題の総語数の大幅な増加(約2800語→約3900語)(朝日新聞, 2021)。(1)については「高等学校学習指導要領に示す4技能のバランスの良い育成」との対応、 (2)については「実際のコミュニケーション」の場面を想定して、音声・文法に関する「知識が活用できるか評価する」ことが目的であると記されている(大学入試センター, 2020, p. 4)。つまり、2021年以降の共通テスト英語試験は2018年の新指導要領をベースに作問された。ただし、新指導要領が施行されるのは2022年の高校1年生からであり、2021年に共通テストを受験する高校生は新課程の対象ではない。

3. 大学入学共通テスト英語試験への評価

 以下では2021年より実施された共通テスト英語試験に対する評価について、 (1)2020年1月から2021年6月にかけて文科省が実施した「大学入試改革のあり方に関する検討会議」(全28回)の発表資料・議事録、(2)大学入試センターが公開している「大学入学共通テスト問題評価・分析委員会報告書」を基に整理していく。便宜上、(1)を「検討会議」、(2)を「報告書」と表記する。

3.1. 「英語4技能」をめぐる議論

 共通テスト英語試験は英語外部試験との併用を前提として作成され(南風原, 2018)、その関係でリーディングとリスニングの2技能に特化した試験となっている(大塚, 2020)。この点について、報告書や検討会議では共通テスト英語試験の4技能化を求める声が複数あった。しかし検討会議では、それに伴う実施コストや技術的問題についても指摘され、最終提言では「出題内容としては『読む』、『聞く』に関する能力を中心としつつ、『話す』、『書く』を含めたコミュニケーション力を支える基盤となる知識等も評価する」(大学入試センター, 2021, p. 26)方針が示された。 

 第18回の検討会議では渡部委員が英語4技能を切り分けて評価・育成することの問題点を指摘した上で、4技能を別々で捉えるのではなく「読んで,聴いて,それを理解したものを発表する」ような「総合的な能力,インテグレーティッドスキル」が重要であると発言した。この指摘を受け、第27回の検討会議では提言の内容について川嶋委員から「『英語4技能』というような表現を使っておりましたが,渡部委員等の御意見も踏まえ,この提言の中では『総合的な英語力』というふうな表現にしております」という説明がされた。事実、最終提言の中でも「4技能」という用語は一切使われていない一方で、「総合的な英語力」という用語は計35回使用されている。結果的に、新学習指導要領で重視されている「統合的な言語活動」に近い内容が提言として示されたと言える。

3.2. 多様な場面・状況を想定した問題作成

 高等学校教科担当教員による報告書の中ではリスニング問題について「より多様な場面, 状況設定」を要望する声が記されており、その一例として「賛成者, 反対者を問う設問」の中で「中立的な立場の設定を設けること」を提案している。これと似た指摘が検討会議でも為された。例えば、第22回に渡部委員が「英語の講義に対して生徒が英語で質問している場面を設定した課題」の設置を提案している。2021, 2022年の共通テスト英語試験のリスニング問題では教室場面での講義内容の理解や、複数話者によるやり取りの内容理解を問う問題は出題されたものの、渡部委員が指摘するような教室内での教師と生徒のやり取りを想定した問題は出題されていない。

4. 2025年の新課程入試の試作問題

 2025年新課程入試に向けた共通テストの問題作成方針・試作問題は2022年11月に大学入試センターによって公開された。試作問題の概要では、「『リーディング』形式と『リスニング』形式の試験問題を通して」「概要や要点, 詳細, 話し手や書き手の意図などを的確に理解する力」や4技能5領域を「統合した言語活動」をふまえて作問する方針が示されている。ただし、「4技能」という用語は資料の中では一切使われていない。

 以下、試作問題の分析を述べる。英語の試作問題ではリーディングが2問、リスニングが1問、計3問が作成された。リーディング問題の第A問では「授業中における生徒のスマートフォン使用の是非」をテーマに5人の主張がそれぞれ記されており(賛成派・反対派・中立派)、その内容理解が問われている。そのうえで、自分がエッセイを書くための準備を想定して、アウトラインや論拠の整理を問う問題が出題されている。第B問では「環境に配慮したファッション」をテーマとした文章を推敲する場面が想定されている。設問の中には文章の論理関係をもとに、適切な接続表現を選択する問題も含まれている。リスニング問題の第C問では「幸福観」に関する講義を聞き、その内容を踏まえて学生同士がディスカッションする場面が想定されている。以上のように、新共通テストでは4技能5領域の統合、特に「やり取り」を重視した問題構成となっていることが窺える。加えて第B問を中心として、論理把握やアカデミックライティングの知識・技能を直接に問う問題が出題されている点も旧試験と大きく異なる点である。2025年の新共通テストでは、読むこと・聞くことを中心としつつも、4技能5領域の統合、論理把握の重視など、新課程との整合性が従来以上に高まることが予想される。

参考文献

朝日新聞 (2021)「使える英語力、量で吟味 大学共通テスト、出題様変わり」2021年1月26日

荒井克弘 (2020)「高大接続改革の現在」中村高康(編)『大学入試がわかる本―改革を議論するための基礎知識』(pp. 249-274) 岩波書店

大塚雄作 (2020)「共通試験の課題と今後への期待―英語民間試験導入施策の頓挫を中心に」『名古屋高等教育研究』20, 153-194.

大学入試センター (2021)「大学入試のあり方に関する検討会議 提言」https://www.mext.go.jp/b_menu/shingi/chousa/koutou/103/toushin/mext_00862.html

南風原朝和(編)(2018)『検証 迷走する英語入試—スピーキング試験と民間委託』岩波書店

付け足し

以下、書きたかったけど字数オーバーで書けなかったこと

  • 2021年の大学入試改革の際は、教育改革の一手段として大学入試改革が推進されていた(小針, 2020)。例えば、2010年代に議論された大学入試への民間試験導入案は、「大学入試にスピーキング試験を導入すれば、高校でのコミュニカティブな活動が推進され、高校生のスピーキング力が向上する」という入試の波及効果を根拠として、改革が推進された(須藤, 2022)。検討会議でも上記の理由から英語4技能試験の実現を望む声は多数寄せられた(例えば、第8回参照)。一方で、共通テストの目的が肥大化している点を指摘する意見も複数挙げられた(例えば、第11回佐藤氏、第15回川嶋委員)。このことが影響してか、最終提言では、共通テストと学習指導要領の親和性を高める重要性を指摘した上で、共通テストの波及効果について「入試改革に過度に期待することは適切ではないが、高等学校以下の教育に望ましい影響やメッセージを与え得る大学入学者選抜に改善することは重要である」(p. 4, 下線は引用者)と控えめな記述が為されている。加えて、新課程が反映される2025年の共通テスト問題作成方針では、従来記されていた「授業改善のメッセージ性も考慮し」という文言が消えている点も特筆に値する(南風原, 2023)。
  • 以上をもとに、センター試験・共通テスト英語試験と学習指導要領の関係性についての変遷を振り返ると次のようになる。まず、2000年代のセンター試験では、倉本 (2020) も指摘するように、センター試験に対する公的な評価は高く、その「高評価の根拠は学習指導要領に忠実に従った出題が行われ『難問奇問を排除した』こと」にあった (p. 38)。しかし、2013年の教育再生実行本部の提言において、大学入試にTOEFLを導入する方針が示されたことを皮切りに、大学入試改革に対する注目が集まった(江利川, 2018; 倉本, 2020)。その後2010年代は、センター試験マークシート方式が及ぼす「高校以下の教育への負の波及効果に対する批判」(倉本, 2020, p. 38)に注目が集まった。加えて、大塚 (2020) が指摘するように、PISAや全国学力テストのような日常生活に英語試験に関して言えば、4技能を重視する学習指導要領と2技能特化型のセンター試験の乖離に注目が集まり、この点についても高校以下の教育への負の波及効果に対する批判が為され、その打開策として大学入試における4技能型の民間試験の活用が推進された(阿部, 2017; 須藤, 2022; 南風原, 2018)。その際、民間試験導入の推進派によって謳われたスローガンが「入試を変えれば教育が変わる」という言説である。つまり、センター試験・共通テストにおける英語試験は、2010年代に学習指導要領との不一致による負の波及効果が批判された結果、その整合性を高めるという発想を超えて、2010年代後半では教育改革を起こすためのツールとして用いられた。その目論見が大失敗に終わり、世間・有識者からの猛批判を浴びたうえで取り組まれる2025年の新課程入試では、教育改革のツールとしての側面は弱まり、学習指導要領との整合性を最優先に設計されることが議事録・試作問題から読み取れる。いわば、「入試によって」教育を変えるのではなく、「入試とともに」あるいは「入試を通じて」新学習指導要領を定着させよう——という控えめな態度が窺える(あくまで英語試験に限定した話だが)。一件落着にも思えるが、そう単純な話ではない。今後の展開として、つぎのケースが考えられる。
    • 新課程入試は、リーディング・リスニングを中心としつつ4技能5領域の統合的な言語技能を測定することを目指してはいるものの、あくまで4技能テストが技術的・費用的問題から実施できないことによる妥協の産物であるため、入試批判は今後も続く。どこぞの日本人の英語力の低さを示すデータを持ってきて、「やっぱり入試にスピーキング試験を導入しないとダメだ! 何も変わらない!」という声が挙げられ、共通テスト英語試験の4技能化が叫ばれる。
    • 批判の矛先が入試批判から教師批判に力点が移る。高校生の英語力が上がらないのは、英語教員が文法訳読の授業ばかりしているからだ、英語教員が英語を話すことができないからだ。英語教員の英検準1級取得率を高めるべきだ——みたいな。

カリキュラムの教育経営学の構築とその課題(天笠, 2019)

読書会で下記文献を読んだ。いろいろと勉強になったので記録を残しておく。要約ではなく、コメントがほとんど。

書誌情報:天笠茂(2019)「カリキュラムの教育経営学の構築とその課題」『日本教経営学会紀要』, 61, 2-12. https://doi.org/10.24493/jasea.61.0_2


カリキュラムの教育経営学は, 教育目標, 教育内容, 授業, 学習評価, 教材・教具, リソースなどをカリキュラムの構成要素として一連の過程を動態的に捉え, “教育内容, 教育方法, マネジメントの一体的な把握” という教育経営学的思惟と手法をもって課題に迫る学問ということになる。(p. 3, 下線は引用者)

    • 教育内容、教育方法の分析に加え、マネジメントすなわち学校組織体制を考慮に入れた分析の必要性を主張。
  • 学習指導要領研究の研究課題 (p. 4)
    • 1. 学習指導要領の総則と各教科等の関係
    • 2. 各教科等における目標と内容の関係
    • 3. 各教科等の学年間及び学年種別間の関係
    • 4. 学習指導要領改訂のプロセス
    • 5. 各教科の教科書の編成・検定・採択と学習指導要領の関係・関わり方
    • 6. 学習指導要領改訂の政策評価はどのように行われているか
  • 【コメント】学習指導要領研究については、教育経営学だと学習指導要領のホリスティックな内容が扱われる一方で、例えば英語教育だと、外国語科・英語科に閉じた議論になりがち。その意味で、1 の視点は重要。
  • 【コメント】5 にあるように、学習指導要領研究に関連して、教科書に関する研究も必要。子安 (2021) が指摘するように、学習指導要領は日常の教育活動で意識されにくいが、指導要領をもとに作成された検定教科書は現場にダイレクトな影響をもたらす。一方で、検定教科書が必ずしも新学習指導要領を反映するわけではないという点に注意する必要がある。例えば英語教育だと、Fact Book のようなタスク寄りの教科書も検定を通過している。また、国語教育にしても、新課程では「論理国語」で論理的・実用的な文章を、「文学国語」で小説や古文・漢文などの文学的な文章を学習する——という括りがあるものの、「論理国語」の教科書で小説を掲載した教科書が検定を通過したことはちょっとしたニュースにもなった(参考記事)。このことからわかるように、検定教科書は学習指導要領や学習指導要領解説のみで編集・作成されるわけではなく、別の要素が強く関係していることが予想される。特に想定されるのが、現場の教員からの要請。そりゃあ、教科書会社からすれば、新指導要領との親和性のみならず、「売り上げ」も重要ですからね。
  • 【コメント】6 については、少なくとも英語教育の界隈では、まともな政策評価は全く行われていないと言っていいだろう。一応それっぽいものとして、文科省による「英語教育実施状況調査」はあるものの、制度設計がきわめて杜撰(詳しくは、寺沢さんの記事を参照してください)。問題点をかいつまんで言えば、(1) CEFRの生徒取得数について「取得した生徒の数+(取得はしていないが)目標レベルに相当すると**教員が見なした**生徒の数」の合算となっており教員(教科主任)の主観性がかなり反映される/(2) 調査の基準が曖昧。「A1相当資格を保持する (or 教員がそう見なした)生徒」と言っても、どの時点でその基準に達していることが条件なのか不明確。だから、例えば、5月に調査に回答するとして、「この生徒は今はA1相当は保持していないけど、11月ごろには保持するポテンシャルはあると思うからカウントしちゃおう!」みたいな恣意性が発揮されやすい/(3) 英語能力の正確な実態調査を目的とするならば、全数調査ではなく抽出調査を採用すべき 。中学生を対象とした調査だと、取得生徒数の割合のトップ層はさいたま市の86.6%、福井県の86.4% の一方で、最下位層は島根県の34.1%、鳥取県の34.6%。その差、およそ50%(笑)。常識的に考えて、この差はありえないやろーーと考えるのが自然ではないだろうか(ちなみに、全国学力テストの英語試験の最上位県と最下位県の差はおよそ10%程度)。これらの数値が(1) をある程度傍証していると言える。
  • カリキュラムが編成されてもその通りに授業が実施されるわけではなく、両者はしばしば乖離する。だからこそ、教育経営学研究でも、教育行政、カリキュラム・教育課程のみに射程を絞るのではなく、「授業」を研究対象とすることが求められる。ところが、「教育経営学の歩みを振り返ったとき、法制度や教育行政などに研究的関心の多くを注ぎ発展させてきた歴史がある。それに対して、授業などの教育活動に向かう問題意識や研究関心の熟成を含め、具体的な取組みは後れを取りがちであったことも否定できない」。(p. 5)
  • 【コメント】「改訂された学習指導要領は、文部科学省から教育委員会を経由して学校・教室までどのように伝わっていくのか」(p. 6) というテーマ。学校・教室レベルの視点で言えば、政府の統制 vs. 現場の自律性。授業まで踏み込むとなると「教科」にまで踏み込まざるを得ず、この点について教育経営研究・学校経営研究ではあまり開拓されていない印象。
  • 【コメント】「(前略)学校や教師への情報伝達については一筋縄ではいかないところがあり, 実態を明らかにすることをはじめ その普及・定着のメカニズムの解明が問われている」(p. 7) について、先日のCELES2023 でも質問をいただいたが、ここで言う「定着」をどう定義するか——という問題。例えば金子 (1995) だと、「新しい学習指導要領に基づいて、とくにそれの改善方針や改善された事項等を、各学校が新しい教育課程に、いかに反映させ、取り上げているかについての一般的傾向」(p. 5) と定義している。けっこうマクロな視点での定義。一方で、本論文で対象とするカリキュラムマネジメントとか、授業レベルでの定着過程を分析対象とするならば、この定義では当てはまりが悪く、よりミクロな視点で定義を設定する必要がある。あと、「定着」を判断する材料として、「期間」という要素も必要では? という指摘を読書会でいただいた。たしかに、新指導要領告示の直後は張り切ってその内容を反映しても、それが持続するかどうかは不明だし。
  • 【コメント】「学術的研究と教育実践をどのようにつないでいくか」(p. 8) という問題。筆者は、「基礎的研究と応用的研究とに分化・発展させていくことがあげられる」(p. 8) と述べている。言いたいことはわからなくもないが、正直なところ、よく理解できなかった。そもそも、「基礎的研究」と「応用的研究」の定義がよくわからない。言いたいことは、研究と実践をつなげる中間領域を構築しよう! ということだと思うが、あまりにもザックリしすぎている気がする。まず、「基礎的研究」を「研究」たらしめる基準は何なのか。当然のことながら、すべての研究が「基礎的研究」として優れているわけではないわけで、その辺の線引きをどう行うか。加えて「応用的研究」について、どこで応用するのか——という視点も必要ではないだろうか。論文中ではもっぱら「授業実践」に傾注しているように思えたが、「基礎的研究」を使用する場面は学校現場のみならず、政策形成レベルにも当てはまる。
  • 【コメント】カリキュラムマネジメントと教育経営課程の違いについて、あらためて大野 (2019) を読み直す必要を感じた。

CELES2023(6月25日) で発表しました

中部地区英語教育学会 (CELES2023) で発表させていただきました(2023年6月25日)。

本発表を聞いた方の中で、何かご意見・ご感想のある方は、ぜひご連絡いただけますと幸いです (so.sudo1998@gmail.com)。また、発表スライドの送付希望があれば喜んでお送りしますので、ぜひご連絡ください。

Work in Progress セッションということで、現在構想中の研究テーマについて発表し、貴重なご意見をたくさんいただきました。Work in Progress セッションは本学会では今年が初めての実施とのことですが、参加させていただいた身としては、途中段階の研究発表が行えるということでとても気軽に参加することができました。加えて、実際に分析を行う前に、リサーチデザインや分析の見通しについての貴重なご意見がいただけるので、今回の発表を通じてかなり研究が前進したと実感しています。ぜひ来年以降も継続していただきたい取り組みだと思います。ありがとうございました。

今回の発表を通じて、あらためて事例研究における「事例」選択の重要性を痛感しました。リサーチデザインではその点がまだまだアマアマだったので、いただいたご助言をもとに洗練させていきます。また、教育政策・教育経営学の知見を取り入れることに注力した結果、本来の強みであるはずの英語教育のドメイン知識に関する検討が不足していた印象なので、その点も今後の検討課題としたいと思います。

以下、記録として発表タイトルと発表要旨を載せておきます。

発表タイトル

中等英語教育を対象とした教育課程経営論の検討 (Work in Progress セッション)

発表要旨(一部加筆修正)

教育の質向上・維持を達成するために、国家は教育政策を通じてある種の統制を行う。その最たる例が学習指導要領であろう。各教科の指導内容や教育課程のありようは少なからず学習指導要領に規定されている。2017, 2018年の学習指導要領改訂により、例えば中学校英語科では授業を英語で行うことが基本とされ、高等学校英語科では発信力を高めるための科目として「論理・表現・Ⅰ・Ⅱ・Ⅲ」が新設された。このような国家による制度的統制は学習指導要領に限定されず、入試もまたそれに含まれる。入試は選抜機能としての側面だけでなく、昨今の大学入試改革(例:英語民間試験活用、大学入学共通テストへの情報Ⅰの導入)が象徴するように、教育現場における授業改善を目的とした教育改革の一手段として用いられている(荒井, 2020)。ここで問題となるのが、このような国による統制が実際にどの程度の拘束力・影響力を教育現場に与えるかという点だ。複数の先行研究(ex. 金子, 1995)で指摘されているように、国による教育政策は教育現場に直線的に影響を与えるのではなく、県・地方・学校・教員といったアクターあるいは社会的関心・イデオロギーを説明変数として、屈折していく可能性がある。つまり、教育実践の改善を目的とした教育政策を検討する際は、国によるマクロな教育政策のみに注目するのではなくその実施過程にも目を向け、政策を駆動させる社会的要因・構造的要因・組織的要因を検討する必要がある。しかし、筆者が専門とする英語教育政策に関して言えば、上記のような実施過程に配慮した政策形成はほとんど為されていないのみならず、このような関心に基づいた研究蓄積もかなり心許ないと言える。以上の問題関心をもとに、博士論文執筆に向けた調査では、英語教育政策の分析に加え、高校を対象としたエスノグラフィー調査を行い、現場で起きていることを明らかにすることを目指す。本発表ではその研究手法について現時点における構想を報告する。

『何のためのテスト?』(ガーゲン&ギル, 2023)3~8章

前回のつづき

sudos.hatenablog.jp

第3章 関係に基づく評価に向けて

  • 本章は2章で検討された「教育=関係のプロセス」という枠組みをどのようにして「評価」に落とし込むか――についての内容

大切なのは、関係の豊かさに焦点をあてることで、公教育の工場モデルの重要な問題の一つである倫理面の貧しさを解決する道が開かれるということである。教育は主観的な感情ではなく客観的な事実を扱うべきだという考えから、倫理や人間の価値観の問題が取り上げられることはほとんどない(p. 64)

  • cf. Gergen (2020); Gill & Thomson (2020)

文献メモ

  • Gergen, Kenneth. (2020). Ethics in Education: A Relational Perspective. 10.1017/9781108769778.003.
  • Gill, S., & Thomson, G. (Eds.). (2020). Ethical Education: Towards an Ecology of Human Development (Cambridge Education Research). Cambridge: Cambridge University Press. doi:10.1017/9781108769778

第4章 関係に基づく評価—初等教育

  • 第4章・第5章が事例紹介パート。
  • 各事例について、そこまで厚く書かれているわけではなかった。1~3章で説明された「関係に基づく評価」の理論的説明に当てはまる事例をちょっとずつ紹介——という感じ。紹介されているのはアメリカやイギリスの学校での事例が中心なので、日本の文脈を考慮するとそれはむずいだろうなぁ、というのもいくつかあった。
  • 本書の全体的なスタンスとして言えることだが、「テストに基づく評価」を徹底的に批判し「関係に基づく評価」をべた褒めする程度が、少し度を越している印象を受けた。当然のことながら、「テストを実施する=悪」とは必ずしも言えないわけで、逆に、「関係に基づく評価=善」とも必ずしも言えない。特に日本のようなテスト文化がきわめて強い教育環境の中で、いきなり「テストに基づく評価」から「関係に基づく評価」へと切り替えるのは大混乱を招くだろうし、そもそも、日本の教育制度の多くがテストを前提として構築されているため、切り替えすら困難、ただの夢物語として終わるだろう(もっとも、著者たちはイギリス・アメリカの教育事情を想定してこの本を書いたのだろうから、この指摘は著者たちへの批判というわけではないが)。その意味で、「関係に基づく評価」についての実践報告をするなら、正の側面だけでなく負の側面も記し、どのようにして解決がはかられたのかという記述まで欲しかったところ。

第5章 関係に基づく評価—中等教育

  • 第4章に同じ

第6章 授業評価への関係論的アプローチ

  • 教育政策の目標や改善計画、評価方法のプロセスから、教員という授業について最もよく知るアクターが排除されてしまっている、という指摘 (cf. Green & Allen, 2015; Kane, Kerr, & Pianta, 2014)。
  • 「業績評価」「目標設定」「カリキュラムデリバリー」という用語が教育の商品化をますます強化している (Spring, 2015)
  • 以下の引用は、本書の全体的な主張を振り返るうえで、concise なまとめ

経営の言説を採用することは、多くの点で有害である。生徒をパッケージ化された「製品」に加工するという、教育の道具的な目的のみが強調されがちだからだ。このような言説では、教育は「生産」行為とみなされる。教師が経済効率性のために管理され、型にはめられてつくられるものとなるとき、学校における関係の文脈から疎外される。教師は賃金労働者となり、教育の崇高な側面は製品づくりに格下げされる。教師による教育への貢献は、事実上、「教える機会」への関与に縮小される。生徒のテストの点数で教師の「アウトプット」が測られ、教師のパフォーマンスが比較可能になる。こうして、システムは、「良い」「効果的」な教師には報酬を与え、「悪い」「効果的でない」教師には罰を与えるというアメとムチのメカニズムを使い、教師のパフォーマンスを向上させようとする。教師は固有の価値観をもっているのではなく、機能を果たすことによってのみ価値を獲得する(pp. 123-124)

  • 専門職コンミュニティにおける相互的な学びの促進 (p. 127)
    • 英語教育の分野で言うと、communities of practice(実践協同体)に相当する内容かと。
    • 相互的な学びの方法として、メンタリングとピア評価が紹介されている。それらの方法の意義を説明したうえで、実施を阻む要因として、時間/信頼/粘り強さを挙げている。

文献メモ

第7章 学校評価の関係論的アプローチ

  • 全国一斉テストについて
    • エリート層による支配の強化につながり得る (Leman, 1999; Guinier, 2015)
    • パフォーマンスの向上に寄与しているかについても検討の余地がある (Wrigley, 2012)
  • 本書では階層の再生産という視点から「テストに基づく評価」が批判されているが、階層の影響を受けるのは「テストに基づく評価」だけでなく「関係に基づく評価」でも(程度の差はあれ)同じではないだろうか。

文献メモ

第8章 関係に基づく評価と教育改革

  • エマージェント・カリキュラム:カリキュラムを静的ではなく動的なものとして捉える (cf. Gill & Thomson, 2012)
  • 「関係に基づく評価」を妨げる実務上の要因(←以下はそれに対する本書の反論)
    • 教員への負担 ← でもteacher-centered じゃなくなるから、理屈的には教員への負担は減るはずだよーという反論
    • 評価の厳密さ ← でも従来の「テストに基づく評価」も社会階層の影響を多分に受けていて価値中立的でないよーという反論(ただし、この反論は「関係に基づく評価」の厳密さをどう担保するかに対する答えにはなっていないと思う)
    • アカウンタビリティ ← そもそも従来の測定についても、テストの妥当性が保障されていない点や、スコアの解釈に文化的構成や社会経済的地位が考慮されていないため、説明責任を果たしているとは言えない(これも上と同じで、「関係に基づく評価」のアカウンタビリティをどう担保するか、という答えにはなっていないと思う)
    • ナショナルスタンダード ← そもそも学校教育の評価基準を第三者機関が設定するのがおかしいのではないかという反論。
    • 入学者選抜 ← ここは本書全体を通して批判されている点。
  • アカウンタビリティ」については、「たとえ近隣の学校であっても、生徒の文化的構成や社会経済的地位などには違いがあり、その結果、テストの点数にも影響が出るだろう」(p. 180) という筆者の指摘については、付加価値モデル (Value-Added Model) を採用すればその問題はある程度解決されるように思う。ただ、それでもいろいろ問題含みなのだが(詳しくは以下の記事を参照)。仮に「関係に基づく評価」を推進するにしても、アカウンタビリティをどう担保するかという視点は必須。関係に基づく評価を実現するためにはそれまで以上に学校の裁量を拡大する必要がある。裁量を拡大すればするほど学校側の責任も重くなるわけで、アカウンタビリティの必要性が増す。自由になればなるほど、説明責任はますます重くなるという逆説。

sudos.hatenablog.jp

  • 「ナショナルスタンダード」の反論内容は、まぁわからなくもないんだけど、いまの(特に日本における)趨勢を考えると、教育水準をめぐる自治体比較や都道府県比較や国際比較の勢いを止めることはむずかしいだろうなぁと。
    • 日本の英語教育を例として挙げれば、民間試験(特に英検)が英語教育の評価基準として使われているが、これがどのようなポジティブ/ネガティブな影響を与えているのかはあまり検討されていない。また、2013-2014 年の政策会議でも問題視されたように、教育に民間が介入すると利益相反の疑いが絡んできてしまうため、仮に教育の評価基準を第三者機関に委ねるとしても、さらにそれを監視する「第四者機関」の設置が必要になり…… 冗談交じりに書いたものの、このことは政策会議でも言及されたことがあり(ex. 「大学入試のあり方に関する検討会議」第11回)、その際はイギリスのOfqual という第三者機関を事例として紹介されたうえで、割と真剣に検討されていた印象。
  • 「関係に基づく評価」を妨げる社会的要因
    • 経済効率性・生産性の向上を最大目的とした管理・監視・測定主義の強化
    • 「管理の重視および倫理や価値観への無関心」(p. 186)
    • 新自由主義、NPM

『何のためのテスト?』(ガーゲン & ギル, 2023)1章・2章

書誌情報:Gergen,J.K., & Scherto R.G. (2020). Beyond the tyranny of testing: Relational evaluation in education. Oxford Acadeic. https://doi.org/10.1093/oso/9780190872762.003.0001 [東村知子・鮫島輝美(訳)(2023)『何のためのテスト?:評価で変わる学校と学び』ナカニシヤ出版]


私の界隈ではけっこう話題になっている文献。
「テストに基づく評価」をWell-being の観点からズタズタに批判し、代替案として「関係に基づく評価」を提案している。
入試改革を専門とする私にとっては非常に重要かつ面白そうな本なので、のんびりとコメントを書いていこうかと。

第1章 テストの暴力的支配を超える

  • 教育に対する新自由主義的アプローチ
    • ネオリベ→教育の商品化→測定主義の強化→Well-being の軽視 (cf. Thomson & Gill, 2020)
    • 試験に対するストレスと生活の健康や幸福感の関係 (cf. Koyama et al., 2014)
    • 「教育の目的が、学習への取り組みではなくテストで成功することになる」 (p. 6)。「試験に出るかどうか」が重要かどうかの基準となる=テストの自己目的化
  • 生徒の学習改善、教師の指導力向上、学校管理職の能力向上を目的としたハイステークス・テスト(ex. 日本でいう全国学力テスト)の問題点として、以下の4点を指摘:(1) 妥当性の問題/(2) 「テストのための指導」の助長/(3) 各地域・学校のコンテクスト・ニーズの無視/(4) (不必要な)教育改革の扇動
  • 【コメント】ここは日本の教育事情と照らして考えると面白そうなので、いくつかコメント。
  • (1) 「妥当性の問題」とは、「生徒の学習を客観的に測れているか?」「測定されるべき内容がそのテストで適切に測定されているか?」という問題。テストの性質上、何を出題とするか、また、何を正解とするかは作成者の恣意性に委ねられざるを得ないため、100% 客観性を担保することは不可能。本書の言い方を借りれば、「試験をする側が選んだ狭いレンズを通して現実をつくり上げている」 (p. 18) 。
    • 英語教育の例として、Native-speakerism が挙げられる。ハイステークスなテストでは公正な評価のために統一した基準が必要。その際、アメリカ・イギリス標準英語が規範とされることが多く、Native-speakerism の助長の恐れあり ( Kubota, 2021)。別の例としては、民間試験で測定される「コミュニケーション能力」と社会で求められる「コミュニケーション能力」の乖離(Kubota, 2020)。
    • 日本の全国学力テストは、行政側によって性質の異なる複数の目的が想定されている印象なので、いろいろ問題含みだと思う。具体的には、テストを行う目的が、「教員の指導改善」なのか、「生徒の学力調査」なのか、「教員・学校・自治体の評価」なのかが曖昧。曖昧というより、この3つが一緒くたになって活用されている印象で、ものすごくカオス。
  • (2) 日本の全国学力テストについて、文科省は「全国的な教育の機会均等と教育水準の維持向上を図る観点から,全国的な児童生徒の学力や学習状況を把握し,分析を行い,教育施策及び教育指導の成果と課題の検証や,その改善に役立てることを目的として」いるため、「仮に数値データの上昇のみを目的にしているととられかねないような行き過ぎた取扱いがあれば,それは本調査の趣旨・目的を損なう」(文科省, 2016)と述べている。しかし実際のところ、学力テスト直前に「テストのための指導」を行う事例は複数報告されている:(1) https://news.yahoo.co.jp/byline/ryouchida/20180829-00094820 / (2) https://373news.com/_news/storyid/166212/?utm_source=dlvr.it / (3) https://www3.nhk.or.jp/lnews/kanazawa/20221013/3020013016.html

都道府県の得点が公表され、しかも各都道府県によっては市町村別の、さらには各市町村によっては学校別の得点が公表されることもある。首長や教育長、学校長は、点数を少しでも高くするべく、学校現場に対して、無言のまたは具体的な重圧をかけていく。
 教員は上からの重圧を受けて、全国学力テストのための対策に時間を割かざるを得ない。文部科学省が「事前対策しなくてもよい」と言ったところで、学校現場はそこから簡単に降りられるような状況ではない。教職員組合がみずから調査をおこない窮状を訴えているのも、そうした首長や教育長、学校長からの抗しがたい重圧があるからに他ならない。

    • テスト結果の活用を「教員・学校・自治体の評価」と紐づけた瞬間に、そのテストは教員・行政側にとってハイステークス・テストとなる。仮にテスト結果が教員の人事や給与、自治体の予算に関係しないローステークスなテストであれば、上記の記事で指摘されているような「重圧」はかかりにくい。一方で、テスト結果が教員の給与の昇給、あるいは、たとえ給与には影響が出ないとしても、教育委員会からの圧力の強化に寄与し得る場合、本来の教育目的から逸脱した指導が為される可能性がある。だからこそ、指導・調査・評価を一緒くたにして学力テストを実施するべきではない。特に、指導・調査と評価は明確に区別されるべきで、「テストのための指導」を引き起こすことなく教員の指導力向上を目的とするのであれば、テスト結果を人事や給与と絡めてはならない。その意味で、学力テストの本来の目的を達成するには、テストがローステークスであることが必要条件である。この点については以下の記事でも述べた:

sudos.hatenablog.jp

  • (3) ここは特にコメントなし。
  • (4) この点についてはハイステークス・テストのみが原因ではないと思うが、たしかにそうだなぁ、と感じた点。日本の学力テストでも都道府県ごとにランキングを発表して 各県の競争を煽っているわけだが、そうなってくると、教育目的の達成の基準が「順位が上がるか or 維持できるか」にすり替わってしまう危険性がある。1位以外の都道府県は1位を取り続けるまで「不十分」と見なされるし、仮に1位を取ったとしても、内田良氏の記事で紹介されていたように、1位であり続けることが目的化してしまいさまざまな弊害を及ぼし得る。そうして学校教育で果たすべき教育内容がどんどん肥大化していき、肥大化していくのみならず、本当に重要な教育内容が果たされなくなる。

文献メモ

  • Koyama A, Matsushita M, Ushijima H, Jono T, Ikeda M. Association between depression, examination-related stressors, and sense of coherence: the Ronin-Sei study. Psychiatry Clin Neurosci. 2014 Jun;68(6):441-7. doi: 10.1111/pcn.12146. Epub 2014 Feb 10. PMID: 24506541.
  • Schwartzman, R. (2013). Consequences of commodifying education. Academic Exchange Quarterly, 17(3), 41-46.
  • Thomson, G., Gill, S., & Goodson, I. (2020). Happiness, Flourishing and the Good Life: A Transformative Vision for Human Well-Being (1st ed.). Routledge. https://doi.org/10.4324/9780429464317

第2章 教育は関係のプロセスである

  • 本書で「テストに基づく評価」に対する代替案として提示されている「関係に基づく評価」の理論パート。
  • 本書では(おそらく)指摘されていないが、ここでいう「関係」の概念はドゥルーズ (Gilles Deleuze)を下敷きにしているように感じた(と偉そうなことを言っているものの、正直に言えばドゥルーズの著作自体を読んだことはなく、千葉雅也さんの『現代思想入門』で少しかじったくらいだが)。いくつかポイントを引いてみると、
    • 「関係を二人以上の独立した人間の出会いとみなす捉え方を転換させ、関係のプロセスが個人という概念に先行するという考え方」(p. 28)
    • 関係のプロセスは共創 (co-orientation) 的であり、かつ、可変的なもの
    • 「教師→生徒」という権力関係からの脱構築
  • ドゥルーズの「リゾーム」や「生成変化」「管理社会批判」と大いに関連するかと。「テストの基づく評価」では、本来多方向に広がっているはずの関係(=リゾーム)が「行政担当者→教師」「教師→生徒」という関係に限定される。さらに、標準化されたカリキュラムや厳格なテストがそのような権力関係を固定化する。まず初めに「A→B」という関係があって、そこに個人があてはめられていく——という構図。さらに、テスト結果を中心に成績評価が行われることで生徒同士の競争意識が芽生え、クラスメートは協働のためのパートナーというより、競争で勝つための敵とみなされる。つまり、本来多様であるはずのリゾームの糸がテスト評価によって断ち切られ、限定化されている——みたいに当てはめて整理できるかと。
  • この辺の話は、やはり「事例」「実践報告」が必要。まぁ、第2章は理論パートだから事例研究の紹介が無いのは当然として、第3章以降でその点に期待。

文献メモ

2020年の民間試験導入問題をめぐる "fairness" についての考察 (Butler & Iino, 2021)

書誌情報
Butler, Y.G., Iino, M. (2021). Fairness in College Entrance Exams in Japan and the Planned Use of External Tests in English. In: Lanteigne, B., Coombe, C., Brown, J.D. (eds) Challenges in Language Testing Around the World. Springer, Singapore. https://doi.org/10.1007/978-981-33-4232-3_5

  • 2020年の大学入試への英語民間試験導入をめぐる議論を「公正性 (fairness)」の観点から分析した論文
  • 阿部 (2017) や南風原 (2018) でも指摘されているCEFR対応表について、次のように批判している:

Critically, the table was not based on MEXT's own validation efforts; instead, MEXT simply put together information reported by the test developers, but the credibility of some of that information (i.e., validity evidence) is questionable. Curiously, MEXT modified the table a couple of times without clearly explaining the changes. For example, TOEIC has a listening and reading test (TOEICL&R, 990 points in total) and a speaking and writing test (TOEIC S&W, 400 points in total), and the sum of the scores of these two tests (1390 points) was used inthe table released by MEXT in July 2017. In the version released in March 2018, however, the TOEIC speaking and writing score was multiplied by 2.5 (1000 points) and added to the TOEIC L&R score, resulting in a total of 1990. Moreover, MEXT simply replaced the old numbers with the new aggregated scores without verifying their compatibility with CEFR (Hato 2018). Unexplained changes were made in all four domestic tests as well. (p. 50, 下線は引用者)

  • Fariness
    • Kane (2010) による fairness についての概念整理をもとに、民間試験導入を分析している。
      • Kane, M. (2010). Validity and fairness. Language Testing, 27(2), 177–182. https://doi.org/10.1177/0265532209349467
      • Kane によると、validity と fairness の関係はそれらの用語をどう定義するかで変わってくる。定義の仕方次第で、validity が fairness を包摂することもあればその逆もあり得る。両者を広義に捉えればほぼ同じ概念を指す、なんてこともあり得る。とはいえ違う用語である以上、それぞれが特に注目・強調する箇所は異なる。そこで Kane は両者の用語を "Are the proposed interpretations and uses of the test scores appropriate for a population over some range of contexts?" (p. 177) という共通の問を検討する用語であると説明したうえで、それぞれについて次のように説明している。

Validity theory has tended to focus on the accuracy and appropriateness of score-based interpretations and decisions about all of the individuals in the population of interest. Analyses of fairness have tended to focus on group differences and on differences in the accuracy and appropriateness of interpretations and decisions across groups, which are defined in terms of race/ethnicity, gender, age, and so on. (p. 181)

      • 【コメント】 印象としては、validity が対象とするのは主に「テストそのもの」なのに対し、fairness は「社会」にも関心が拡げられているように感じた(とはいえ、後の procedural/substantive まで考慮に入れるとそうは言えない気もするが)。
      • Kane は fairness をprocedural due process と substantive due process の2つの観点から考察している。Butler & Iino (2021) でもこの概念整理をもとに、民間試験導入のfairness について検討している。
      • 簡単に言ってしまえば、前者が「すべての受験者が平等に、同じ方法で評価されているか」、後者が「テストの点数の解釈やそれに基づく決定が合理的 (reasonable) で適切 (appropriate) かどうか」を意味する。この定義だけ読んでも後者についてのイメージが掴めなかったのだが、要するに SES (Socioeconomic Status) の観点を含めて公正性を評価しよう——ということだと思う。具体例として、アセスメントやスコアの解釈が valid and fair でも、そのテストで必要となるスキルを受験者である子どもが家庭で学ぶ機会が保障されていなければ substantively unfaird だよね、みたいなことが述べられている。
      • 【コメント】この概念整理は果たしてどれくらい有効なのだろうか。個人的には、上記の procedural fairness と substantive fairness は包摂する内容に差がありすぎるので、両者を "fairness" と一括してまとめることに違和感を覚えた。そもそも、validity/fairness で二分してさらに procedural/substantive に二分しているわけだが、validity と procedural fairness は指している内容がほぼ同じであろう(あえてその2つに分けることで説明力が上がっているとは思えない)。例えば、equality/equity の方がスッキリしそう。
    • まず、民間試験導入について、validity と (procedural) fairness の観点から考察している。CEFR対応表の怪しさ、テスト費用のコスト(経済格差だけでなく地位格差も含む)、採点の怪しさ(高校英語教員や大学講師を採点官として多く雇っている点で)について、validity と fairness が担保されていない点が指摘されている。この点は阿部 (2017) と南風原 (2018) でも検討されているが、英語文献で民間試験導入について論じた先行研究はそう多くないので引用文献としては有用。
    • 肝心の "substantive fairness" についての記述をまとめると以下の通り:
      • 民間試験の一部には学習指導要領外の内容も含まれる → そのための対策が必要 → 進学校の生徒は対策の機会を享受しやすい・裕福な家庭は教育機会を提供しやすい → substantively unfair
      • 日本の英語教育政策では、procedural fairness だけでなく、substantive fairness についても検討すべき、という指摘。
    • 【コメント】繰り返しにはなるが、あえて procedural/substantive という二分法を使う必要はあるのだろうか。というより、「テストそのものの評価」と「経済格差」の話は明確に分けて検討した方が混乱を招きにくいと思う。今回の substantive fairness について言及したいのであれば、ブルデューの理論とかを引いた方がうまく説明できそう。

日本でいう "ALT" は韓国ではコストカットの対象になっていた!

以前、ALT の制度的機能について以下の記事で考察した。

sudos.hatenablog.jp

要約すると、日本のALT 制度はNPM的発想からすれば真っ先にコストカットされそうなのに、根強く残り続けている。なぜか。そこには、ALT が生徒の英語力を向上させるという実利的価値以外に、その学校の商品価値の向上に寄与している実態があるのではないか。つまり、「A高校にはALT がいて、B高校にはいない=A高校は英語教育に力を入れているが、B高校は力を入れていない」のように、ALT の存在が保護者・世間に対する広告塔として機能している可能性がある——といったことをまとめた。

上記の内容について考えるうえで、非常に参考になる論文を読んだ:


書誌情報:Lee, Kathleen. (2014). The Politics of Teaching English in South Korean Schools: Language Ideologies and Language Policy. Publicly Accessible Penn Dissertations. 1339.
https://repository.upenn.edu/edissertations/1339


上記論文は韓国の英語教育政策について、特に "Teaching English in English" policy に注目して調査・分析したもの。その中で、native English-speaking teaching assistants (以下、NS)の雇用についての記述があり、NPM とのつながりを考えるうえで非常に興味深く読んだ。以下、要点ごとにまとめておく。

A few teachers speculated that the TEE certificate program would be eliminated because of the political tendencies of the newly elected superintendent of SMOE, Kwak No-hyun. Sincehis election to office in fall of 2010, Kwak has reduced the budget for English education in support of universal free lunch programs and afterschool programs for underprivileged students. (p. 92)

  • SMOE は Seoul Metropolitan Office of Education の略。TEE は Teaching English in English の略。
  • Kwak No-hyun がソウル教育庁長官に就任以来、NPM的発想が強化され、さまざまな教育施策のコストカットが為される(この論文では "NPM" という用語は用いられていない)。
  • この流れを受けて、NS の大胆な削減も為された:

With the uneven implementation of TEE and TEE certification, critical scrutiny of the TEE policy reveals broader political and economic agendas. Hilda and Nicole noted, in a conversation with me, their suspicion that an increase in the number of TEE certifications would be used to justify discontinuing the costly practice of employing native English-speaking teaching assistants (NESTAs) (FN: 12.07.28). In 2012, SMOE aimed to reduce 4.4 billion won (USD $3.9 million) of 96 the budget by letting go 255 NESTAs employed at Seoul high schools, except for 20 teaching at special foreign language schools (Seung-hye Yim, 2011). By February 2013, middle school positions would also be eliminated leaving approximately 1,000 NESTAs only at elementary schools (S. Kim, 2012). Hilda reasoned that the decision to eliminate secondary school positions was perhaps due to the fact that secondary school teachers majored in English and also there is an extreme focus on test preparation, thus making NESTAs expendable since they were hired to teach conversation. (p. 96, 下線は引用者)

  • 上記の通り、2012年にソウル教育庁は高校のNS を削減することで、 44億ウォン(日本円で約4億6,000万円以上)のコストカットを実現した。この施策の正当化として機能したのが TEE certification であった。韓国では、日本でいう「英語は英語で教える」政策を実現させるために、大規模な教員研修制度を2009 年に導入した。簡単に説明すると、教員として一定の経験年数、英語指導プログラムの受講、オンラインコースの受講、TEE Test of Knowledge という試験での合格、実際の現場指導での監察官による評価を経て、TEE certificate というものが贈呈される(ちなみに、TEE Ace certificate と TEE Master certificate の2種類がある。後者の方が基準は高い)。
  • 日本ではALT が英語教育推進の「広告塔」として機能している一方、韓国ではその役割をネイティブスピーカーに担わせるのではなく、TEE certificate に担わせた。そうすることで、ネイティブスピーカーの雇用を大幅に削減することに抵抗がなかったと言える。もしかすると、各学校で TEE certificate の保有率をアピール材料として使っていたりするのだろうか。
  • 以下の指摘は日本の状況と比較しながら読むと、非常に面白い。

Elementary-school teacher, Dana, also believed that one objective of TEE certification was a cost-cutting measure to “send native speakers home”
explaining that, “some native speaker are not trained. They are not teacher. I think. I can feel when I teach English in English camp, also I know that their English is better than me. But teaching is different, right?” (INT: 11.01.05). While Dana and other teachers acknowledged that there were some effective NESTAs, many teachers I interviewed felt that the cost of recruiting and hiring them did not yield the returns they expected, citing lack of teaching expertise and practical training. (p. 96, 下線は引用者)

  • ネイティブスピーカーは指導者としての訓練をまともに受けてない! という批判は日本でも(一部の研究者を中心に)たびたび為されるが、あまり世間的には浸透していないイメージ。でも、いざ ALT制度を廃止することに舵を切ったら、韓国の例のように真っ先に廃止の根拠として使われるのではないだろうか。