03.05 #疫情時期不忘學習# 系統調整:語文教育評價對核心素養髮展訴求的迴應


#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應


2001年,我國啟動了第八次基礎教育課程改革。伴隨2017年版普通高中課程方案和各學科課程標準的頒佈,我國邁入了“全面深化基礎教育課程改革” 的階段。這一階段的課程改革,最為突出的標識是將“課程發展的邏輯起點”由“學科內容”調整為“核心素養”。

當下和未來較長一段時間裡,如何讓“中國學生髮展核心素養”和 “學科核心素養”落地,是我國基礎教育領域的重大課題。其中,“通過教育考試和評價改革,促進核心素養的落地是關鍵環節”。的確,無論是從 “課程目標、課程內容、課程實施、課程評價” 這樣的課程要素構成來看,還是從既有的經驗和教訓來看,這一輪基於“核心素養”的課程改革,如果沒有與之匹配的評價體系,那麼“核心素養”可能淪為一時的熱詞。因此,在探討核心素養語境下如何“教”的同時,必須深入思考核心素養語境下如何“評價”的問題。


#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應


一、“核心素養”語境下語文教育評價需明確的前提認識

核心素養的提出,自然地會給語文教育評價帶來一些新的問題,譬如“一般核心素養測評和語文學科核心素養測評是什麼關係” “語文學科核心素養是否可以直接測評”等。對此,可以作出如下回答。

(一)一般核心素養測評和語文學科核心素養測評可分可合

從目前既有的理論和實踐來看,一般核心素養的測評有兩種情況:一是專門測評一般核心素養;二是一般核心素養與其他課程整合在一起測評。前者如國際學生評估項目(Program for International Student Assessment,PISA)在閱讀、數學和科學測評之外,有專門的“問題解決”(2012)和 “合作問題解決能力”(2015)測評;後者,一定程度上需要各課程領域根據課程特色,自覺地整合考慮。我國《普通高中語文課程標準(2017版)》(以下簡稱《課程標準》)“評價建議”中指出“評價時要充分考慮語文實踐活動的特點,注意考查學生在活動中表現出來的參與程度、思維特徵,以及溝通合作、解決問題、批判創新等能力……”這樣的建議便是在語文課程測評中適時關聯一般核心素養。本文所說的核心素養語境下的語文教育評價,是立足語文課程,在語文學科核心素養測評中有機關聯一般核心素養要素。

(二)語文學科核心素養依然要通過語文學習活動來考查

在“學科核心素養”的界定和闡釋中,《課程標準》指明:“語文學科核心素養是學生在積極的語言實踐活動中積累與構建起來,並在真實的語言運用情境中表現出來的語言能力及其品質。”“課程目標”部分,《課程標準》的相關表述為:“學生通過閱讀與鑑賞、表達與交流、梳理與探究等語文學習活動,在語言建構與運用、思維發展與提升、審美鑑賞與創造、文化傳承與理解幾個方面都獲得進一步的發展……”“評價建議”部分,《課程標準》指明:“……應圍繞閱讀與鑑賞、表達與交流、梳理與探究等學習活動,在具體的語文學習情境和活動任務中,全面考查學生核心素養的發展情況。”概括而言,語文課程中,學生一般核心素養、語文學科核心素養,還是需要通過“閱讀與鑑賞、表達與交流、梳理與探究”等語文學習活動考查的。

明晰了以上兩個前提認識,便可正式啟動思考核心素養語境下語文教育評價應如何調整。


#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應


二、語文教育評價系統調整的框架和思路

為了取得可見的實踐效果和獲得可持續性發展,核心素養語境下的語文教育評價需作出系統調整。其間有兩個要點:一是從全局出發形成調整的“系統框架”;二是各個環節、局部的“調整思路”都要有針對性。

“系統框架”需兼顧當前語文教育評價改革的需要與評價領域的常規問題(或基本環節)來確立。無論何時,“評價”總會涉及“評價什麼” “如何評價” 這樣的基本問題。其中,“如何評價”又包括中觀的“評價途徑和類型”與微觀的“任務設計、實施和反饋”兩個層面。核心素養語境下的語文教育評價,也需要從這些角度考慮應作出哪些調整。“調整思路”可以通過比較核心素養理念下的培養目標和當前語文教育評價的現狀,明確語文教育評價各環節需要調整的內容、方向。

綜合而言,當前語文教育評價可關注圖1所示的系統調整框架和思路。以下逐一探討各層面的實踐切入點。

#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應

圖1語文教育評價系統調整的框架與思路

(一)充分理解和全面考慮評價“領域”

“測量的第一個階段,要回答一個問題:‘我們測量的是什麼’?我們需要用一個‘標籤’來識別‘構念’(construct)。更重要的是,我們需要為這個‘構念’界定‘領域’(domain),即根據關於這個‘構念’的理論和相關知識識別一些可操作的指標(operational indicators)。”對於我國目前的語文教育評價來說,測量的“構念”可指向語文學科核心素養;我們可以為其界定的“領域”,即“一些可操作的指標”可包括“閱讀與鑑賞、表達與交流、梳理與探究”(高中),或“識字與寫字、閱讀、寫作、口語交際、綜合性學習”(目前義務教育課程標準中的學習領域)。到這一步,操作性還不夠,還要為閱讀、寫作等領域找到更加具體的操作指標或任務設計的切入點。

根據測量理論,測量“領域”的選擇和理解至關重要,這會影響測量的內容效度和結構效度。從這個意義上講,核心素養語境下,測評什麼和不測評什麼需仔細推敲,這直接關涉所測評的是不是學生核心素養的相關表現。

反觀實踐,在測評領域的選擇和理解上,存在著一些差異和落差。譬如,以2018年我國東西南北中16個地區的語文中考試題來看:有4份試卷不考名著閱讀;有4份試卷考到了名著閱讀,但只考信息記憶;有4份試卷兼顧考查名著閱讀中的記憶和理解能力;有4份試卷中的名著閱讀題則專門考查理解或理解以上層級的能力(注:與地區發達與否沒有必然關係)。再如,有些地方規定寫作只考記敘文寫作,有些地方會考到不同文體。這些差異彙總起來,就代表了對測量“構念”不同的理解,對測量“領域”不同的選擇和理解。部分選擇,恐怕與語文學科核心素養、核心素養這些“構念”並不匹配。高考語文(全國卷1)文學類文本閱讀和實用類文本閱讀由選考改為必考,則反映了對語文測量“構念”和“領域”的認識在發展。當下,根據對核心素養、語文學科核心素養的理解,結合國際測評經驗,有必要從不同角度思考語文測評“領域”。

其一,原本被邊緣化,但核心素養語境下需重視的部分。譬如,口語交際。進入21世紀,各個國家和地區在制訂核心素養體系時,不約而同地高度重視溝通交流能力。溝通交流能力主要對應於母語課程中的口語交際能力,各個國家和地區的母語課程標準對此都有具體、詳細的要求。縱觀我國語文課程發展史,語文教學大綱或課程標準層面一直都有關於聽說或口語交際的相關要求,但口語交際教學一直處於語文教學實踐的邊緣。當下,重視口語交際,既符合語文學科本體規律,又能呼應核心素養培養要求。2017版高中語文課程標準中的學業質量標準,雖然篇幅有限,但還是有關於口語交際的學習結果要求:能敏銳地感受交際對象的語言特點和情感特徵,迅速判斷其表達的正誤與恰當程度,察覺其言外之意和隱含的情感傾向;能根據具體的語境和表達的目的、要求,運用口頭語言,文從字順、準確生動地表達自己的真情實感。樂於與他人分享自己的學習經驗……。這是四級水平中的要求,是高校考試招生錄取的要求。然而現實中,學生不敢交流、不善交流的情況還較為普遍。因此,核心素養語境下,應該給予曾經被忽視的口語交際教學和評價更多的關注。

其二,原本就有,但可以略作調整、拓展的部分。譬如,閱讀後的寫作。已有的相關實踐主要是為了引導學生積累寫作素材或借鑑所讀文章的寫法,以促進寫作。這樣一種取向本身是有意義的。不過我們不能忽略部分學生寫作中存在的這樣一種現象:追求好詞好句,追求“旁徵博引”,卻不善於好好分析、說理。對此,我們不妨重視另一種取向的“讀寫結合”,即通過寫來表達對所讀內容的理解、思考、評論等。在2017版高中語文課程標準中,每一個任務群的學習要求和教學提示中都提出了“寫作”要求,具體形式有:寫概要或提要、讀書筆記、作品評介、調查報告、文學評論、學術性小論文等。這些內容需要引起我們的重視。這一類任務,可以從不同角度觀察到學生閱讀、寫作以及批判性思維能力的發展情況。這一脈的“讀寫結合”,在國外被稱為“通過寫作學習” (writing to learn)或“實質性寫作”(substantive writing)等。

其三,原本沒有正式提出,需要新研究的測評“領域”。譬如,整本書閱讀、思辨性讀寫等。對於這些較新的“領域”,首先,要加深對這些“領域”的內涵、目標的理解,“在教師開始評估學生的批判性思維能力前,他們自己先要有這些能力。否則,他們沒有立場來評估他們學生的思維。”其次,要考慮這些新領域如何和已有的閱讀、寫作等測評領域融合。

以上從三個方面談了如何通過精選和深入理解測評“領域”來儘可能逼近“核心素養”取向的評價。不過,這裡所提及的一些測評“領域”,可能超越了我們印象中的“考試”範圍;按照這樣的思路,也許我們的“考試”會不堪重負;有些內容,現在似乎也不具備考試的條件。事實上,核心素養語境下,語文教育評價改革需要走出狹隘的“考試”意義上的評價觀,同時豐富對於“考試”的認識。

(二)有針對性地選擇和規劃評價類型

核心素養或學科核心素養“是複雜的理論,對既有測評理論和實踐提出了嚴峻的挑戰”。對於這樣難測的“構念”,克服困難的途徑有兩條。一是研究並發展紙筆考試,精心選擇測試領域,精心設計題目。這一方面,高利害考試命題者和測量與評價領域的研究者正在努力推進。二是廣大語文教師可在日常教學中紮實地豐富評價的途徑和類型。

2003版高中語文課程標準和2011版義務教育語文課程標準中早已提出應恰當運用多種評價方式,只是沒有達到期待的實踐效果。在當下核心素養語境下,它們又贏得了人們的高度關注。當然,此時的關注會有些更加明確的著力點。

1.進一步加強形成性評價在評價體系中的地位

美國在2010年頒佈各州共同核心標準(Common Core State Standards, CCSS)後,聯邦政府共撥款3.62億美元給兩個評估聯盟,即“大學及職業準備評價合作伙伴”(Partnership for Assessment of Readiness for College and Careers,PARCC)和“智慧平衡評價聯盟”(Smarter Balanced Assessment Consortium,SBAC),要求他們制訂基於CCSS的學業評估體系。其比較突出的一個共同點是都承諾“評估體系將由一種用於問責目的的總結性(年末)評估和用於整個學年的形成性評估組合而成”。從我們的視角來看,相對於中高考這些高利害、選拔性考試而言,這裡所說的學年末的總結性評估和貫穿學年的形成性評估,都是廣義的形成性評估。美國通過形成性評估來落實基於美國“21世紀技能”(可以理解為美國版核心素養)的新課程標準CCSS的力度,由此可見一斑。

為什麼要如此重視形成性評價?測量與評價領域,基本已經形成了定論,形成性評價和終結性評價,有著各自的功能,任何好的評價方案都需要這兩種評價。這本是評價實踐領域應有的常態。在核心素養語境下,更需要兼顧這兩類評估,因為素養的形成是累積的過程,需要長時間、多角度的觀察。

反觀實踐,似乎我們日常教學中從來不缺“評價”,不過日常評價很多時候是高利害性質的終結性考試的“附庸”。核心素養語境下,形成性評價需要豐富樣式。

2.有針對性地大力使用表現性評價

“基於核心素養的課程改革驅動著評價體系的變革,促使我們必須超越傳統的只注重‘雙基’的客觀紙筆測驗,採用並豐富‘能檢測學生的認知思維和推理能力以及運用知識去解決真實、有意義的問題的能力’的表現性評價。”

我們對錶現性評價概念並不陌生,其先於核心素養概念出現。當下的著力點是更加準確地理解表現性評價,更有針對性和更大幅度地運用表現性評價。需要特別指出的是,表現性評價任務是相對於“有固定答案的標準化測試而言的”,它可以用紙筆形式實施,也可以用非紙筆形式實施。

#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應

表1表現性評價的類型

表1中的任務都屬於表現性任務,這些任務類型可以衍生出可大可小、可深可淺的具體任務,如一次考試的一個題目、一個小型研究項目等。不同規模的表現性評價任務可以組合使用。無論任務規模如何,採用什麼形式實施,表現性任務的關鍵是背後有較為明確的指向:我希望我的學生髮展哪些重要的認知技能或特質?(例如,以書面形式有效地溝通,利用原始資料和參考資料分析問題);我希望我的學生髮展什麼樣的社交和情感技能或特質?(例如,獨立工作,與他人合作,對自己的能力有信心,認真負責);我希望我的學生髮展什麼元認知技能?(例如,反思他們的寫作過程,評估研究策略的成效,回顧他們的進展);我希望他們能解決什麼類型的問題?(例如,研究解決沒有唯一正確答案的問題);我希望我的學生能夠應用哪些概念和原則?(例如瞭解因果關係)。


表現性評價的關鍵是指向高階思維技能,讓學生建構自己的反應。這就涉及“如何評價”更微觀和操作層面的問題,也就是如何設計任務與如何對學生的反應作出反饋。

(三)優化任務設計並重點關注評價反饋

將上文的思考延續至任務設計層面,首先要努力做到兩點:一是切實為核心素養語境下產生的新領域或既有領域的新方向設計任務;二是著力設計有針對性的表現性任務。其後要從命題技術角度考慮核心素養語境下的測評任務有何特點。

指向核心素養的測評任務有何特徵?當前提及最多的屬性是“情境化”“綜合性”等。用2017版語文課程標準中的話語來說即“以具體情境為載體”“設計典型任務”。關於這兩點,筆者已經專門撰文論述,此處強調三點:其一,不應給紙筆考試,尤其高利害考試過多的壓力,日常教學過程是實施這類任務更為廣闊的天地;其二,不應為了“情境”而“情境”,為了“綜合”而“綜合”,任務設計需有明晰的意圖,如前文表現性任務反思清單所提示的那樣;其三,應多元、立體地理解“情境”,語文學習內容本身構築起了一定的情境,不必時時添加“小明”這樣的人物和事件因素,除非能調動學生的學習興趣,或情境中隱含著問題,有助於學生體驗發現問題、提出問題、分析問題的環節等。

與任務設計同等重要的,是完成任務後的評價反饋環節。課堂教學中的評價反饋、課後的作業及試題的評價反饋,要特別關注以下三點。

首先,聚焦學生“表現”。前文已述及,指向核心素養的評價應以表現性任務為主。往前追溯,其實經典的迪克(Walter Dick)和凱里(Lou Carry)教學設計模型已經強調在識別目標階段要 “寫出表現目標(performance objective)”,即教學目標應描述學生在完成一個單位的學習後,能做什麼。為了保證評價的效度,這種關注學生“表現”的意圖應該延續到評價反饋環節。2017版高中語文課程標準呈現了學業質量標準,“學業質量標準將核心素養和教學內容有機地連接起來”。“學業質量是學生在完成本學科課程學習後的學業成就表現”,“學業質量標準”本質上是“表現”標準。因此,在日常的教學評價反饋、作業和試題評價反饋中,應該走出標準答案、採點給分的模式,而關注學生實際“能做什麼”,在這個過程中,可以適當參考學業質量標準的水平描述。

其次,區分表現差異。表現性評價會用到很多“開放性”題目或任務。目前存在的一種誤區是,將某些開放題的評分建議簡化為一句籠統的“言之成理即可”,這樣的評分方法會降低測試效度,無法有效地實現診斷功能。教師還是要對學生反應的實質差異作出專業的判斷。

為了縱向把握學生個體發展過程中的變化,橫向把握學生與學生之間的發展差異,評價反饋的關鍵之一是區分學生的表現差異,給學生提供有針對性的反饋。這在課堂中體現為教師給出有針對性的評價和指導;在考試閱卷中,體現為根據分層標準賦分,讓分數具有較強的解釋力。相比而言,後者是更迫切需要解決的問題,良好的試題評分方法也能帶動日常教學評價語的發展。

分層賦分需要用到分層評分標準,其基本構成要素為:水平層級、各水平層級描述語及回答樣例。前兩個要素,可以參考學業質量標準的樣式,其中難點是如何分層描述學生對於特定題目的反應表現。從目前的研究和實踐來看,有兩種方式:一是命題階段就有意識地根據一定的理論框架(如“可觀察的學習成果結構”,Structure of the Observed Learning Outcome,SOLO)設計題目並設置評分標準;二是“採用歸納方式,通過分析學生對開放性任務的各種反應,揭示不同個體的關鍵特徵和理解方式,歸納為不同類型或等級,作為當前任務的評分標準”。當然,實際操作中,兩條路徑通常是融合使用的,同時還需要準確把握測量目標,對相關的學科內容和學習過程有較為深入的認識。

再次,適當開發類型化評分工具。主觀題的分層評分標準,開發成本較高。在日常教學中,可以適當開發一些類型化的評分標準(也叫評價量表、評分規則等)。譬如口語交際的評價量表、各種類型寫作的評價量表、整本書閱讀過程中的任務評價量表等。這些評分標準,通常採用分項評分標準(也叫分析式評分量表),即以表格形式分項分等級描述可能的表現。師生運用時,可以較為具體地診斷特定方面當前的表現水平狀態,並且能夠通過評分標準中更高層級的質量描述語,明晰下一階段的努力方向。

類型化評分標準的開發需要一定的研究積累和時間投入,但從長遠來看有諸多好處:能減輕教師寫評語的工作量;能增強反饋的系統性和針對性,目前“因語言籠統而指導性弱是通病”;在研發這些評分標準的過程中,教師的評價素養和學科知識素養等都能獲得一定的提升;運用甚至讓學生參與評分標準的設定,“有利於培養學生的元認知意識,最終提高教育者需要關注的高層次思維技能”。“讓學生開始參與評估工具開發的有效方法是向他們提供兩個例子,好的和不好的,要求他們討論兩者差異。”


#疫情時期不忘學習#   系統調整:語文教育評價對核心素養髮展訴求的回應


三、語文教育評價系統調整的品質追求

綜上,本文在兼顧核心素養培育需求和反思語文教育評價既有問題的基礎上,嘗試勾勒了核心素養語境下語文教育評價可能的系統調整框架和思路。

最後,必須強調:核心素養的培育不是一蹴而就的,指向核心素養培育的教學和評價改革也不是一蹴而就的,愈是如此,愈要有一定的全局觀,整體考慮改革路徑。同時,語文教育評價之“系統調整”應具備如下三個品質。其一,完整性,即評價什麼——評價領域的選擇,如何評價——評價類型的選擇和規劃以及評價任務的設計,如何反饋——評價標準的開發和運用,這幾個層面和環節同等重要,每一個環節和層面都需要著力研究。其二,豐富性,即評價什麼、如何評價和如何反饋,每個環節或層面內部應該保持足夠的豐富性。評價領域應該涉及語文學習內部的各個領域;評價的類型應該兼顧過程性評價和終結性評價,標準化測試和表現性評價;反饋環節應該關注學生知識、技能、情感等方面的具體表現。其三,一致性,即評價什麼、如何評價、如何反饋,這幾個環節、層面必須保持內在一致性,引發、聚焦學生指向核心素養的具體表現。

只有保障語文教育評價改革的完整性、內部一致性和語文評價體系的豐富性,讓語文評價各個層面、環節一起作出相應調整,彼此呼應、形成合力,才能讓學生獲得符合語文學科規律的學習經歷和符合未來發展需要的語文學習結果,核心素養才能在語文課程體系中真正落地。


作者 葉麗新/華東師範大學教師教育學院副研究員,教育學博士,碩士生導師


分享到:


相關文章: