考核是檢驗教學(xué)質(zhì)量最重要的手段之一,試卷的質(zhì)量和學(xué)生考試成績(jì)是衡量教學(xué)質(zhì)量的主要方法。通過(guò)對試卷分析,可以反饋學(xué)生學(xué)習情況,評估教學(xué)效果,為進(jìn)一步推進(jìn)教學(xué)改革、提高教學(xué)質(zhì)量提供參考。[1]雖然目前許多下面是小編為大家整理的2023年度考試成績(jì)分析總結【五篇】(全文),供大家參考。
考試成績(jì)分析總結范文第1篇
一、引言
考核是檢驗教學(xué)質(zhì)量最重要的手段之一,試卷的質(zhì)量和學(xué)生考試成績(jì)是衡量教學(xué)質(zhì)量的主要方法。通過(guò)對試卷分析,可以反饋學(xué)生學(xué)習情況,評估教學(xué)效果,為進(jìn)一步推進(jìn)教學(xué)改革、提高教學(xué)質(zhì)量提供參考。[1]
雖然目前許多高校在教學(xué)評價(jià)方面都呼吁評價(jià)形式的多樣化,但試卷測試仍然是最主要的方法,因此試卷質(zhì)量分析成為高校教師教學(xué)過(guò)程中的一個(gè)必備環(huán)節。目前多數學(xué)科如數學(xué)和醫學(xué)專(zhuān)業(yè)已經(jīng)重視試卷成績(jì)和試題質(zhì)量分析,[2-7]]對世界自然地理的課程與教學(xué)改革方面進(jìn)行研究較少,[8-10]賀丹君等從評價(jià)體系上對地理課程進(jìn)行定性分析和評價(jià),未對試卷質(zhì)量進(jìn)行定量分析。[11]然而,《世界自然地理》是高等院校地理專(zhuān)業(yè)的必修課程之一,它最能體現地理學(xué)的綜合性、區域性和人地相關(guān)性,具有其它地理學(xué)分支學(xué)科不可比擬的優(yōu)勢,所以對《世界自然地理》試卷成績(jì)進(jìn)行定量分析,評價(jià)試卷的優(yōu)劣是很有必要的。本文對2007級地理科學(xué)專(zhuān)業(yè)57名學(xué)生的世界自然地理期末考試成績(jì)進(jìn)行分析,評判試卷對學(xué)生學(xué)習情況的反映能力,旨在為今后的考試命題和教學(xué)改革提供參考依據。
二、數據來(lái)源與研究方法
1. 數據來(lái)源
2007級地理科學(xué)本文由收集整理專(zhuān)業(yè)的本科生共57名學(xué)生的世界自然地理期末考試試卷。試卷由任課教師命題,試卷評判嚴格按照評分標準和標準答案進(jìn)行,由任課教師評分。試卷卷面分值滿(mǎn)分為100分,包括4種題型,26道小題:第一題單項選擇題包含15道小題,占總題目數的57.69%,共15分;
第二題簡(jiǎn)答題包含5道小題,占總題目數的19.23%,共40分;
第三題填圖題包含4道小題,40個(gè)空,占總題目數的15.38%,共20分;
第四題論述題包含2道小題,占總題目數的7.69%,共25分。
2. 方法
試卷分析主要是指通過(guò)收集一定量的原始數據,按照設定的評價(jià)指標,運用測量學(xué)和統計學(xué)的理論,通過(guò)計算各種統計量數和繪制統計圖表,對試卷進(jìn)行定量分析和評價(jià)。[12]可以針對某一門(mén)課程,比較學(xué)生各成績(jì)段的比例,分析學(xué)生成績(jì)的分布是否合理,與試卷內容是否相關(guān)等。評價(jià)指標可以從教學(xué)大綱、命題、試題數量比例等方面來(lái)設定。
試卷質(zhì)量的統計分析是運用數理統計描述和統計推斷的方法,對試卷的數量特征和數量關(guān)系進(jìn)行分析和判斷。[12]根據《教育測量學(xué)》的介紹,[13]本文主要選取難度、區分度兩個(gè)指標對試卷質(zhì)量進(jìn)行統計分析。
(1)難度。試題的難度是衡量試題難易程度的指標。[13]
在編制試題時(shí),難度分布從易到難,逐步增加難度,這樣有利于考生水平的正常發(fā)揮。試題的難度即考生對該題的通過(guò)率或得分率,對于答對得1分、答錯或不答得0分的試題,難度(p)就是答對(或通過(guò))試題的人數與考生總數之比:
(1)
式中,r為答對該題的人數,n為考生總數。
對于滿(mǎn)分量大于1分的試題,難度則是考生對該題的平均得分與該題的滿(mǎn)分之比:
(2)
式中, 為考生對該題的平均得分, 為該題的滿(mǎn)分。p值越大,試題越容易。因為百分制以60分為及格,通常情況下,把平均難度控制在0.45~0.75之間比較合適。[13]試題難度的評價(jià)標準見(jiàn)表1。
表1 試題難度的評價(jià)標準
(2)區分度。題目區分度是指檢驗題目對其學(xué)業(yè)水平不同的考生的區分程度或鑒別能力,它是學(xué)生掌握知識水平和能力差異的指標。[14]通過(guò)考試,學(xué)習好的學(xué)生得到高分,學(xué)習差的學(xué)生得到低分,則說(shuō)明試題的區分度高;
如果學(xué)生中好、中、差三個(gè)層次的考試成績(jì)處于同一個(gè)分數段中,就反映不出學(xué)生學(xué)習水平,那么這樣的試題區分度就低。所以一般采用比較方便的兩端分組法來(lái)計算試題的區分度。所謂兩端分組法,即當測試成績(jì)成正態(tài)分布時(shí),將考試總分進(jìn)行排序,然后選出得分最高的27%列為高分組,將得分最低的27%列為低分組。區分度計算公式如下:
,其中i=1,2,3,……n (3)
式中, 和 分別表示全體考生中的高分組和低分組中第i題的平均分;
表示第i 題的滿(mǎn)分值。d≥0.40為優(yōu)秀;
0.30≤d<0.40為良好;
0.20≤d<0.30為尚可,需改進(jìn);
d<0.20為劣,需淘汰或修改。[15]試題區分度的評價(jià)標準具體見(jiàn)表2。
表2 試題區分度的評價(jià)標準
3. 結果分析
從2007級地理科學(xué)專(zhuān)業(yè)世界自然地理期末考試的成績(jì)分布來(lái)看,試卷滿(mǎn)分為100分,客觀(guān)題總分為35,主觀(guān)題總分為65,學(xué)生考試的平均成績(jì)?yōu)?8.35,最高分為91,最低分40.5,標準差10.10,及格率為80.7%,不及格率為19.3%。
一是課程成績(jì)分布情況分析。
(1)試卷總成績(jì)分布:2007級地理科學(xué)班的57名學(xué)生,有39名學(xué)生成績(jì)分布在60~79分內,占68.42%;
有6名學(xué)生成績(jì)分布在80~89分內,占10.53%;
有10名學(xué)生成績(jì)分布在50~59分內,占17.54%;
僅1名學(xué)生成績(jì)高于90分和低于40分,各占1.75%,見(jiàn)表3。通過(guò)繪制成績(jì)分布直方圖可以看出,該班期末成績(jì)總體呈正態(tài)分布,見(jiàn)圖1。教育統計學(xué)統計規律表明:學(xué)生的智力水平,包括學(xué)習能力,實(shí)際動(dòng)手能力等呈正態(tài)分布??荚嚦煽?jì)分布應基本服從正態(tài)分布,這樣才能真實(shí)反映學(xué)生的實(shí)際,也能夠說(shuō)明試卷設計是合理和具有科學(xué)依據和實(shí)際意義的。[15]本試卷總成績(jì)呈正態(tài)分布,說(shuō)明試卷總體設計合理、可靠、科學(xué)。
轉貼于
表3 《世界自然地理》期末考試總成績(jì)分布情況
圖1 《世界自然地理》期末考試成績(jì)分布圖
(2)試卷各大題成績(jì)分布。該試卷共四個(gè)大題,因為各題總分不一樣,所以把各大題以100分為基準,對分數段進(jìn)行折合計算,具體各分數段的人數和比例見(jiàn)表4。通過(guò)對各大題繪制直方圖可以看出,單選題、填圖題成績(jì)分布呈偏正態(tài)分布,簡(jiǎn)答題成績(jì)呈偏態(tài)分布,但是沒(méi)有單選題和填圖題嚴重,大體還呈正態(tài)分布,這看出就大題而言,單選和填圖題設計過(guò)于簡(jiǎn)單,不能很好反應學(xué)生的學(xué)習能力,但是單選和填圖屬于識記類(lèi)知識類(lèi)型,本來(lái)就不好區分學(xué)生層次,所以總體看來(lái)還是符合實(shí)際的;
簡(jiǎn)答和論述題成績(jì)大致呈正態(tài)分布,能較好地體現學(xué)生學(xué)習效果的差異和智力水平,設計很好,見(jiàn)圖2。
二是難度、區分度分析。從總成績(jì)看,試卷難度為0.680,試卷區分度為0.402,表明整卷難度適中,區分度好,總體來(lái)說(shuō)試卷質(zhì)量?jì)?yōu)良。在各大題中,難度都適中,區分度除了單項選擇題為0.29,試題尚可,須進(jìn)一步改進(jìn)外,其它三道大題都為優(yōu)良。結合2007級地理專(zhuān)業(yè)的學(xué)生為理科生的專(zhuān)業(yè)背景,地理基礎知識相對薄弱的實(shí)際情況,可以看出該試卷的論述題等反映綜合能力的試題偏難,但區分度較好,適合考核學(xué)生的實(shí)際學(xué)習水平,有利于提高學(xué)生考試的有效性程度,見(jiàn)表5。
三、結論及建議
通過(guò)結果分析可以看出,該試卷整體的命題結構好,學(xué)生總成績(jì)和大部分大題成績(jì)呈正態(tài)分布,試題難度適中,除了選擇題之外,其他題型區分度很好。建議以后命題要嚴格按照教學(xué)文件規定的要求,不斷完善命題工作,特別是選擇題的要加強命題的難度和區分度,同時(shí)應該從新課改的理念出發(fā),不斷改進(jìn)命題工作,讓考試在教學(xué)過(guò)程中發(fā)揮其應有的積極作用。
1. 試卷構成
整卷共四道大題,26道小題,客觀(guān)題和主觀(guān)題的比例為7:13;
客觀(guān)題主要考核學(xué)生對世界自然地理的基本概念及基本知識的掌握與理解的程度,而主觀(guān)題則是考核學(xué)生歸納總結、分析、理解和應用知識的能力。本試卷考試內容覆蓋面較廣,基本涵蓋教學(xué)大綱要求的大部分教學(xué)知識點(diǎn),符合教學(xué)大綱的要求。該試卷試題綜合了教學(xué)大綱的多個(gè)知識點(diǎn),適當增加了一定的難度和深度。試卷結構記憶類(lèi)占20%,理解類(lèi)占40%,簡(jiǎn)單類(lèi)占15%,綜合應用類(lèi)占25%;
試卷各類(lèi)題型所占的比例均符合教學(xué)要求,難度適中則反映出本課程的基本知識點(diǎn)、重點(diǎn)和難點(diǎn)。
2. 考試成績(jì)分布
由于2007地科班屬于理科生,沒(méi)有高中地理知識的基礎,所以本次試卷的命題不但注重學(xué)生綜合分析能力的提升,同時(shí)也關(guān)注學(xué)生的地理基礎知識,因此試題大約有70%是考察學(xué)生綜合思維能力和分析能力的,涉及知識范圍較廣,其目的是提高學(xué)生對所學(xué)課堂內容進(jìn)行總結提煉及實(shí)際應用,也設計有30%左右的基本知識題,如選擇和填圖題。從總成績(jì)來(lái)看,該卷的成績(jì)分布是呈正態(tài)分布,反映出絕大多數學(xué)生對考查綜合能力的試題還是比較適應的,其分值大部分集中在60~80分,見(jiàn)圖1;
從各大題成績(jì)來(lái)看,簡(jiǎn)答和論述題成績(jì)基本呈正態(tài)分布,試卷能很好區分學(xué)生層次和體現他們各自的能力水平,能很好達到測驗目的,但是單選、填圖題的成績(jì)分布呈偏正態(tài),雖然這兩大題屬于識記型,但是作為試卷設計,還是應該從科學(xué)性測驗出發(fā),更好體現學(xué)生水平為原則,所以在以后的命題中,會(huì )更加注重這兩部分題目的科學(xué)性和實(shí)踐性。綜合以上分析表明,本次考試基本反映出學(xué)生對世界自然地理知識學(xué)習的實(shí)際水平,同時(shí)也說(shuō)明命題者對試題難度等因素掌握得較好。
3. 試題的難度與區分度
難度和區分度都是判斷試題質(zhì)量的重要指標,用于衡量考生能力的程度。通過(guò)一次考試將不同程度和不同能力的學(xué)生區別開(kāi)來(lái)。難度系數(p)是反映試題難易程度的重要參數,難度系數越小,說(shuō)明試題難度越大。一般認為試題的難度系數應控制在0.45~0.75之間比較合適。[10]本次試卷的平均難度系數為0.68,四個(gè)大題的難度分別為(單選題0.72,簡(jiǎn)答題0.70,填圖題0.71,論述題0.62),不管是從整個(gè)試卷來(lái)看還是從各大題來(lái)看,本套考卷所有類(lèi)型試題的難度系數在0.62~0.72之間,根據表1(試題難度的評價(jià)標準)來(lái)看,試題難易程度適中,比較合理,能區分學(xué)生能力。
區分度(d)是衡量試題質(zhì)量的另一重要因素,是評價(jià)試題質(zhì)量、篩選試題的主要指標,d值越大,區分效果越好。一般認為,d≥0.4,區分度極好;
0.3≤d≤0.39,區分度良好;
d≤0.19,區分度極差;
所以試題區分度≥0.20即為可用試題,而區分度≤0.19的試題應該被淘汰。世界自然地理是地理學(xué)的一門(mén)基礎主干課程,有其特殊性,概念多,需要記憶的知識多,尤其記憶各大洲的山脈、河流、湖泊容易記錯,各周的地理位置不易描述,而且該級的學(xué)生是理科生出生,地理基礎知識掌握有待提高,諸多因素使命題者難以把握試卷的難易程度及區分度。在本試卷中,整卷區分度為0.402,各大題中,除了單選題的區分度<0.30(為0.29)外,簡(jiǎn)答題、填圖題和論述題的區分度均>0.40(分別為0.53、0.48和0.52),而且簡(jiǎn)答題、論述題的區分度非常好(d>0.5)。通過(guò)試卷分析表明,本套試題的區分度、易難度良好,其分析結果為命題者今后的命題工作提供了參考依據。但今后對單選題和繪圖題的區分度還需要進(jìn)一步加以改進(jìn),判斷題應淘汰或注意完善該題型的區分度。
4. 今后命題工作的導向
考試成績(jì)分析總結范文第2篇
[關(guān)鍵詞] 助理全科醫師;
試卷分析;
信度;
難度系數;
區別度
[中圖分類(lèi)號] R-4 [文獻標識碼] C [文章編號] 1673-9701(2017)02-0125-03
Brief introduction to commonly used indicators of assistant general practitioner"s examination paper
ZHANG Donghai1 ZHAO Liuzhuang2 GANG Jun3 XU Deying4 LIU Shuang3 MA Xiuhua2
1.Department of Gastroenterology, Daxing Hospital, Capital Medical University, Beijing 102600, China;
2.Office of Hospital, Daxing Hospital, Capital Medical University, Beijing 102600, China;
3.Department of Science and Education, Daxing Hospital, Capital Medical University, Beijing 102600, China;
4.General Practice and Continuing Education of Capital Medical Unicersity School, Beijing 100069, China
[Abstract] Eight indicators are used in evaluating examination quality, including reliability, validity, difficulty, discrimination testing and average marks, standard deviation, score distribution, grade. Commonly used methods for the above indexes which are suitable for general graduation examination paper analysis would be introduced briefly.
[Key words] Assistant general practitioners;
Examination paper analysis;
Reliability;
Difficulty coefficient;
Difference degree
試卷分析是針對大量的成績(jì)數據進(jìn)行統計、計算、分析,進(jìn)而得出科學(xué)結論的過(guò)程。試卷分析屬于“教育測量學(xué)”的范疇。通過(guò)試卷分析可能提煉出諸多對考試質(zhì)量進(jìn)行評價(jià)的數據,此時(shí)試卷就不是單純地“考試”,而是變(升華)為“試卷分析”。通過(guò)試卷分析所得到的比較科學(xué)的分析結果,可以進(jìn)一步展開(kāi)對教學(xué)活動(dòng)評價(jià),了解教學(xué)質(zhì)量以及學(xué)生的學(xué)習質(zhì)量(如對知識的掌握程度)等[1-7]。評價(jià)考試質(zhì)量常用8個(gè)指標,包括涉及試卷的信度以及效度、難度、區分度,還包括平均分數以及標準差、分數分布狀態(tài)、成績(jì)[8-10]。對于上述指標進(jìn)行分析的方法學(xué)較多、有的較為繁雜。我們曾做過(guò)相應試卷分析工作[11,12],現結合工作體會(huì )將適合結業(yè)試卷分析的一般常用方法做一簡(jiǎn)介。
1 主要涉及試卷質(zhì)量指標(信度、效度、難度、區分度)的一般分析方法[8,13-14]
1.1 試卷試題難度分析的常用具體方法
難度系數(P)通常是指試卷以及試題的難易程度,可以反映或評價(jià)大部分學(xué)生對該試題或試卷知識點(diǎn)的掌握程度。難度系數分析應該包括試題難度系數與試卷難度系數兩部分,僅進(jìn)行試卷難度系數分析不易找出具體問(wèn)題(即總成績(jì)可能掩蓋具體得分點(diǎn))。
1.1.1 試卷總體難度分析的常用方法 試卷整體難度一般以0.6~0.8為宜。方法1:難度系數(P)=試卷的平均得分÷該試卷的滿(mǎn)分值。如:試卷平均分為75分,該試卷滿(mǎn)分為100分,則P=0.75。該方法較為粗糙,故較少采用。方法2:試卷難度系數(P)=(考試成績(jì)前27%學(xué)生的得分之和+考試成績(jì)后27%學(xué)生的得分之和)/兩組總人數滿(mǎn)分之和(考試成績(jì)前27%學(xué)生指考試成績(jì)排名在前27%的學(xué)生,將這些學(xué)生的成績(jì)相加即為得分之和;
考試成績(jì)排名在后27%的學(xué)員以此類(lèi)推)。
1.1.2 試題難度系數(P)常用計算公式 方法1:難度系數=試題的平均得分÷該題的滿(mǎn)分值。方法2:難度系數=該題的總得分÷該題的滿(mǎn)分值。滿(mǎn)分值是指:參加考試人數×該題卷面的分值。如果所有試題均采用1分制(即:滿(mǎn)分100分,試題100道,每道1分;
不采用扣分制),則該題得滿(mǎn)分值就是參考人數。所得結果也是該題的答題正確率。此時(shí)用方法2就較為方便。
1.2 區別度分析的具體方法學(xué)
區別度(D)是指能夠區分考試(測驗)成績(jì)好的學(xué)生和考試(測驗)成績(jì)差的學(xué)生的指標,一般通過(guò)計算高分數段和低分數段學(xué)生的難度系數而得出。要同時(shí)分析試題區別度數與試卷區別度,單獨分析試卷區別度易于掩蓋試題的區別指數,誤導選用試題。區別度越高,區分能力越強。但是,在結業(yè)考試中允許D=0的試題出現。一般以
1.3 試卷信度分析的具體方法學(xué)
試卷信度(α)評價(jià)該試卷檢測結果的可靠程度、可重復性的指標,即為評價(jià)被測者在測試中的實(shí)際測量值與真實(shí)能力是否一致性的指標。最好的試卷信度應該在0.9以上,若低于0.7以下則不甚可靠。計算方法如下。
1.3.1 克朗巴赫公式[Cronbach系數(α)] (α)= 試題數/試題數-1×[(所有被測者第i題的方差-所有被測者總分的方差)/所有被測者第i題的方差]。該方法適用于非選擇題以及多值計分題(即:試卷試題的類(lèi)型較多、各題分值不同,如包括多選題、是非題、問(wèn)答題等)。計算過(guò)程較為復雜,需要每道試題計算后得出結果,該方法應用較多。
1.3.2 庫德-理查遜信度(簡(jiǎn)化)公式 適合用于每題1分的選擇題(即試題計分為1分或0分的試題)。信度系數=[n(s-1)2-X(n-X)]/[(n-1)s2](計算較為簡(jiǎn)單)。(n為卷面滿(mǎn)分成績(jì),X為平均總分,s為標準差)[11]。該方法最大的好處是不需要逐題計算通過(guò)率。
1.3.3 庫德-理查遜信度(簡(jiǎn)化)公式的進(jìn)一步簡(jiǎn)化 計算較為簡(jiǎn)單。此公式適用于所有試題為每題1分選擇題的試卷。信度系數=[K/(K-1)]{1-[X(K-X)/Ks2]}。K為測題的數目,X為平均總分,s為標準差)[5]。
1.3.4 相關(guān)系數(R)計算[10] 該方法計算較為復雜。具體公式可以參考相關(guān)文獻。
1.4 試卷效度分析
效度用于評判測量的正確性、有效性(反映測量到的與所要測量的二者之間的符合程度)[5,6,8,14-15]。如果將測驗總分看作是內部效標,則該測題的區分度也就是該測題的效度(即內部效標的效度)[5,6,8,14]。所以,如果僅分析試卷本身只要有區別度即可。因此,在多數的研究中沒(méi)有計算“效度”[1,3,7,11]。其他獲得效度的方法如下。
1.4.1 相關(guān)系數(R)計算 基本方法是通過(guò)計算兩門(mén)性質(zhì)相近學(xué)科、或同一學(xué)科前后兩次考試成績(jì)的相關(guān)系數(R)來(lái)評價(jià)此次考試成績(jì)的有效性。
1.4.2 百分一致法 按考試成績(jì)將學(xué)生分為高、中、低3組,用各個(gè)試題中高、低分組之差除以相應的滿(mǎn)分,即可得出此題的效度值。這實(shí)際上雷同于“區分度計算”方式,僅適應于本試卷的檢測[16]。
1.5 試題難度系數(P)與區別度(D)之間的關(guān)系
P值越大則說(shuō)明試題難度越?。▋热轂槎鄶祵W(xué)生掌握),P值越小說(shuō)明試題難度越大(多數學(xué)生未掌握),此兩種情況試卷或試題的區別度均較差;
要有較好的區別度,試題難度應適中。
較易試題的難度系數≥0.7;
0.4
2 主要體現學(xué)生成績(jì)的分析指標(成績(jì)、平均分數、標準差、分布狀態(tài))[5,6,10,13,14]
2.1 成績(jì)
即考生試卷的總得分。這是基本原始數據,是所有數據分析的基礎數據,必須仔細輸入。
2.2 平均分數
是最直觀(guān)的集中量數。一般認為平均分數的最佳數值為75(百分制)。
2.3 標準差(s)
例如,甲班與乙班的考試平均分數相近但分數分布差異明顯,則不能說(shuō)兩個(gè)班級的成績(jì)相近。此時(shí)不僅要考慮到平均分數,還要計算分數的離散程度(簡(jiǎn)單可以理解為“分數分布情況”,學(xué)術(shù)名稱(chēng)――差異量數)。常用的差異量數有多種,經(jīng)常采用的差異量數是標準差。計算公式可以在統計學(xué)教材查找到。計算標準差,理論上講學(xué)生人數越多越好。一般認為:標準差≤10即能符合要求。標準差過(guò)大說(shuō)明全班分數差異過(guò)大,需要教師予以注意;
但過(guò)小則信度下降,區別度下降,標準差也可用于信度計算。
2.4 分布狀態(tài)
簡(jiǎn)單理解就是看整個(gè)班級(年級)學(xué)生的成績(jì)分布情況。一般要求是正態(tài)分布,結業(yè)考試可以允許一定的正偏態(tài)分布,但絕不能完全一邊倒。一般習慣是利用成績(jì)分布曲線(xiàn)分析學(xué)生的考試成績(jì)(縱坐標為學(xué)生人數,橫坐標為分數),可以直觀(guān)的下結論(定性分析);
如果要進(jìn)行定量分析,則需進(jìn)一步計算偏態(tài)量數及峰態(tài)量數[10]。
試卷分析的方法學(xué)較多,本文僅介紹較為簡(jiǎn)單、易于掌握的部分。利用試卷分析結果,可以評價(jià)教學(xué)效果,但其評價(jià)的基礎是要有高質(zhì)量的“試卷”(難易程度適當、知識點(diǎn)掌握的較好),這同樣涉及教與學(xué)兩方面的努力。試卷分析僅僅是手段而已,也可稱(chēng)為是教育測量的工具。在進(jìn)行試卷分析的準備過(guò)程中,首先要編制適合測試對象的“試卷”:編制試卷則要根據測驗目的進(jìn)行,最基本的是要依據測驗功能決定是進(jìn)行能力傾向測驗(學(xué)生的潛在能力如何?)是學(xué)業(yè)成績(jì)測驗(考察學(xué)生經(jīng)過(guò)教育教學(xué)過(guò)程后學(xué)業(yè)成績(jì)的掌握情況,也稱(chēng)“考試”)。進(jìn)一步,則要根據培養目標進(jìn)行分數解釋?zhuān)绻恰澳繕藚⒄招詼y驗”則其及格就是最基本的教學(xué)要求水平參照點(diǎn),分數愈高說(shuō)明達標的完滿(mǎn)程度愈高;
如果是“常模參照性測驗”,即測驗目的是鑒別性測驗(優(yōu)選,如高考),則測驗的難度就要適當增加以利于選拔。結業(yè)測驗一般是“目標參照性測驗”,本文介紹的簡(jiǎn)便方法學(xué)適用于“目標參照性測驗”。
研究結業(yè)考核標準與模式是不斷探討的課題[17],結業(yè)試卷分析不僅可以評價(jià)本次考核內容的學(xué)生掌握情況、教師教學(xué)效果,同時(shí)也可以評價(jià)不同教學(xué)單位在教授同一課程時(shí)其間教學(xué)效果的差異性[18]?!?+2”助理全科醫師培訓[19-21]是一項新的工作,我們在其中的《臨床綜合課程》教學(xué)實(shí)踐、教學(xué)管理中,納入試卷分析體系作為評價(jià)整體教學(xué)水平、發(fā)現不同教學(xué)單位教學(xué)差異點(diǎn)的手段之一[8,9],取得了較好的效果,不僅了解了教學(xué)效果,同時(shí)也為提出新的教學(xué)思路提供啟發(fā)點(diǎn),為集體備課提供了具體依據。因此,掌握試卷分析方法學(xué),既是教師的基本功(特別是高校教師),也是教學(xué)管理部門(mén)應該熟悉的管理內容與管理技術(shù)。
[參考文獻]
[1] 張正祥,劉國慶,王廷慧,等. 延安大學(xué)醫學(xué)院藥理學(xué)試卷分析[J]. 中華醫學(xué)教育雜志,2008,28(4):120-122.
[2] 孫敏,王錦帆,祖勤,等. 醫學(xué)生學(xué)習中期評估測試實(shí)效分析[J]. 中華醫學(xué)教育雜志,2013,33(4):617-620.
[3] 盧燕,王培玉,劉寶花. 北京大學(xué)醫學(xué)部八年制疾病預防醫學(xué)期末考試試卷分析[J]. 中華醫學(xué)教育雜志,2013, 33(5):791-793.
[4] 和永祥,王淵,徐俊麗,等. 內科學(xué)考試試卷分析與評價(jià)[J].西北醫學(xué)教育,2006,14(3):304-305.
[5] 王孝玲,教育測量(高等師范院校教材)(第2版)[M]. 上海:華東師范大學(xué)出版社,2005:1-188.
[6] 黃穎,林端宜. 試卷分析研究現狀綜述[J]. 西北醫學(xué)教育,2005,13(1):39-40.
[7] 宋青,蔡景一. 試卷考核質(zhì)量評價(jià)[J]. 中國高等醫學(xué)教育,2006,(11):30-31.
[8] 高衛紅,任俊峰. 利用教育統計學(xué)原理進(jìn)行考試質(zhì)量分析方法初探[J]. 武警醫學(xué)院學(xué)報,2004,13(3):214-218.
[9] 田考聰,彭斌. 試卷質(zhì)量定量分析系統中的幾個(gè)參數及其應用[J]. 醫學(xué)教育探索,2004,3(4):52-54.
[10] 張玲玲,梅忠義. 對學(xué)生成績(jì)評價(jià)指標體系中一些問(wèn)題的思考,合肥工業(yè)大學(xué)學(xué)報(社會(huì )科學(xué)版),2006,20(2):19-21.
[11] 馬秀華,張東海,黃東明,等. “3+2”助理全科醫師培訓《臨床綜合課程》結業(yè)試卷評價(jià)及相關(guān)因素分析[J]. 中國醫學(xué)教育技術(shù),2015,29(2):213-217.
[12] 馬秀華,張東海,徐德穎,等. “3+2”助理全科醫師培訓中《臨床綜合課程》結業(yè)試卷分析評價(jià)[J]. 中華醫學(xué)教育探索雜志,2016,15(5):445-450.
[13] 彭斌. 試卷質(zhì)量定量分析系統中的幾個(gè)參數及其應用[J].中華醫學(xué)教育探索,2004,3(4):52-54.
[14] 劉新平,劉存俠. 教育統計與測評導論(第1版)[M]. 北京:科學(xué)出版社,2003:133-156.
[15] 史宏燦,龔衛娟,鄭英,等. 以國家執業(yè)醫師資格考試為參照的臨床醫學(xué)教學(xué)改革思考[J]. 中華醫學(xué)教育探索雜志,2016,15(5):459-464.
[16] 陳欣,戴社教,趙暹,等. 不同類(lèi)型試題對醫學(xué)影像學(xué)考試評價(jià)的效能分析[J]. 中華醫學(xué)教育探索雜志,2016, 15(5):455-458.
[17] 趙麗莉,李嶄,黃艷. “3+2”培訓項目結業(yè)考核標準與模式的研究[J]. 繼續醫學(xué)教育,2015,29(11):4-5.
[18] 張東海,馬秀華,趙留莊,等. 通過(guò)臨床綜合課程結業(yè)試卷分析不同教學(xué)單位教學(xué)效果的差異[J]. 衛生職業(yè)教育,2016,34(12):101-103.
[19] 黃艷,線(xiàn)福華,趙麗莉,等. “3+2”助理全科醫師培養模式的探索與實(shí)踐[J]. 中華醫學(xué)教育雜志,2014,34(2):31-33.
[20] 張東海,馬秀華,黃東明,等. “3+2”助理全科醫師培訓首輪課程施后的思考[J]. 中華醫學(xué)教育探索雜志,2015,14(8):837-840.
考試成績(jì)分析總結范文第3篇
一旦考試后,成績(jì)出來(lái)了,也就有了兩極分化,當然成績(jì)好了,學(xué)生會(huì )很高興,家長(cháng)和教師都會(huì )表?yè)P的;
而成績(jì)差的學(xué)生就會(huì )感覺(jué)到來(lái)自教師和家長(cháng)的壓力,有時(shí)候這壓力是無(wú)形的。我就接觸過(guò)一個(gè)學(xué)生,他考試成績(jì)差了,自己已經(jīng)感到很內疚了。雖然家長(cháng)鼓勵他,教師也沒(méi)說(shuō)什么,但他總覺(jué)得有壓力。其實(shí),對于學(xué)生來(lái)說(shuō),一套試卷上總有一兩道難題可能不會(huì )做;
也有自己覺(jué)得會(huì )的知識點(diǎn)做錯的;
也有可能是學(xué)生沒(méi)有發(fā)揮好,沒(méi)有做好,成績(jì)就下降了。因此,教師要客觀(guān)地看待學(xué)生的考試成績(jì),重要的是通過(guò)評析試卷來(lái)發(fā)現自己教學(xué)中的問(wèn)題,不斷提高教學(xué)效率。對于成績(jì)突出的學(xué)生,教師應給予鼓勵和表?yè)P,進(jìn)而對其提出更高的目標要求,充分發(fā)揮他們的數學(xué)學(xué)習潛能,促使其在數學(xué)的廣闊天地間自由地翱翔;
對于成績(jì)差的學(xué)生,通過(guò)試卷分析,找出失分的原因,進(jìn)行數學(xué)解題思想的培養,挖掘他們的學(xué)習潛力,提高他們學(xué)習數學(xué)的積極性和主動(dòng)性。
二、試卷評析的過(guò)程與學(xué)生掌握知識之間的關(guān)系
不論怎樣的考試,學(xué)生在考試結束后,都有一種對考試結果的期待。這時(shí)的學(xué)生積極等待答案,對試卷中不確定的答案有一種期盼。在這樣的狀態(tài)下,如果教師能及時(shí)抓住時(shí)機進(jìn)行講評,學(xué)生的印象會(huì )很深刻,掌握知識也更牢固。
(一)考試后及時(shí)批閱試卷很多學(xué)校都很重視考試后的試卷批閱工作,總是在考試結束后及時(shí)組織教師進(jìn)行試卷批閱。試卷評析是一項細致的工作,教師需要把試卷上學(xué)生出現的問(wèn)題詳細地進(jìn)行分類(lèi)歸納,哪些知識點(diǎn)是易錯的,哪些知識點(diǎn)是學(xué)生沒(méi)有掌握的。教師一定要做好試卷的分類(lèi)統計工作,為后面的講評服務(wù)。要嚴格杜絕一些教師認為試卷講評就是對答案的做法,這樣的講評是對學(xué)生不負責任,對學(xué)生的成績(jì)提高沒(méi)有好處。
(二)教師要重視講評過(guò)程,把握講評策略平時(shí)的考試是對學(xué)生一個(gè)階段的學(xué)習的總結,教師在講評試卷時(shí),應講究策略,重視講評的過(guò)程。特別是對于一些典型的題目,教師要在試卷分析時(shí)就做足功課。我總是在講評試卷前,把學(xué)生在典型題目的第幾步出現的錯誤都非常詳細地記錄下來(lái),是學(xué)生沒(méi)有記住公式,還是不會(huì )做,或者是粗心大意做錯了,把這些問(wèn)題一一羅列出來(lái),在講評時(shí)對共性的問(wèn)題重點(diǎn)指出來(lái),對于個(gè)性問(wèn)題課下再單獨指出來(lái),通過(guò)講評試卷,提高學(xué)生綜合運用知識的能力。教師還要給學(xué)生講解應試的技巧,尋找解題的規律,通過(guò)不斷練習來(lái)提高學(xué)生的解題速度,全面提高學(xué)生的學(xué)習能力。在試卷中出現了錯誤,說(shuō)明學(xué)生對某個(gè)知識點(diǎn)掌握得不足,教師在評析試卷時(shí)要找出學(xué)生在數學(xué)知識上存在的不足,同時(shí)幫助學(xué)生分析在解題方法和解題思路上存在的缺陷,尤其需要注意的是易錯題,或者是同一個(gè)知識點(diǎn)多次出現錯誤,通過(guò)對試卷的講解,要讓學(xué)生查漏補缺,鞏固知識。一次考試就是一次總結,總結就會(huì )有反思,有反思就會(huì )有提高,這樣形成良性循環(huán),使學(xué)生的綜合能力得到提高。
三、教師要客觀(guān)對待學(xué)生的成績(jì)
考試成績(jì)分析總結范文第4篇
[關(guān)鍵詞]SPSS;
期末考試成績(jì);
統計分析
1 引言
統計分析軟件――SPSS(Statistical Package for the Social sci,ence)的中文譯名為社會(huì )科學(xué)統計軟件包,它是世界著(zhù)名的、優(yōu)秀的統計分析軟件之一。SPSS是一個(gè)具有綜合性的專(zhuān)業(yè)統計分析和數據管理系統。SPSS數據管理和分析功能強大,界面友好,操作簡(jiǎn)單,有靈活的變量變換和文件交換系統,多種統計圖表的結果輸出,并具有與Microsoft Office軟件兼容等特點(diǎn),在社會(huì )學(xué)、醫學(xué)、心理學(xué)、人文學(xué)、生物學(xué)、教育學(xué)等領(lǐng)域已取得了深入的應用。它操作簡(jiǎn)便、好學(xué)易懂、簡(jiǎn)單實(shí)用,是學(xué)術(shù)界經(jīng)常使用的計量軟件。SPSS的主要功能為:回歸及相關(guān)分析、聚類(lèi)與判別分析、主成分分析及因子分析等十幾個(gè)大類(lèi)。下文將以某班學(xué)生的期末考試成績(jì)?yōu)闃颖?,?jiǎn)單分析了一下SPSS在學(xué)術(shù)研究中的具體應用案例。
2 數據來(lái)源和數據錄入
筆者通過(guò)運用統計分析軟件SPSS,對某班30名同學(xué)的一次期末考試成績(jì)進(jìn)行了統計分析,各項成績(jì)包括大學(xué)體育、程序設計語(yǔ)言、成績(jì)設計語(yǔ)言SJ、思想和中國特色社會(huì )主義理論體系概論、大學(xué)英語(yǔ)、檔案學(xué)概論、信息系統管理和總分8項,統計數據如表1所示。將存在于excel中的表1,通過(guò)“文件”“打開(kāi)”“數據”“文件類(lèi)型”選擇excel一選中表某班同學(xué)期末考試成績(jì)所在的excel文件一點(diǎn)擊“打開(kāi)”,便可將excel中的數據導入SPSS。
3 數據分析
3.1 描述性分析
3.1.1 頻數
在數據視圖中進(jìn)行以下操作:點(diǎn)擊菜單欄中的“分析”“描述統計”“頻率”將7門(mén)課程及總分項添加到變量中,選中“圖表”中的“直方圖”并勾選“帶正態(tài)曲線(xiàn)”后點(diǎn)擊“繼續”,勾選“顯示頻率表格”項,點(diǎn)擊“確定”共出現8個(gè)直方圖,圖1是其中一個(gè)。由圖1可分析,大學(xué)體育成績(jì)的均值為89.03分,取得89-91分的同學(xué)占8人,得分在80分以下的2位同學(xué)需加強此方面的鍛煉。大學(xué)體育成績(jì)呈正態(tài)分布,標準差為5.411,反映出此體育教師的評分較合理。
3.1.2 平均數與標準差
在數據視圖中進(jìn)行以下操作:點(diǎn)擊菜單欄中的“分析”“描述統計”“描述”在“描述性”對話(huà)框中添加7門(mén)課程和總分項到“變量”,勾選“將標準化得分另存為變量”,點(diǎn)擊選項中的“均值”、“標準差”、“最大值”、“最小值”后點(diǎn)擊“繼續”,單擊“確定”所得結果如表2:
由表1可知,大學(xué)英語(yǔ)中的極小值為55分,存在掛課現象,該同學(xué)必須重修,來(lái)年選課時(shí)應及時(shí)通知該同學(xué)重修。程序設計語(yǔ)言和大學(xué)英語(yǔ)的均值達不到70分,英語(yǔ)和計算機是當代大學(xué)生必備的兩個(gè)技能,我班需實(shí)施一些措施來(lái)提高同學(xué)們的英語(yǔ)和計算機水平。程序設計語(yǔ)言的標準差高達10.189分,極大值94分,同學(xué)們可以向計算機水平高的2009409035等同學(xué)請教。
3.1.3 分組求平均值
分組求平均值是對數據分組描述,可以輸出分組數據的均值、標準差、極值等,即對數據進(jìn)行多層分類(lèi)匯總。點(diǎn)擊菜單欄中的“分析”“比較均值”“均值”在“均值”對話(huà)框中,將“總分”添加到“因變量列表”、“大學(xué)體育”添加到“自變量列表”,點(diǎn)擊確定。結果為表2:
隨著(zhù)體育成績(jì)的逐步提高,總成績(jì)均值出現了高低起伏不定的趨勢,這說(shuō)明體育成績(jì)和總分之間沒(méi)有必然的聯(lián)系。加強體質(zhì)鍛煉不會(huì )影響自己的學(xué)習成績(jì),因此多運動(dòng)不應成為成績(jì)不佳的借口。作為當今社會(huì )的一名大學(xué)生,只是學(xué)習好是不行的。學(xué)習固然重要,但大學(xué)作為與社會(huì )接觸的橋梁,素質(zhì)拓展活動(dòng)也不可缺少。同學(xué)們應努力提升自己的綜合素質(zhì),力圖使自己成為一名四有新人,德智體美各方面全部發(fā)展。
3.1.4 數據探測
點(diǎn)擊菜單欄中的“分析”“描述統計”“探索”在彈出的“探索”對話(huà)框中,將“總分”添加到“因變量列表”、“檔案學(xué)概論”和“信息系統管理”添加到“因子列表”,選擇“繪制”中的“莖葉圖”后單擊“繼續”,選擇“輸出”中的“圖”,最后點(diǎn)擊“確定”生成如圖2所示的兩張箱線(xiàn)圖:
圖2中的兩幅圖呈現出同一個(gè)趨勢,即數據點(diǎn)分布在左下角和右上角的對角線(xiàn)附近。也就是說(shuō),無(wú)論是檔案學(xué)概論的成績(jì)還是信息系統管理的成績(jì),都與總分是正相關(guān)的關(guān)系。換句話(huà)講,一般情況下,專(zhuān)業(yè)課成績(jì)高的同學(xué),總分也就越高。由此可見(jiàn)專(zhuān)業(yè)課的重要性,在日常的學(xué)習中,同學(xué)們應把專(zhuān)業(yè)課放在首要位置。
3.2 聚類(lèi)分析
聚類(lèi)分析是根據一批樣本的多個(gè)觀(guān)測指標,具體找出一些能夠度量樣品或指標之間相似程度的統計量,以這些統計量為劃分類(lèi)型的依據,把一些相似程度較大的樣品(或指標)聚合為一類(lèi)。類(lèi)聚分析是研究“物以類(lèi)聚”的一種方法。
現將全班30人按總分分為三類(lèi),以直觀(guān)、簡(jiǎn)明的方式統計每個(gè)同學(xué)在學(xué)習成績(jì)上所處的位置,具體操作步驟如下:點(diǎn)擊菜單欄中的“分析”“分類(lèi)”“系統聚類(lèi)”一在彈出的對話(huà)框中,將“總分”添加到“變量”、“學(xué)號”添加到“標注個(gè)案”,分群為“個(gè)案”,輸出勾選“圖”,在“繪制”中勾選“樹(shù)狀圖”,然后繼續一單擊“確定,最后生成樹(shù)狀圖。
3.3 多維尺度分析
多維尺度分析技術(shù)是一種探索性數據分析技術(shù),可以將含有多個(gè)變量的大型數據壓縮到一個(gè)低維空間,形成一個(gè)直觀(guān)的空間圖形,以空間中的點(diǎn)表示變量之間的潛在規律性聯(lián)系。
通過(guò)SPSS統計軟件“度量”功能中的“多維尺度”分析功能??梢苑治銎唛T(mén)課程之間的潛在規律性聯(lián)系,具體操作步驟如下:“分析”“度量”“多維尺度”在“多維尺度”對話(huà)框中,將七門(mén)課程添加到“變量”,數據為距離數據選擇“正對稱(chēng)”,“模型”中度量水平為“序數”、條件性為“矩陣”、維數均為“2”,選項中的輸出選擇“組圖”點(diǎn)擊“確定”,生成圖3。通過(guò)圖3可以看出七門(mén)課程之間的潛在性規律,如程序設計語(yǔ)言和大學(xué)英語(yǔ)被劃分在第二象限,其中的潛在性規律可能有很多,比如均分都比較低等。通過(guò)此圖也可以驗證上文的一些結論。
3.4 相關(guān)分析
相關(guān)分析是研究一個(gè)變量與另一個(gè)變量間的相互關(guān)系。研究變量間相互關(guān)系的性質(zhì)和緊密程度。換句話(huà)講,相關(guān)分析的任務(wù)是對相關(guān)關(guān)系給予定量的描述。
4 結語(yǔ)
成績(jì)分析是教育系統的有機組成部分,對考試成績(jì)的分析測量和評價(jià)應當是每個(gè)教師和同學(xué)必備的能力。SPSS在考試數據統計分析中應用廣泛,本文結合具體數據,從描述性分析、聚類(lèi)分析、多維尺度分析和相關(guān)分析四個(gè)方面介紹了使用SPSS進(jìn)行統計分析的一般方法和步驟,并提出一些實(shí)際存在的問(wèn)題和建議。通過(guò)分析該班同學(xué)的期末考試成績(jì),筆者更加深入地了解了同學(xué)們的學(xué)習現狀,相信此次統計分析結果會(huì )為該班提供很好的借鑒,同時(shí)也希望能為年輕的科研人員提供一種研究思路。
參考文獻
[1]楊曉秋,圖書(shū)館讀者滿(mǎn)意度調查問(wèn)卷的SPSS設計[J],農業(yè)圖書(shū)情報學(xué)刊,2 008(20):171-174
[2]楊曉明,SPSS在教育統計中的應用[M],北京:高等教育出版社,2004
[3]趙守盈,呂紅云,多維尺度分析技術(shù)的特點(diǎn)及幾個(gè)基礎問(wèn)題[J],評價(jià)與測量,2010(4):13-19
[4]曹玲,楊靜,夏嚴,國內競爭情報領(lǐng)域研究論文的共詞聚類(lèi)分析[J],情報科學(xué),2011(28):923-930
[5]李延波,房紅芳,SPSS統計軟件在大學(xué)英語(yǔ)考試成績(jì)分析中的應用[J],考試研究,2011(20):1-3
[6]崔永紅,李學(xué)民,運用SPSS對專(zhuān)業(yè)基礎課與專(zhuān)業(yè)課成績(jì)分析[J],科教研究,2011(14):34-36
[7]潘小燕,統計分析軟件在大學(xué)英語(yǔ)教學(xué)測試效果評估中的英語(yǔ)[J],科教文匯,2011(3):112-113
考試成績(jì)分析總結范文第5篇
關(guān)鍵詞:SPSS;
統計;
難度;
區分度;
信度;
效度
中圖分類(lèi)號:G642文獻標識碼:A文章編號:1009-3044(2017)17-0121-03
試卷作為考試的一個(gè)重要載體,是測評學(xué)生學(xué)習成績(jì)的工具,是教學(xué)質(zhì)量檢驗的重要手段,因而教學(xué)質(zhì)量評估管理中越來(lái)越重視試卷分析,試卷質(zhì)量的分析結果客觀(guān)地向教與學(xué)雙方提供了反饋信息,進(jìn)而實(shí)現評價(jià)教育目的的實(shí)現、教學(xué)效果的好壞等一系列質(zhì)量要素,今后,應該成為教學(xué)工作中重要的常規環(huán)節之一。
1SPSS軟件簡(jiǎn)介
SPSS軟件是StatisticalPackagefortheSocialsciences英文名稱(chēng)的首字母縮寫(xiě),即“社會(huì )科學(xué)統計軟件包”,它是目前世界上常用的三大統計分析軟件(SAS、SPSS及SYSTAT)之一,是世界上最早采用圖形菜單驅動(dòng)界面的統計軟件,其界面友好、功能強大和操作簡(jiǎn)便,能方便地從其他數據庫中讀入數據。
SPSS是一款功能強大的教育統計軟件,既可以進(jìn)行基本數據的統計分析,還可以進(jìn)行各種推斷和檢驗統計。
2試卷質(zhì)量分析應用實(shí)例
下面數據以安徽大學(xué)公共基礎課程—《程序設計基礎VB》的期末考試成績(jì)?yōu)闃颖?,利用SPSS軟件分析說(shuō)明考試質(zhì)量分析的模式和各項指標。
2.1試卷基本結構
本試卷(滿(mǎn)分100分),由兩部分組成:客觀(guān)性試題與主觀(guān)性試題,其中客觀(guān)性試題共A分,占X%,主觀(guān)性試題共B分,占Y%。具體情況見(jiàn)表1。
填寫(xiě)試卷基本結構可以發(fā)現,題量尚可,試卷題型不夠豐富,填空題可以細化為一般填空和程序計算填空,客觀(guān)性試題一般強調知識點(diǎn)考察,常見(jiàn)類(lèi)型為:?jiǎn)雾椷x擇題、多項選擇題、判斷題和簡(jiǎn)單填空題,而主觀(guān)性試題則根據學(xué)科的不同,一般設有復雜填空題、簡(jiǎn)答題、問(wèn)答題、論述題和計算題等題型。
2.2考試分析指標的定量分析
2.2.1成績(jì)數據的錄入與處理
1)定義變量并輸入數據
這是直接方法。啟動(dòng)SPSS軟件后會(huì )啟動(dòng)Statistics數據編輯器界面,通過(guò)單擊VariableView標簽進(jìn)人變量名編輯窗口,在Name(名稱(chēng))下注明學(xué)號、姓名、各題型、總分、平時(shí)成績(jì)和班級代碼。其中,各題型、總分、平時(shí)成績(jì)和班級代碼均設置為:Numeric(數值)類(lèi)型,Decimals(小數點(diǎn)長(cháng)度)定義為0,其余各項使用默認。
第二步,選擇數據視圖,開(kāi)始輸入數據:從第一行第一列起直接輸入相關(guān)數據,這樣,每行輸入一個(gè)學(xué)生的記錄,各列輸入數據為一個(gè)某種題型的成績(jì),最后一列是班級代碼等。
最后保存擴展名為sav格式的數據文件。
2)直接導人外部數據,更改數據類(lèi)型
為了更好地對數據進(jìn)行共享,SPSS還可以快速打開(kāi)和編輯其他格式的文件,可直接導入操作的數據文件包括:MicrosoftExcel文件(*.xls)、SAS、dBase、Stata等格式。
具體的操作步驟為:依次單擊FileOpenData,此時(shí)要在文件類(lèi)型下拉菜單中選擇AllFiles,在出現的全部文件列表中找到關(guān)聯(lián)文件雙擊,在彈出對話(huà)框內選中其中的Read復選框(此項設置為把表格中的第一行作為變量名導人,否則第一行將作為數據導入),單擊OK按鈕后會(huì )打開(kāi)DataEditor界面,就能顯示出剛才導人的Excel文件內容。隨后,也可依次單擊FileOpenSave(Saveas),將當前數據存為其他格式的文件,比如sav格式,方便下次使用。
本文實(shí)例數據先對考試系統自動(dòng)生成的xls文件格式進(jìn)行數據導入,然后對變量屬性作了適當修改,如圖1、2所示。
2.2.2成績(jì)統計的基本描述性分析指標
成績(jì)統計分析的基本描述性指標主要有:學(xué)生總數、實(shí)考人數、最高分、最低分、各等級的人數分布及百分比、均值與標準差、成績(jì)分布圖等,相應的描述性統計量包括最小值(Mini-mllm)、最大值(Maximum)、頻數(Frequency)、均值(Mean)、標準差(Std.)、偏度(Skewness)和峰度(Kurtosis)等。這些指標均要求按班級對試卷成績(jì)及總評成績(jì)進(jìn)行分析。其中,均值用來(lái)描述數據集中趨勢,標準差強調數據的變異性,即數據的差異量數,進(jìn)而反映數據全貌。而對稱(chēng)、偏斜及分布陡緩程度等數據分布的結構形態(tài)及特征則由頻數、偏度和峰度用來(lái)描述。
1)卷面成績(jì)的集中和離散數據統計
打開(kāi)錄入后的數據表,依次單擊AnalyzeDescriptiveSta-tisticsFrequencies,出現頻數對話(huà)框,導入要建立頻數分布表和直方圖的項目,同時(shí)選上Minimum、Maximum、Mean、Std.devi-ation、Skewness和Kurtosis等參數,得到表1。
依次單擊菜單AnalyzeDescriptiveStatisficsFre-quenciesChartsHisto-gramsWithnormalcurve,顯示出分數段分布圖和直方圖。直方圖如圖3所示。
一般而言,學(xué)生成績(jì)標準差在滿(mǎn)分的5%-10%以?xún)葘儆谡?。從圖表中得到的統計值可以發(fā)現:①本次考試的兩個(gè)班的離散程度均較大,表明學(xué)生成績(jì)離散度太大,可能是試題的問(wèn)題,也有可能是學(xué)生水平的兩極分化比較嚴重;
②學(xué)生成績(jì)基本呈正態(tài)分布;
③考生總分偏度值為-0.138和-0.648,依據偏度在數據分析中的意義,本次測試數據顯示:考生所得總分相對集中于平均分左側,即大部分考生成績(jì)小于平均分值;
④在峰度的計算中,計算結果σ<0,可知在學(xué)生成績(jì)的正態(tài)分布圖有比正態(tài)分布更長(cháng)的尾部,不過(guò)盯為較小負值說(shuō)明,考生成績(jì)在平均分附近的集中度雖低于標準正態(tài)曲線(xiàn),但也差別不大;
⑤標準差1≥10,差異較大。但是結合對總分的直方圖的觀(guān)察,可以發(fā)現:低分段考生的成績(jì)與平均分的差距較大,這是造成即使大多數考生的總分集中于平均分附近,最后標準差數值仍較大的主要原因。
2)難度指標分析P
對于課程考試來(lái)講,保持合適難度是保證試卷質(zhì)量的前提。
觀(guān)測得出:總試題難度大概在0.6-0.8之間,難度值中等偏低,試題適中,相對較難。
3)區分度指標分析D
區分度(Discrimination)是指測驗題目對學(xué)業(yè)水平不同的學(xué)生的區分程度或鑒別能力。區分度作為評價(jià)試題質(zhì)量、篩選試題的主要指標與依據,是測驗是否有效的“指示器”。該指標對于選拔性考試如高考,競賽尤為重要。具有良好區分度的測驗,實(shí)際水平高的被試應得高分,水平低的被試應得低分。區分度與難度有一定關(guān)系。
在工具軟件環(huán)境下,我們一般求出總分與每個(gè)試題得分間的積差相關(guān)系數作為試題的區分度,可以采用皮爾遜(Pearson)相關(guān)分析來(lái)對試題進(jìn)行分析,步驟為:AnalyzeCorrelateBi-variate,在彈出的BivariateCorrelations對話(huà)框中選擇各種題型和總分進(jìn)人Variables,然后在CorrelationCoefficients中點(diǎn)擊Spearman,完成后得到了各個(gè)題目的區分度。如表5所示:
從表中數據看出,由于三種題型的Sig.(2-tailed):p=0.000<α=0.01,相關(guān)系數值達到了0.01顯著(zhù)性水平,表示試題的區分功能顯著(zhù)。
4)信度指標分析
信度(Reliabilitv)用來(lái)反映考生穩定水平可靠性,即測驗能否真實(shí)反映學(xué)生水平程度的數量化指標,是測驗的必要條件。常用的有重測信度、復本信度、同質(zhì)性信度、荷伊特信度和評分者信度等。
因為影響測驗水平的因素有很多,導致信度的計算方法也不同,實(shí)際使用何種信度要依據考試目的和性質(zhì)而定,從而選擇其中一種或幾種。
由于高等教育測驗中絕大多數混合了客觀(guān)題和主觀(guān)題,所以SPSS軟件中一般采用克隆巴赫(Cronbach)α系數計算信度,取值0.5左右即可達標。這種計算方法是由Cronbach于1951年提出的,不要求測驗題目必須是記分型也能計算任何測驗的內部一致性系數。
在工具軟件環(huán)境下,依次運行:AnalysisScaleReli-abilityAnalysis,出現對話(huà)框,從中選擇所有題型和總分,在Items框的Model項目中單擊選擇Alpha模型,并選中Scaleifitemdeleted復選框,計算出該試卷的信度系數Alpha=0.757。如表6所示:
通常Cronbach僅系數的值在0和l之間。如果Alpha系數不超過(guò)0.6,一般認為內部一致信度不足;
達到0.7-0.8時(shí)表示量表具有相當的信度,達0.8-0.9時(shí)說(shuō)明量表信度非常好。對上機測試來(lái)說(shuō),信度Alpha=0.757相對信度較高;
一般來(lái)說(shuō),增加試題的數量;
保持所有試題的難度接近正態(tài)分布;
努力提高試題的區分度;
嚴格監考和按評分標準給分均可以提高信度。
5)效度分析
效度(Validity)是指試卷準確地測量了考試目的的欲測內容的多少,多大程度上效檢了所要測定的功能或達到其測量目的。
具體地講,就是覆蓋面和權重在教學(xué)大綱范圍內的完成情況,體現考試能力水平和反映教學(xué)大綱完成的情況有效程度。
公認的效度分類(lèi)方法是將效度分為內容效度、結構效度、構想效度和效標關(guān)聯(lián)效度。確定使用何種效度要根據測驗目的而定。常用的效度檢驗方法是:效標關(guān)聯(lián)效度法,這種方法首先是尋求一種可靠的效標,然后求出測試結果與效標的相關(guān)系數,該相關(guān)系數則為效標關(guān)聯(lián)效度。
在工具軟件環(huán)境下,依次單擊:AnalyzeCorrelateBi-variate,選擇總分和平時(shí)成績(jì)字段,隨后在相關(guān)系數(Correla-tionCoefficients)中選擇Pearson,計算數據如表7所示。
2.3試卷質(zhì)量控制的定性綜合分析
1)結合統計數據,進(jìn)行定性評價(jià)
對試卷質(zhì)量分析時(shí)的定性評價(jià)應有如下幾個(gè)方面內容:一是題量和題型;
二是試卷語(yǔ)言的表述是否明確和準確(如參考答案是否正確,試卷內容是否有重復或是對后繼題目有提示等,專(zhuān)有名詞表述是否準確,選擇答案設計是否均衡、排列是否科學(xué),);
三是試卷內容的難易度;
四是試卷的內容效度—覆蓋面問(wèn)題;
五是教學(xué)重點(diǎn)的突出程度。
2)結合教學(xué)實(shí)踐,進(jìn)行教學(xué)反思
建立一個(gè)長(cháng)久穩定的指標體系。通過(guò)長(cháng)期分析這些指標,可以更好地客觀(guān)地指導我們的教學(xué)改革。
檢驗課程設置的合理性。這些可以通過(guò)多因素變量的綜合橫向和縱向比較。比如同一課程不同專(zhuān)業(yè)的學(xué)生的成績(jì)是否有差異,進(jìn)而分專(zhuān)業(yè)更合理地優(yōu)化我們的課程安排。再比如通過(guò)長(cháng)期比較同一課程不同授課教師的成績(jì)數據,可以分析出教師之間的差異,進(jìn)而去了解他們授課方法的不同之處,取長(cháng)補短,促進(jìn)教師的經(jīng)驗交流和快速成長(cháng)。