什么是測(cè)試效度的概念意思
測(cè)試效度是一套測(cè)試是否達(dá)到了它預(yù)定的目的以及是否測(cè)量了它要測(cè)量的內(nèi)容。那么你對(duì)測(cè)試效度了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于什么是測(cè)試效度的內(nèi)容,希望大家喜歡!
什么是測(cè)試效度
測(cè)試效度(test validity)亦稱測(cè)試的有效性,指一套測(cè)試對(duì)應(yīng)該測(cè)試的內(nèi)容所測(cè)的程度。也就是說(shuō),一套測(cè)試是否達(dá)到了它預(yù)定的目的以及是否測(cè)量了它要測(cè)量的內(nèi)容。例如:“Is photography an art orscience?Discuss.”這種題目以攝影的知識(shí)為前提和主要內(nèi)容,用來(lái)考語(yǔ)言能力,就不具有效性。又如用聽寫來(lái)測(cè)量學(xué)生的聽覺能力,其效度也是不理想的,因?yàn)闀嬗涗浻新曊Z(yǔ)言不僅涉及學(xué)生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語(yǔ)法知識(shí)、記憶能力和對(duì)全文的理解能力等有關(guān)。
測(cè)試的效度的分類
1)表面效度(face validity)
指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),即一套測(cè)試題從表面看來(lái)是否是合適的。例如,若一次閱讀理解力的測(cè)試包括許多受試者沒(méi)有學(xué)過(guò)的方言詞匯,則可認(rèn)為這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。
2)內(nèi)容效度(content validity)
指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說(shuō)所測(cè)試的內(nèi)容是否反映了測(cè)試的要求,即測(cè)試的代表性和覆蓋面的程度。例如,如果某一套發(fā)音技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能,如只考單一音素的發(fā)音,而不考查重讀、語(yǔ)調(diào)或音素在詞語(yǔ)中的發(fā)音,那么,該測(cè)試的內(nèi)容效度就很低。
3)編制效度(construct validity)
指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的各個(gè)基本方面的反映程度。例如,以結(jié)構(gòu)主義語(yǔ)言理論為基礎(chǔ),認(rèn)為系統(tǒng)的語(yǔ)言習(xí)慣是通過(guò)句型而獲得的,那么,強(qiáng)調(diào)詞匯和語(yǔ)法環(huán)境的測(cè)試題目就失去了編制效度。
4)經(jīng)驗(yàn)效度(empirical validity)
經(jīng)驗(yàn)效度是一種衡量測(cè)試有效性的量度,通過(guò)把一次測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種:一是共時(shí)效度(concurrent validity),即將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較,或同教師的鑒定相比較而得出的系數(shù);二是預(yù)測(cè)效度(predictive validity),即將一次測(cè)試的結(jié)果同后來(lái)的語(yǔ)言能力相比較,或是同教師后來(lái)對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。
一般來(lái)說(shuō),對(duì)某次測(cè)試的效度進(jìn)行檢驗(yàn)時(shí),除了要根據(jù)教學(xué)大綱的要求和觀念有效性的理論對(duì)試卷的內(nèi)容進(jìn)行考查以外,還須采用計(jì)算相關(guān)系數(shù)的定量方法,即計(jì)算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關(guān)系數(shù)。系數(shù)高則有效性大。課堂測(cè)試的效度應(yīng)在0.4-0.7之間,規(guī)模較大的測(cè)試其效度應(yīng)在0.7以上。
測(cè)驗(yàn)的因素
由測(cè)驗(yàn)本身帶來(lái)的影響因素有測(cè)驗(yàn)題目的質(zhì)量、測(cè)驗(yàn)實(shí)施中的干擾、測(cè)驗(yàn)的長(zhǎng)度、被試的因素等。
測(cè)驗(yàn)題目的質(zhì)量
題目的指導(dǎo)語(yǔ)不明確、試題的表達(dá)不清晰、試題太難或太容易、題目中出現(xiàn)額外的線索、誘答設(shè)計(jì)不合理、題目過(guò)少、試題的安排和組織不恰當(dāng)、試題不符合測(cè)驗(yàn)?zāi)康牡纫蛩?,都?huì)影響測(cè)驗(yàn)的效度,使效度降低。
實(shí)施測(cè)驗(yàn)時(shí)的干擾因素
測(cè)驗(yàn)的環(huán)境太差、被試不遵從指導(dǎo)語(yǔ)、記分錯(cuò)誤,都會(huì)使測(cè)驗(yàn)的效度降低。
測(cè)驗(yàn)的長(zhǎng)度
一般來(lái)說(shuō),增加測(cè)驗(yàn)的長(zhǎng)度通??梢蕴岣邷y(cè)驗(yàn)的信度,而效度系數(shù)能否達(dá)到最大值也受信度的影響,因此,增加測(cè)驗(yàn)的題目往往也能提高測(cè)驗(yàn)的效度。不過(guò),效度增加的前提是這些增加的題目必須與測(cè)量的目標(biāo)相關(guān)。
被試的影響因素
被試的反應(yīng)定勢(shì)、測(cè)驗(yàn)動(dòng)機(jī)、情緒和身心狀態(tài)都會(huì)對(duì)測(cè)量效度的影響。
看過(guò)“測(cè)試效度是什么“的人還看了:
1.大學(xué)英語(yǔ)四六級(jí)考試聽力試題調(diào)整說(shuō)明(附樣題)
4.大一心理考試論文