掃碼下載APP
及時接收最新考試資訊及
備考信息
2014年中級經(jīng)濟師考試人力資源管理專業(yè)的備考必看知識點,希望本文能夠幫助您更好的全面?zhèn)淇?014年經(jīng)濟師考試,祝您學習愉快!
第三節(jié) 信度與效度
信度的含義及常用的信度指標
信度又叫可靠性或一致性,一個好的測量工具必須穩(wěn)定可靠,或者不產(chǎn)生錯誤,或者產(chǎn)生的是系統(tǒng)誤差,每次測試的錯誤相同。
常用的信度指標
在人員挑選過程中常用的信度指標有四類。
1.重測信度
重測信度又稱為穩(wěn)定性系數(shù),是指用同一方法對一組應聘者在兩個不同時間進行測試,所得結(jié)果之間的一致性。重測的過程考慮了不同的條件(環(huán)境的,人的)帶來的測量結(jié)果的誤差,這種誤差與兩次施測的情境有關(guān)聯(lián)。因為在前后兩種情境中施測的是同一個測驗,所以重測系數(shù)不能反映測驗題目樣本不同所帶來的誤差。此外,兩次施測的條件也和時間間隔有關(guān),時間間隔越長,誤差變異趨大。因此,當?shù)谝淮问y和第二次施測的時間間隔相對較短時(幾天或幾周),重測的穩(wěn)定性系數(shù)會較大;反之,當?shù)谝淮问y和第二次施測的時間間隔較長時(幾個月或幾年),該系數(shù)就會偏小。
2.復本信度
復本信度又稱等值性系數(shù),是指采用兩個測驗復本(功能相同但題目內(nèi)容不同)來測驗同一群體,所得到的兩個分數(shù)的相關(guān)性。一般而言,當前一次施測和第二次施測之間的時間間隔較短時,受測者往往能夠回憶出第一次施測的許多題目,以及當時所做出的回答。這顯然會影響他們在第二次受測時的回答。當然,如果每個受測者能夠回憶出同等數(shù)量的題目,這并不會影響到一致性系數(shù),但是,通常總有人能夠比別人回憶出更多的測試材料,這種結(jié)果就會導致第一次施測與第二次施測的相關(guān)要小于理想狀態(tài)下的值。因此我們需要使用測驗的復本來克服這種誤差來源,也就是說,兩套測驗包含相似的題目,但又不完全相同。
復本信度的高低反映了兩個測驗在內(nèi)容上的等值性程度。等值的測驗常被用于避免先前測驗對后來測驗產(chǎn)占的學習效果,也可避免先測試的內(nèi)容為后來的應聘者所掌握的情況。
復本信度的思想很容易理解:施測完第一個測驗,在適當?shù)拈g隔后再施測測驗復本,得到的穩(wěn)定性系數(shù)能夠反映出測量時由于題目不同、施測時間不同所導致的誤差。為了控制施測時的程序效應,在第一次施測時,可以讓一半受測者測試復本A,而另一。半受測者測試復本B;當?shù)诙问y時,原先做復本A的組測試復本B,而另一組則測試復本A.這樣兩套測驗得分的相關(guān)就可以認為是穩(wěn)定性與等值性系數(shù),因為它已經(jīng)同時考慮到了施測時間不同,以及施測題目不同所帶來的誤差。
3.內(nèi)部一致性信度
復本法適合于許多測驗,尤其是能力測驗(學業(yè)能力,智力,特殊能力)。但是,為測驗建立復本通?;ㄙM較高,而且很難順利編制。于是,研究者就把測驗項目劃分成不同的樣本,從而間接地考慮一致性信度。這就是內(nèi)部一致性法。內(nèi)部一致性信度主要用于反映同一測試內(nèi)部不同題目的測試結(jié)果是否具有一致性。這是檢測測驗本身好壞的重要指標。
4.評分者信度
是指不同評分者對同樣對象進行評定時的一致性。例如,不同的面試考官對同一應聘者采用同一種工具進行評價時,應當?shù)玫较嗤蛳嘟慕Y(jié)果。這一指標反映的是評價人員的可靠性。
對信度指標的解釋
類似核查表、評定量表以及人格調(diào)查、興趣調(diào)查,或者態(tài)度調(diào)查這樣的情感評估工具,他們的信度一般低于諸如成就、智力、或者特殊能力等認知測驗的信度。信度系數(shù)要高到什么程度才能讓我們放心使用呢?答案取決于我們要怎樣使用這些測驗分數(shù)。如果測驗是用于判定兩組人群的平均分數(shù)是否存在顯著差異,信度系數(shù)在0.60-0.70之間就足夠了。但從另一個方面來看,如果測驗是用于比較某個人和其他人的得分,或者比較該人在其他測驗上的得分,此時信度系數(shù)至少要達到0.85才能判斷分數(shù)上的差異是否顯著。
影響信度的因素
造成篩選技術(shù)或方法可靠性低的原因通常是多方面的:
(1)受試者因素:受試者的應試動機、測驗經(jīng)驗、身心健康狀況、動機、注意力、持久性、作答態(tài)度等都在隨時變動,對同一個測驗不可能達到完全一致的反映。
(2)主試因素:不按規(guī)定實施面談或測驗,制造緊張氣氛,給予某些受試者特別協(xié)助,評分主觀等從而使測試結(jié)果受到污染。
(3)篩選或測驗內(nèi)容:觀d驗內(nèi)容取樣不當、內(nèi)部一致性低、題目數(shù)量過多或過少、題目含糊不清等導致測驗結(jié)果不可靠。
(4)實施測試的情景:現(xiàn)場條件,如通風、溫度、光線等產(chǎn)生的影響。
(5)意外干擾因素如停電、答題紙出了問題等。
正因為這樣一些干擾因素,我們不可能要求招聘過程中的信度達到1.00,即幾次測驗結(jié)果完全相同。一種測評工具的信度系數(shù)達到0.60,一般為接受水平;達到0.70為較好;達到0.80為優(yōu)秀。
效度的含義及常用的效度指標
效度即有效性或精確性,是指招聘者真正測試到的品質(zhì)與想要測量的品質(zhì)間的符合程度。有效的測驗,其結(jié)果應該能正確地預計應聘者將來的工作成績。兩者之間的相關(guān)系數(shù)被稱為效度系數(shù)。其值越大,說明測驗越有效。效度與信度不同,信度只受到測量中非系統(tǒng)性誤差的影響,而測驗的效度同時受到非系統(tǒng)性誤差和系統(tǒng)性誤差(固定誤差)的影響。因此,一個測驗可能可信但不一定可靠,但測驗不可能是可靠卻不可信。信度對效度而言是一個必要而非充分條件。
常用的效度指標分為以下四種:
(一)內(nèi)容效度
是指測驗方法是否真正測出工作績效的某些重要因素。例如招聘打字員,憑據(jù)打字的速度及準確性招聘,這種實際操作的測驗的效度是最高的;如果用計算機維修技術(shù)作為測試方法,其內(nèi)容效度就比較低,因為計算機維修技術(shù)并不是打字員的工作職責。內(nèi)容效度的檢驗主要是采用專家判斷方法,首先專家要在工作分析的基礎(chǔ)上,確定從事某一職位所必備的工作行為;然后再判斷測試的內(nèi)容是否能夠正確地表達這些行為。內(nèi)容效度多用于知識測驗和實際操作測驗,不適用于對能力或潛力的預測。
(二)效標關(guān)聯(lián)效度
效標關(guān)聯(lián)效度也被稱為同測效度。是指對現(xiàn)有的員工實施某種測驗,然后將所得結(jié)果與這些員工的工作表現(xiàn)或工作考核得分加以比較,若兩者相關(guān)系數(shù)很大,說明此測驗與某項工作密切相關(guān)。這種測驗效度的特點是省時,可以盡快檢驗某測驗的效度,但在將其應用到選拔測驗時,有可能無法準確預測應聘者未來的工作潛力。例如,這種效度是根據(jù)現(xiàn)有員工的測驗得出來的,而現(xiàn)有員工所具備的經(jīng)驗、對企業(yè)的了解等,則是應聘者所缺乏的,因此應聘者可能因為缺乏經(jīng)驗而在測驗中得不到高分,從而被錯誤地判斷為沒有潛力或能力。
(三)預測效度
是指對所有應聘者都施予某種測驗,但并不依結(jié)果決定錄用與否,待這些被錄用人員工作一段時間以后,對其工作績效加以考核,將考核得分與當初的測驗結(jié)果加以比較,求兩者的相關(guān)系數(shù),相關(guān)系數(shù)越大,說明此測驗的效度越高,可以依此來預測應聘者的潛力。用這種方法檢驗出效度較高的測驗方法,便可用于將來的人員選拔,且多用于能力及潛力測驗,效果很好。
(四)構(gòu)想效度
是指能夠測量到理論上的構(gòu)想或特質(zhì)的程度。所謂構(gòu)想通常是一些抽象的、假設(shè)性的概念或特質(zhì),如智力、創(chuàng)造力、言語流暢性、焦慮等。這些構(gòu)想往往無法直接觀察,但是都有其心理上的理論基礎(chǔ)和客觀現(xiàn)實性,可以通過各種可觀察的材料加以確定。例如,員工滿意度可以通過員工對報酬、對同事、對工作內(nèi)容、對成長晉升等幾方面內(nèi)容態(tài)度的肯定程度表現(xiàn)出來。構(gòu)想效度關(guān)心的是:是否能夠正確反映理論構(gòu)想的特性。
總之,在對應聘者進行甄選測驗時,應努力做到既可信,又有效。
Copyright © 2000 - m.yinshua168.com.cn All Rights Reserved. 北京正保會計科技有限公司 版權(quán)所有
京B2-20200959 京ICP備20012371號-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號