科學的人才測評方法_生活經驗

人才測評（測量、評鑒、評價）是指在一定的目標驅動下，通過一系列手段和方法對人的屬性進行衡量的活動。在由人組成的社會中，對人進行測評的重要性是毋庸置疑的，許多決策都需要人才測評予以支持。

測評不是目的，而只是達到目的的工具。
在需要人來完成的宏偉目標中，測評從遠古傳說開始，就已經在發揮效用了。據記載，堯在選擇舜作為自己接班人時， “以二女妻舜以觀其內，使九男與處以觀其外”，最后選定了舜來治理國家，政績卓著。《周書·立政》記載商湯“克用三宅三俊”的標準來“擢士”，這樣才有后來《詩經· 商頌· 殷武》中記載的“昔有成湯，自彼氐羌，莫敢不來享，莫敢不來王，曰商是常” 。
在人力資源領域，測評一直就存在，并且越來越為企業所重視。即便如此，測評也從來都不是目的，過去不是、現在不是、將來也不是。這一點是沒有爭議的，任何組織進行測評的目的都不會停留在增加對個人的了解上，了解個人是為了能夠預測個人的行為，而預測行為是為了保證某個結果的出現。
特質和行為是一體的兩個層次
在達成目標的各種因素中，在排除了外在環境（包括資源與條件等）以外，人的行為幾乎是唯一可控的因素。由于導致目標達成的行為，是受特質（指個人所具有的內在屬性的總和）支配而表現出來的外表活動，因此對人的測量就主要關注特質和行為兩個方面，這是一體的兩個層次。
對某個事件的分析，除了其所處的大環境之外，也會涉及到的也是兩個部分，第一部分是個體所采取的行動，第二部分就是其動機等內在特質狀態。對行為和特質的關注是如此休戚與共，以至于在研究過去行為的歷史學科中，心理學也正在扮演越來越為重要的角色，因為這門學科能對個體內在的特質進行研究，能夠更有助于了解歷史行為的原因及結果。
了解外在的行為相對容易，而了解內在的特質相對困難，這是為什么俗語說“畫龍畫虎難畫骨，知人知面不知心” 。外在行為始終只是表象，是相對不穩定的，容易受到環境因素的影響。比如一個人攙扶著老太太過馬路，我們不能據此判斷這個人樂于助人，因為有可能是老太太主動請求幫助，雖極不情愿但在眾目睽睽之下此人也難以拒絕。同樣是捐助行為，那些出于幫助他人意圖的人比那些尋求名聲的，更有可能在今后表現出更多慈善行為。行為雖然容易被觀察，但卻難以一貫表現。相反，內在特質雖較難知曉，但卻有較好的一致性和預測性。
總之，行為難以預測，除非這種行為能表現出特質。因此幾乎所有的心理學流派，都想要了解人最為本質的屬性，這些屬性能幫助我們推斷個人在不同情境下的行為。只是由于對是否能真正的了解到這一屬性持有不同的看法，行為主義和認知主義等心理學流派才表現出了區別，有的更加關注外在行為，有的更加關注內在特質，但不論如何，都是想要得到預測未來行為的指標。
心理測量與人才測評
雖然內在特質相對行為具有較好的預測性，但是特質的測量不像測量長度可以用尺子，測量重量可以用天平一樣簡單。它必須借助于一些手段或中介的因素，這些手段或中介因素設置了一種刺激，通過對個體就這些刺激做出的反應進行解析，來測量出個體相應的內在特質。
采用一些手段和方法對人的屬性進行衡量即心理測量，心理測量不僅包括以心理測驗為工具的測量，也包括用觀察法、訪談法、問卷法、實驗法、心理物理法等方法進行的測量。因此，心理測量涵蓋了在教育、咨詢、醫療等范疇的多種應用，而將心理測量應用于組織內對人的屬性進行測量即人才測評，人才測評包含于心理測量之中。
對于具有五千年歷史的中國來講，雖然人才測評并不乏很多記載，但是這些操作基本不符合以下由Kevin R.Ｍurphy（2006）等對現代心理測量的要求，這些要求是保證個體特質測量準確性的最基本要求，也是科學的人才測評所必須遵守的原則：

明確的目標行為樣本，即事先要有明確的測量目標；
這個樣本是在標準條件下獲得的，即在控制條件下進行；
在記分或從行為樣本中獲得量化信息方面有既定的規則，強調有量化的結果。

采用任意的手段和方法對人的屬性進行衡量都可以稱為人才測評，比如星座、手/面/顱相等，但是這不是科學的人才測評。科學的人才測評應當符合心理測量原則，而衡量一種理論的科學地位的標準是它的可證偽性或可反駁性或可檢驗性（波普爾）。
各類測量工具的區分
凱銳優才從心理測驗的三大種類型出發，對各種科學的人才測評工具進行了總結，并結合“科學”這一原則，對各類測評工具和方法的特點及適用情景進行了分析：
最佳表現類：
最佳表現類測驗會給參與者一定的任務情景，讓他們盡自己最大的努力成功地完成任務。對肢體平衡、手眼協調、聲音顏色區分、機械操作、崗位知識等能力的測驗均屬此類。由于最佳表現類測驗所關注的是對能力的測量，因此參與者在作答過程中不會由于“偽裝”等因素的影響而得到較高的分值，即這類測驗是有難度的。最佳表現測驗在企業的招聘和選拔晉升中應用非常廣泛：招聘中使用的各類能力測驗，晉升中使用的資格認證考試等都是最佳表現測驗的具體應用。
以認知能力為例，在一項總結過去85年研究的論文中，有三種選拔組合方法被證實是最為有效的，這三種組合方法是認知能力（General Mental Ability）+工作樣本測試（Work Sample Test）；認知能力+正直測驗（Integrity Test）；認知能力+結構化訪談（Structured Interview）。在這三種組合方法中，有一個共同的要素，即認知能力測驗。世界范圍內的認知能力測驗非常多，這些測驗還有另外一個名字：智商（IQ）測驗，雖然不同測驗的關注點和維度有所不同，但總體屬于一類。
認知能力并不能預測最好的績效表現，但是卓越的績效表現一定是以滿足一定的認知能力要求為基礎的。所以，認知能力能較好地預測差的績效表現，因此可以作為一種劣汰的工具。但需要警醒的是，很多以最佳表現作為測量目標的測評工具，并非真正意義上的最佳表現類測驗，很多就素質所開發的測驗僅僅是主觀評價類測驗，使用這一類測驗所得到的結果，并不能作為單一的測評依據。
行為觀察類：
在一個特定的情境下觀察參與者的行為和反應，屬于行為觀察類測驗。這其中包括兩大類：即情景觀察和訪談，其中情景觀察包括控制的情景模擬和自然的現場觀察，訪談總體可分為結構化和非結構化兩類。
控制的情景模擬包括角色扮演、案例分析、管理游戲、小組討論等。這些方法都符合上述的三個原則：有明確的測量的目標、實施過程標準化、評價結果數量化。相比于情景模擬，自然的現場觀察具有更好的生態性。但是在非控制的環境下，行為表現同測量的目標之間沒有相關性，也就是行為的表現具有隨意性：比如參與者沒有表現某個行為特質，并不是由于不具有該能力，而是由于沒有表現這一能力的機會，因此相對而言科學性較低。
訪談是應用最為廣泛的一種人才測評方法，結構化的訪談規定了提問的順序與評分的標準，因而是較為準確的一種測評方法，而非結構化的訪談受測評師個人因素影響較大，不同的測評師會存在關注點的不同和能力的高低，在這種不受控制的過程下，評價結果往往也是隨意或不一致的。
以上四類工具均有較好的信度和效度，特別是控制的情景模擬和結構化訪談，完全符合科學測量的三個原則，可以用以在招聘選拔中擇優。比如結構化即時計分（Structured Immediately Rated Interview），將情景融于訪談之中，對特質的測量具有較好的信度和效度，是一種非常方便使用的工具。
主觀評價類：
主觀評價即讓參與者自己或了解參與者的他人，在某個標準下對參與者進行評價，即自評和他評。自評也叫自陳，即自己在某個標準下對自己進行評價，比如個性測驗、心理健康測驗、職業傾向、價值觀測驗等均屬此類。自陳測驗容易受到個人印象管理或作假等因素的影響，因而其信度和效度存在一定的不確定。但是，一些自陳工具在設計時能將這一因素考慮在內，因而其結果也具有較高的信度和效度，比如看圖說話類的投射測驗。
好的自陳測驗能夠幫助測評師更好地了解參與者，但是應當注意的是單獨用自陳式的測驗，比如MBTI、DISC、PDP甚至九型人格等來做招聘選拔的決策是很危險的！但是在發展人的項目中，良好的自陳式測驗的作用是巨大的，通過自己對自己的評估，最后得到自身特質的反饋，對幾乎所有人來講，都是一件有吸引力的事情。
另一種主觀評價的方式是他評，包括360評估、推薦信、證明信等。他評的一個挑戰是如何保證評價者對題目或問題的理解，以及其評價的公正客觀性。滿足這兩個要求的他評方式是可信的，通過設置沒有歧義的客觀的題目、說明客觀評價的重要性、選取適當的樣本均能在一定程度上提高這種方法的可信度。
評價中心
鑒于以上三類工具各有的特點，一種組合的方式被創造出來并廣泛應用在組織中，這種方法就是評價中心（評鑒中心）。評價中心是以情景模擬為主，輔以各類測驗的綜合評價方法，一個典型的評價中心幾乎涵蓋了上述三類測量工具：角色扮演、案例分析、小組討論、文件筐、能力測驗、個性測驗、360度評估等。
由于評價中心是對多種工具的組合，因此嚴格地講它并不是一種測量工具。但正是由于采用了多種工具，評價中心才能對人做出更為準確的測量。
沒有100%精確的人才測評工具
對物理量的測評可以有很高的精確程度，但是還沒有誰敢聲稱能做到100%的準確。對人的測量比對物理的測量要困難得多，因此不確定性也要大得多，因此沒有完全準確的測量工具。即使是像評價中心這樣集合了多種工具的方法，也僅能保證70%的準確性。
【科學的人才測評方法】就如同在文章開頭所討論的那樣，對特質的測量要通過行為，而行為是容易變化的，這種不確定性導致了人才測評不能像物理測評那樣具有很高的準確性。但是即便是這70%的準確性，對于組織而言，作用已是非常卓著了。在不同的目標和條件下，對工具的選用也應當不同：選擇以選拔為目標的測評工具時，與選擇以增加培訓課程參與熱情的測評工具相比，就要更加注重工具的準確性。