日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

統(tǒng)計學變量可分為哪幾類 變量是什么

大家在學習統(tǒng)計時 , 可能會過于重視分析方法的使用 , 而忽略了數(shù)據(jù)收集和整理的重要性 。一般而言 , 統(tǒng)計分析最重要的一步實際上是先將數(shù)據(jù)整理形成便于分析的數(shù)據(jù)形式 , 比如下表:

統(tǒng)計學變量可分為哪幾類 變量是什么


上表中雖然全是數(shù)字 , 但卻可以回答很多問題 。比如:每個人的年齡多大?是什么學歷?婚姻狀況如何?就業(yè)情況如何?家里有幾口人?
這些問題的答案都是我們所調(diào)查對象的一系列特征或?qū)傩?nbsp;, 統(tǒng)計學上稱為變量(variable) , 也就是上表頂行各條目的名稱 。初學統(tǒng)計學一定要訓練自己學會利用“變量”來表達 。
每個被調(diào)查對象被稱為一個觀測單位(case 或 observation),變量就是觀測單位的某種特征或?qū)傩?nbsp;, 變量的具體取值稱為“變量值” 。
由此 , 上表中的一系列問題對應的變量就是:年齡、學歷、婚姻狀況、就業(yè)情況、家庭人口數(shù)、ABO血型等 。
進一步觀察 , 可以發(fā)現(xiàn) , 有些變量的取值如年齡、家庭人口數(shù)是具體的、有實際意義的數(shù)值;而有些變量的取值如學歷、婚姻狀況雖用數(shù)字來表示 , 但其意義卻只是一個“代號” , 背后都需要特定的文字進行定義說明 , 比如規(guī)定“0=未婚 , 1=已婚” 。
因此 , 像年齡、家庭人口數(shù)這類變量 , 其取值是定量的、有計算意義的 , 我們稱之為定量變量(quantitative variable);
而像學歷、婚姻狀況和就業(yè)狀況這類變量的取值是定性的、主要起代號作用 , 稱之為定性變量(qualitative variable) 。
另一方面 , 為了對定性變量進行統(tǒng)計學處理 , 往往需要對其進行編碼 , 比如“男為0 , 女為1” 。所以 , 在實際的統(tǒng)計工作中 , 要避免輸入漢字 , 而是要注意將其轉(zhuǎn)換為相應的數(shù)字 。
甚至變量名稱 , 如上述的“編號、年齡、學歷等”也盡量采用英文或漢語拼音來表示 , 避免統(tǒng)計軟件出錯 。
更進一步思考會發(fā)現(xiàn) , 年齡、人口數(shù)等變量一般是有單位的 , 并且不同人的年齡差異在理論上可以無限小 , 如1年、1個月、1天、1小時、0.1小時、0.01小時……
所以 , 年齡變量的取值范圍在理論上可以取任意正實數(shù) , 注意不是正整數(shù) , 比如一個人的年齡可以記為17.55歲 , 表示年齡為17歲6個月18天 , 甚至還可以利用出生時刻的信息精確到更小的時間單位(如“分、秒”) 。因此 , 這類變量稱為連續(xù)變量(continuous variable) , 主要是因為其取值范圍在理論上是連續(xù)不斷的 。
相反 , 家庭人口數(shù)這一變量就是相對于連續(xù)變量的另一類 , 即離散變量(discrete variable) , 因為不同家庭的人口數(shù)只可能相差0、1、2 , 而不能相差1.1、1.2等 , 它的取值范圍是間斷而不連續(xù)的 。
由此可見 , 一般僅定量變量有連續(xù)和離散之分 , 即一個定量變量要么是連續(xù)的、要么是離散的 。
相較而言 , 定性變量從數(shù)據(jù)表現(xiàn)上雖然和離散變量類似 , 但由于它只具有“代號”意義 , 所以一般不把它視為離散變量 。
除此之外 , 定性變量的取值往往表現(xiàn)為互不交叉的類別(所以定性變量也稱分類變量) , 同時這些類別有時會存在細微的差別 。

推薦閱讀