1. 分析數據

量性資料分析以統計應用為主,分為描述統計(descriptive statistics)和推論統計(inferential statistics)兩大類。前者把基本變項的分佈和數值呈現,進行摘要分析,以較簡單的方法(如交互表列)初探變項間的關係。後者則以較科學和繁複的統計技巧驗證變項之間的機率關係,並非中學程度的同學所能應付。正因如此,本課將集中探討描述統計技巧,並示範一些簡單而有效的Excel工具,以探索數據和檢視變項間可能存在的相互關係。

  • 單變項描述統計(univariate descriptive statistics)

假設我們蒐集了50份有關父親自我形象的問卷調查,而資料已按先前建議的模式記錄予以下檔案。

  先前提及,問卷共有十條問題,分別量度以下不同變項:
 
變項 問題
a) 對自己能力的評價 Q1、Q2
b) 對自己價值的評價 Q3、Q4、Q5
c) 對自己重要性的評價 Q6、Q7
d) 年齡 Q8
e) 教育程度 Q9
f) 收入 Q10
 

我們最基本可以做的,便是就每個變項(及量度變項的每個相關問題)進行單一描述統計 (univariate descriptive statistics)。例如,當我們打開表列,會看見左圖一大堆數字,我們希望能簡單歸納每個欄目的資料。例如,究竟有多少個受訪者在回答 Q1時選1、2、3、4或5?不同年齡的受訪者有若干?屬於不同收入階層的受訪者又分佈如何?...

 

  • 分配 (distribution)

描述分析最基本的工作便是審視數據的分配。如先前所述,我們想探究的是父親自我形象。由於我們把自我形象操作化為三個面向,而每個面向之下再有類分,我們首要的工夫便是把每個變項 (Q1至Q10) 的資料做一個簡單的分佈描述:

  變項
問題
a) 對自己能力的評價 物質需要
Q1
情感需要 (關懷和支持)
Q2
b) 對自己價值的評價 自己心目中
Q3
親友心目中
Q4
子女心目中
Q5
c) 對自己重要性的評價 物質需要
Q6
情感需要 (關懷和支持)
Q7
d) 年齡
Q8
e) 教育程度
Q9
f) 收入
Q10
 

儘管我們的探究問題是Y,這階段的單變項描述統計必須包括 Y 以外的資料,即Q8至Q10的數據。原因是我們需要知道樣本屬性的實質分佈,包括年齡、教育程度以及收入階層。X 變項的分佈能幫助我們審視數據可能出現的誤差。例如,Q1至Q7 的數據可能顯示父親的自我形象頗高,然而,當我們細看 Q10 的分佈資料後,卻發覺大部份受訪者都來自高收入階層。假設兩個同學同時進行這項探究,來自A探究的Q10分佈相對均勻,B探究之樣本則大多數來自高收入階層。如是者,A探究所能提供的資料將較多元豐富,容許我們較有力地比較階層間的差異,並更有信心地就父親自我形象這課題下相對籠統的結論。

項目個數和百份比分析

拿Q2為例子,問題涉及父親對自己提供情感關懷和支持的能力之評價。我們可借助Excel軟件,快速了解各答項的基本分佈。步驟如下:

  • 先把工作頁打開,然後按紅色箭咀顯示之左上方格,以全選表列資料

  • 後拉下功能表之資料清單,選取“樞紐分析表及圖報表”(Pivot table),然後按“下一步 ”
 
  • 圖中顯示的正是你所選取的分析範圍,亦即A欄至 K欄之所有資料。範圍正確的話,可按“下一步”以選取分析欄列

  • 這是最關鍵的部份,我們須指示軟件設置那些欄和列佐做分析。我們可先按下“版面配置”

  • 版面配置的左邊是模擬的欄、列排置,右方則設有所選取數據範圍內的所有問題編號。我們只需根據指示,把右邊相關的按鈕拖曳至左邊便可。

  • 假設我們想了解 Q2 的答項分佈,我們只需參照以下左圖,先把Q2拖曳至列的範圍,然後再按右圖顯示,再一次把 Q2 拖曳,但這次卻放在欄目處:

軟件收到這些指令,便知道我們想探究Q2的內容。然而,我們還欠一個指令步驟,告訴軟件所顯示的是什麼有關Q2的數據。我們可把滑鼠放置“計數的Q2”之上,然後點擊兩下,便會彈出樞紐分析表欄位的摘要方式選項。需留意是,Q2的答案屬於等級 / 順序變項 (ordinal measures ) [link: ies_l3\ies_l3a_scale.htm],各答項之間的間距只顯示累退的邏輯,不能以加減方法來計算實質的差別。在這情況下,計算平均值等資料完全沒有意思,我們需要知道的只是簡單的項目個數,即每個答項的總數目。

  • 為方便審視資料,我們可進一步指示軟件把項目個數轉成百份比。我們可先按下選項,然後在“資料顯示方式”的下拉表單中選擇“總欄數的百分比”

  • 按確定後,便能得出以下表列。圖中顯示沒有一個受訪者自我評定為(5- 毫無能力),但選擇 (1- 非常有能力)、(2 - 有能力)、(3 - 基本滿足)和 (4 - 不是太有能力)則分別有8%、56%、30% 和 6%。


項目平均值和最大、最小值

  • Q2 變項的測量尺度較適合以項目個數和百份比計算,享有連續變值的變項(如收入、年齡、溫度)則可考慮附加其他方法計算分佈。假設我們重複先前的步驟,並計算出下左圖的項目個數表列。我們希望進一步了解樣本的平均值和最大、最小值。如是者,我們可把滑鼠移放在右圖“計數的Q8”之上,點擊兩下,便會彈出樞紐分析表欄位之選項。我們可選擇“平均值”,然後按確定,便會得出新的表列。
  • 我們亦可重新建立一個表列,把Q8拖曳至欄內三次,分別設定計數的Q8為“平均值”、“最大值”和“最小值”。由於我們計算的和數和最大、最小兩個數目,列目可以出現的答項個數並不相關,固我們亦不用把Q8拖曳至列,只需根據以下示範操作便行。


圖表顯示

  • 以上資料更可以圖表形式顯示,同學可先填寫Q2以及1至4等數字代號所代表的是什麼,然後拖曳所需繪圖的資料,如B5之B8之數據,右按滑鼠,選取“樞紐分析圖”,便會顯示相關圖表
  • 同學如不喜歡自動出現的樞紐分析圖,可按上圖右上角的“圖表精靈”,另選圖表類型

 
1, 2, 3, 4
5
6, 7, 8, 9