• 雙變項分配 (bivariate distribution) 和 交互表列 (cross-tabulation)

Excel 的樞紐分析工具還可提供十分有用的雙變項分配分析。根據早前設計,我們可探索的雙變項關係包括:

Xs Ys
  • 父親之自我形象 (y1-7) 會否因年齡 (x1)而異?
  • 父親之自我形象 (y1-7) 會否因教育程度 (x2) 而異?
  • 父親之自我形象 (y1-7) 會否因收入 (x3) 而異?

讓我們示範如何探索年齡 (Q8) 和能力(Q2) 之相互關係,步驟如下:

  • 先把Q2拖曳至欄目
  • 把Q8拖曳至列,指令軟件顯示不同年齡之Q2選項
  • 我們須留意如何選擇資料顯示方式。在這情況下,我們依然是選擇計算項目個數,並指令軟件顯示總目的百份比。然而,我們應該選擇“總欄數”抑“總列數”的百分比呢?軟件只會盲從跟隨我們指示,而每個指令都會產生一組數字,但那個計算方法才有意思,則需小心思量才是。如我們選擇顯示“總欄數的百分比”,則計算每個年齡類別以內,選取不同Q2答項的百分比。如我們選擇顯示“總列數的百分比”,便是指令軟件計算每個Q2答項以內之年齡百分比。

由於此組模擬數據沒有控制各年齡層的受訪數目,計算“總列數的百分比”可能沒有多大意思,或只會反映樣本中不平均的年齡分佈。在此情況下,“總欄數的百分比”更能提供有關年齡層之間的分別,幫助我們比較這變項與父親自我形象的關係。當然,我們還須考慮年齡之單變項分佈。如年齡之間的樣本分佈甚不平均,或個案數目太少,所得來的數據亦未必太有意思。言歸開首,探究員還是需要清晰概念邏輯,小心衡量和評估資料該如何詮釋,才能確定那些是可用的資料,那些需要進一步補充。

上圖為初步分析。要刪除空白欄列,可拉下Q2 或 Q8之表單,剔除“空白”一欄,便會出現右方的表列。

初步觀察,沒有一個受訪者認為自己(5 - 毫無能力),而年齡在35歲或以上的受訪者較多選擇(3 - 基本滿足)或(4 - 不是太有能力)。視乎探究員的判斷和數據的型態,我們可選擇把資料重組以方便審視。例如,我們可以35歲為界線,把來自Q8的資料重組為兩個年齡層,分別為35以下和35或以上。我們須重新打開工作頁,並新增一個欄目(如下圖的Q8b),根據Q8之數據重新鍵入Q8b下之編碼 (1 = 35歲以下,2= 35歲或以上)。為免錯誤刪改本來的檔案,我們建議同學把所有進一步修正的工作表重新命名,另存檔案

  • 我們可使用重整的數據,重複先前步驟,建立新的交互表列。如下圖示,重新編碼的資料能更簡單明確顯示年齡和自我能力評估的關係

  • 我們亦可以圖表顯示有關資料。由於我們是比較兩個年齡層之自我形象評價,所使用的數據必須以百分比顯示,並以個別年齡層的總樣本數目為基數計算。以上表列滿足此項要求,適用之圖表有100%堆疊直條圖。我們可按功能表之“圖表精靈”選項,另選圖表類型
  • 如想隱藏樞紐分析圖欄位按鈕的圖示,則只需把滑鼠移至“計數”位置,然後右按,點擊下圖箭咀之選項便是。

如想進一步修正左欄之百分比數目,把小數位數刪去,並將最大數目定為100,則可把滑鼠移至圖表的Y軸(即紅線圖示),點擊兩下,然後在“數值”選項中把小數位數改至0。確定以後,重復程序並在“刻度”選項中把最大值改為 1,再按確定。

完成以上的程序後,便會出現以下圖表。同學加上適當的標題,便可用於探究報告中:

練習

- 嘗試使用模擬數據,建立一個探索Q5和Q10的雙變項交互表列。(示範答案)

- 對上述示範有充份掌握的老師,更可考慮把Q10的資料重新編碼,進一步把表列簡化。

 


詮釋變項之間的關係

圖表能更清晰和直接的顯示兩個年齡層的分別。根據以上之模擬數據,父親在情感上的自我評價普遍合格,只有少數覺得自己不是太有能力。然而,年紀較輕的父親之自我評價似乎較高。圖表顯示了兩個變項之相互關係,但並不代表這便是一個因果關係。我們須追問兩個年齡層之差異因何而來,會否跟樣本中的收入和教育程度分佈有關呢?要查探這些問題,我們可就不同的變項配搭繪製交互表列和相關圖表。例子如下:

年齡組別之單變項分佈

以下之雙變項表列顯示兩個年齡組別的屬性其實有所不同,35或以上的受訪者普遍有較高的教育程度和收入。我們必須考慮各個 X (年齡、教育程度、收入)對自我形象 (Y) 可能產生的效應,在報告中仔細隔離和解述,才能有效地舉證和立論。

年齡組別和教育程度之相互關係

 

年齡組別和收入之相互關係

為探討其他兩個 X 變項 (收入、教育程度)和 Y 變項 (如Q2)的關係,我們可建立以下表列:

教育程度和自我能力(情感)評價之相互關係

 

收入和自我能力(情感)評價之相互關係

可想而知,我們將在這過程中建立不少圖表。部份資料可能支持我們原來的推論,亦可帶來意想不到的發現。我們須在原有的概念框架下,有耐性並開放地地審視各項資料,才能理解數據所反映的真相。先前花了很多篇幅強調概念操作化和抽樣的科學程序,正為確保這階段的資料充分,而且可信有效。假若先前的程序太隨意和欠缺系統,只搜集有關自我形象的問題,忽略了查問受訪者的年齡、教育程度和收入,或在量度自我形象之時,只籠統測量了一個面向的現象,則這階段的資料會很單薄,所能進行的分析亦會有限,縱有軟件幫助也無補于事。

老師可嘗試利用是項模擬數據,繪製不同圖表並就自我形象的不同面向進行分析。我們將在第五課續用這些資料,討論如何把這些數據過濾整理,以撰寫探究報告。

 
1, 2, 3, 4, 5
6
7, 8, 9