2. 量性資料
2.1 資料輸入
2.1.1 自己蒐集
2.1.2 現存資料
2.2 分析數據
第一課提到資料來源可分兩種,包括自己蒐集和現存公開之數據。不論數據來自那兒,都須要進行資料輸入和分析兩個步驟。以第一個步驟而言,自己蒐集的數據須由數據輸入做起,牽涉較多工夫。現存數據則大多已有 Excel檔案,只需尋找和下載相關檔案,並進行簡單的整理,便可進行分析。
以下討論將就資料搜集和分析數據兩個步驟逐一講解,並於每部份示範如何處理不同來源的數據資料。
2.1 資料輸入
2.1.1 自己蒐集:建立 Excel
圖表
第
二課談及一個有關父親自我形象的調查,就讓我們繼續以這個調查為藍本作一個示範。假設我們依循之前的修改建議,把探索主題鎖定為自我形象;而自我形象的操
作定義有三個面向,包括父親對能力、價值和重要性的自我評價。我們篩選過可使用之實質問卷問題,重新設計這個調查,並制定了以下問卷。
父親自我形象
問卷調查
受訪者編號:______
|
1.
|
你覺得自己是否有能力提供子女在物質上的需求?
|
|
□ (1) 非常有能力
|
□ (2)有能力
|
□ (3)基本滿足
|
□
(4) 不是太有能力
|
□ (5)毫無能力
|
2.
|
在過去一年中,你覺得自己是否能夠在子女情緒最低落的時候提供情感上的關懷和支持?
|
|
□ (1) 非常有能力
|
□ (2)有能力
|
□ (3)基本滿足
|
□
(4) 不是太有能力
|
□ (5)毫無能力
|
3.
|
整體來說,你覺得自己是一個:
|
|
□ (1) 超級好父親
|
□ (2)好父親
|
□ (3) 合格的父親
|
□ (4)強差人意的父親
|
□ (5)差勁的父親
|
4.
|
整體來說,你覺得在親友心目中,自己是一個:
|
|
□ (1) 超級好父親
|
□ (2)好父親
|
□ (3) 合格的父親
|
□ (4)強差人意的父親
|
□ (5)差勁的父親
|
5.
|
整體來說,你覺得在子女心目中,自己是一個:
|
|
□ (1) 超級好父親
|
□ (2)好父親
|
□ (3) 合格的父親
|
□ (4)強差人意的父親
|
□ (5)差勁的父親
|
6.
|
在提供子女的物質需求上,你認為自己扮演的角色是否重要?
|
|
□ (1) 非常重要
|
□ (2)頗重要
|
□ (3) 一般重要
|
□ (4) 不太重要
|
□ (5) 毫不重要
|
7.
|
在對子女提供情感上的關懷和支持上,你認為自己扮演的角色是否重要?
|
|
□ (1) 非常重要
|
□ (2)頗重要
|
□ (3) 一般重要
|
□ (4) 不太重要
|
□ (5) 毫不重要
|
8.
|
請問你的年齡是:
|
__________
|
9.
|
請問你的教育程度是:
|
|
□ (1) 小學或以下
|
□ (2) 中學
|
□ (3) 大學或專上學院
|
□ (4) 碩士或以上
|
□ (5) 其他 (請註明:_____)
|
10.
|
以下那一個類別最能反映你過去三個月內的平均月收入?
|
|
□ (1) $4,999或以下
|
□ (2)
$5,000-10,000
|
□ (3)
$10,001-24,999
|
□ (4)
$25,000-49,999
|
□ (5)
$50,000或以上
|
全問卷完,多謝合作!
|
問卷共有十條問題,分別量度以下變項:
|
變項
|
問題
|
a)
|
對自己能力的評價
|
物質需要
|
Q1
|
情感需要 (關懷和支持)
|
Q2
|
b)
|
對自己價值的評價
|
自己心目中
|
Q3
|
親友心目中
|
Q4
|
子女心目中
|
Q5
|
c)
|
對自己重要性的評價
|
物質需要
|
Q6
|
情感需要 (關懷和支持)
|
Q7
|
d)
|
年齡
|
Q8
|
e)
|
教育程度
|
Q9
|
f)
|
收入
|
Q10
|
|
|

|
我們主要的探究問題包括:
- 單變項的描述性問題
- 父親普遍的自我形象如何?
- 不同面向的自我評價如何?
- 當中有什麼差異?
- 雙變項之相互關係
- 父親之自我形象會否因年齡 (x1)而異?
- 父親之自我形象會否因教育程度 (x2) 而異?
- 父親之自我形象會否因收入 (x3) 而異?
以上問題十分重要,為往後分析提供一個框架,而分析相關的軟件應用將在稍後向同學示範。
假
設探究過程順利,那麼同學眼前應該已放有一疊完成的問卷。每份問卷提供有關一個受訪者的資料,我們在分析時需要把不同個案的數據整合統計。如用人手逐一計
算比較,不但費時繁複,也大大增加可能出現誤差的機會。統計軟件能幫助我們更快和更有效地進行量性分析,要做到這點,我們需把問卷數據轉化為電腦程式所能
閱讀的資料,而這些資料包括:
- 誰是受訪者?
電腦軟件需辨識哪組答案(即十條問題的答項)屬於同一個受訪者。正因如此,我們須為每個受訪者提供一個數字編號,這不單方便資料整理,亦有助日後翻查跟進
- 問的是什麼?
每個問卷問題亦須附有一個編號。為避免把實質數據資料跟問題編號混淆,我們建議在問題編號前加上Q作識認,如問題一等如 Q1,亦即有關父親如何評價自己在提供子女物質需求能力的問題
- 答的是什麼?
問卷中的答案不一定以數字呈現,內容也長短不一。為方便計算答案分佈和比較受訪者之間的異同,我們可以數字來表示不同答項。例如,Q1之下的(1)、(2)、(3)、(4)和(5)便分別代表「非常有能力」、「有能力」、「基本滿足」、「不是太有能力」和「毫無能力」
由於Excel是較普及的教學軟件,以下所有關於量性分析的軟件示範皆會以此為例。
例子和練習
假設我們要輸入左圖之問卷資料,根據Excel工作頁的格式,我們將以列(row)來代表不同個案,即每一份問卷的資料.例如,列2數據便來自受訪編號1即左圖)的問卷。欄(column)則用作顯示問卷中不同問題的答案。以右圖為例,B、C 欄便分別提供了所有受訪者就Q1和Q2提供的答項。例如,B2 顯示的是 1,意思是編號1問卷中第一條問題的選項是1,即「非常有能力」。

|

|
如此類推,老師可嘗試把以下問卷資料填寫入Excel工作頁。
- 模擬問卷
(共十份)
所輸入的資料應跟以下相同:

|
|
|
2.1.2 現存資料:下載 Excel
圖表和將之格式化
除自己蒐集資料外,同學也可使用現存數據。我們極鼓勵同學探索這可能性,使用官方或國際組織發佈的統計數字,而不是那些已經篩選,附帶分析的報告資料。第一課曾提及某些存放原始數據的網址,包括:
o 香港特別行政區
- 社會專題
- 類別
o 中華人民共和國
§ EIU
CountryData (Asia-Pacific)
§ International
Statistical Yearbook
§ World
Development Indicators
以上建議之數據大多提供Excel檔案,下載後便能進行整理分析。至於那些沒有提供 Excel 存檔下載的網站,則可以自己把相關的數據鍵入新的Excel工作頁來做分析,以下是一些示範。
例子一:香港官方資料
正如先前提到,同學須辨清自己的報告專題是什麼,以便判斷那些原材料適合自己。假設我們想探究香港的濫藥情況和發展趨勢,以及不同性別和年齡層的濫藥原因。這類資料有一定敏感度,同學實難自己蒐集,更遑論探查跨年趨勢。官方數據便最能提供這方面的資料,保安局禁毒處的網站更提供了一些可供下載的毒品統計數字,方便我們根據探究需要選取相關的變項資料。
讓我們先打開保安局禁毒處中,有關毒品統計數字的網頁:

根據以上提示按下去,便會出現以下頁面:

繼續按下去的話,便會出現新的版面,內有多個下拉式清單方塊,方便同學查看,決定是否能夠把探究概念和現存數據做個適當的配對。如數據適用於探究的話,便可下載相關之變項資料。

|
根據先前的討論,我們可把樣本的年期規範為2000-2007年,檢視這八年間的變化。我們可把先前鎖緊的概念配對現存的變項:
|
探究概念
|
現存數據所提供的變項
|
a)
|
濫藥的普遍程度
|
所有被呈報吸食毒品人士
|
b)
|
性別
|
性別
|
c)
|
年齡
|
年齡
|
d)
|
濫藥原因
|
現時吸食毒品原因
|
e)
|
趨勢
|
以上數據之跨年比較
|
確定相關的數據後,我們便可選擇相關之表單項目,然後按下左圖紅色箭咀顯示的「查詢」按鈕。換句話說,我們將比較21歲以下和以上兩個年齡組別的男性和女性為何吸食毒品。探究問題包括:
- 單變項的描述性問題
- 吸毒人士的性別分佈如何?
- 吸毒人士的年齡分佈如何?
- 整體而言,各項濫藥原因的排序如何?
- 雙變項之相互關係
- 吸毒原因會否因年齡 (x1)而異?
- 吸毒原因會否因性別 (x2) 而異?
- 單變項趨勢分析
- 體濫藥數字在 2000 至 2007 年間出現什麼變化?
- 雙變項趨勢分析
- 不同性別之濫藥數字在 2000 至 2007 年間出現什麼變化?
- 不同年齡層之濫藥數字在 2000 至 2007 年間出現什麼變化?
|
查詢結果會以簡單表列形式顯示,同學可審視基本資料,以確定數據是否可取。資料適用的話,便可按左下角之「下載到Excel 文件」按鈕,把相關資料存檔,再作分析。


同學可根據需要,嘗試不同的表單配搭,探索不同變項之間的關係,決定是否需要修正本來的探究問題,以求對濫藥現象有最全面的探討。
|
例子二:中國官方資料
下列版面顯示國家統計局的年度數據,內有不同資料類別之年度數據,同學只需選擇相關的分類,然後在下拉選單中選擇抽選的年份,再按檢索,便會顯示相關的資料。假設我們想了解國內在工業化的過程中的排污量有何變化,以及相關的環保資源有否增長。我們在查看過相關的資料後,認為排污量這變項頗為常用,能基本把「工業污染」和「環保投資」兩個概念操作化為:
概念
|
變項
|
a) 工業污染
|
i) 工業廢水排放達標量
|
ii) 工業廢氣排放量
|
iii) 工業固體廢物產生量
|
b) 環保投資
|
i) 工業污染源治理總投資
|
ii) 工業污染源治理投資
|
- 廢水
|
- 廢氣
|
- 固體廢物
|
c) 趨勢
|
以上數據之跨年比較
|
如是者,我們可參看以下統計數字,並把資料鎖緊於2002- 2007 年間之數據:

下列左圖顯示檢索後出現的畫面,而我們可以滑鼠移至「十二、環境保護」,然後按下,則畫面會打開右圖顯示之多個表列選項。
同學可選取「12-1 環境保護基本情況」,出現的便是以下版面。同學可按表上之Excel 連結,下載相關檔案分析:
|