2.2 從「概念」到「測量」

2. 從「概念」到「測量」

第一課《擬訂探究題目》探討了如何擬定題目，當我們確定了探究的題目後，下一步便是搜集探究資料。問題是，我們如何才知道搜集回來的資料是可信、可靠，並真正對應我們的探究問題？這跟理解背景資料、進行文獻回顧是否嚴謹、確切，與及所採用的探究方法、設計和工具是否合適有莫大的關係。現在讓我們談一下相應的步驟，以使抽象的概念演變成可測量的指標，令探究工作得以順利進行。

2.1 概念操作化

如何把相關的概念轉化為可測量的指標，然後有系統地搜羅資料作分析這一環工作，於整個探究工作中是相當關鍵的。這個把抽象概念轉化為可測量驗證之數據的過程，稱之為概念操作化 (Operationalization of Concepts)。

要說明如何把概念操作化，讓我們先從一個反面教材出發，檢視此例子如何把概念操作化，淺析當中問題，再循本課程系列建議的程序重新修正，帶出探究需要留意的一些重要事項。以下我們會以某團體於2007年所做的一項調查《父親自我形象及期望的調查》（下稱「調查」）做為概念操作化的反例子。我們並非針對個別研究，事實上概念操作化是非常基本卻又不易做好的過程，老師及同學們須多加留意。

2.1.1 例子：父親自我形象及期望的調查

從表面看，這個「調查」基本上是描述性而不是解釋性，集中探究現象的「實情」和「評價」面向（請參照第一課3.1.3(a)）。題目包含三個概念，分別是「父親」、「自我形象」和「期望」，而「調查」把父親角色和第二和第三個概念結合，配成兩個有待操作化的探究概念，即「父親自我形象」和「父親期望」。「調查」共發問了七個問題，當中那些問題是用來測量這兩個概念呢？

「調查」問題（亦即測量工具）		估計用作測量的概念或資料類別
i.	請問你有幾多個兒女?	個人背景資料（子女數目）
ii.	你點解要生下一代？	成為父親的動機
iii.	你認為自己屬於以下哪一類型的父親？	自我形象（所屬之父親類型）
iv.	你認為作為父親最需要給予子女什麼東西？	對父親角色的籠統期望
v.	你認為身為父親感到最大的困擾是？	自我形象（對能力的評估）父親角色的面向
vi.	你最希望兒女同自己講以下哪句說話？	對子女的期望
vii.	在你眼中怎樣評價自己身為父親的成績？	自我形象（對能力的評估）

如上圖顯示，「父親自我形象」和「父親期望」兩個關鍵概念，分別以問題(iii)、(v)、(vii)和 (iv)、 (vi)測量：

關鍵概念	「調查」問題		「調查」答項
父親自我形象	(iii)	你認為自己屬於以下哪一類型的父親？	嚴父型與子女像朋友寵縱兒女不太關心，教兒女是母親的事無意見
	(v)	你認為身為父親感到最大的困擾是？	經濟負擔兒女教育問題兒女健康問題兒女溝通問題來自妻子及其他家庭成員的壓力
	(vii)	在你眼中怎樣評價自己身為父親的成績？	超好好中規中矩不合格
父親期望	(iv)	你認為作為父親最需要給予子女什麼東西？	相陪的時間經濟的支持道德品行的培養精神上支持其他
父親期望	(vi)	你最希望兒女同自己講以下哪句說話？	我考到好成績我想第時好似爹地咁我會孝順你我第時會養你其他

作為測量工具，這些問題能否滿足社會科學探究法的要求？我們不單要留意問題的設計，更需注意所提供的答案選擇。若這些測量工具做得不對確，蒐集回來的數字和資料便得無所用。以下將就每個問題淺探：

概念一：父親自我形象

縱觀「調查」中的三個問題，會發現真正量度的內容其實片面空泛：

問題(iii)：雖原意應是量度父親的自我形象，但實際上只集中評估自己和子女之關係，並以對子女管束之輕重來決定變值的變化。

問題(v) ：「困擾」一詞的意義較含糊，究竟意指自己能力上做得不足的事項，抑或是作為父親會擔憂的問題？兩者的意思明顯不同。探究想尋找的是哪方面的資料？譬如魏先生在作答時選擇了「兒女教育問題」，那我們該詮釋為前者還是後者的意思呢？「調查」的研究設計沒有提供任何幫助我們辨別兩者的線索，這令數據的信度 (reliability ) 和效度 (Validity) 俱減，有機會令我們誤解了數據的指向。這種情況是探究過程必須避免的問題。

問題(vii)：受訪者須在回答這問題時籠統評估自己的表現。

「調查」其實僅有兩個確切量度自我形象的問題，即(iii)和(vii)，我們會發現前者是唯一對自我形象的面向和意思作進一步探索的問題。儘管如此，我們所知的也是有限的，我們只知道父親管束強弱的變幅。(vii)則只是籠統的自我評估，但我們是否真的了解受訪者在回答「超好」或「不合格」的背後是指那方面的好和不好？以現有設計而言，量度父親自我形象的數據實在太零碎單薄，亦導致(vii)所得之數據變得極為空洞，令我們無法真正探究父親的自我形象是什麼。例如有30%父親認為自己身為父親的成績「超好」，我們如何理解並作出解釋？

概念二：父親期望

除了以上三條問題，以及另外兩題有關背景和做父親的動機的問題，有關父親期望的問題只有兩題，分別是(iv)和(vi)。

問題(iv)：這問題跟(v)相若，是存有灰色地帶的問題。問題用的字眼沒有清楚說明是「自己作為父親最需給予子女什麼東西」，抑或「普遍來說，作為父親需給予子女什麼東西」。兩者在邏輯上雖然接近，但其實沒有必然的對等關係。作為測量工具，這問題太空泛，所蒐集回來的資料會因應受訪者在答題時之不同的理解而變，從而減低數據的信度。

問題(vi)：這問題嘗試量度父親對子女的期望，然而答項的設計出現不少問題，容後續述。

最重要的是，在評估這概念的測量程序之前，我們必先返回一個更基本的問題，即有關探究的目的和背後理念。例子中的「調查」沒有詳細解釋設計邏輯或清楚界定每個概念的意思，但有提及探究背後的一些假設：

「一個和諧的家庭，父親的自我形象及期望對促進家庭融洽起重要作用。為此...進行一項調查，以了解已為人父的人士對自我形象及期望的意見。」

若我們從此假設出發，便應在設計問題的時候集中搜集和父親角色與家庭關係有關的資料。需明白每個概念 -- 包括父親角色、自我形象以及期望 -- 的涵蓋面甚廣，我們需清晰了解自己所探究的特定概念之定義，並循這方向把概念轉化為變項或其他類型的測量工具。否則便頓失方向，問非所需，資料得無所用。以下部份嘗試採用本課程系列建議的方法，重返程序的初段，重構並提出基本的建議和修正。

2.1.2 建議和修正

我們建議循以下方向進行修正：

探究主題的設計

資源有限，探究員必須清楚自己的問題是什麼和需要什麼資料，而不應把資源浪費於一些無關痛癢的數據。例子中的「調查」的方向其實一早已欠清晰，更沒交待為何同時探討有關自我形象和期望的問題。兩者的假設關係是什麼？在沒有明確的原因下，我們建議刪去「期望」的問項，集中蒐集「自我形象」的數據，免生無謂枝節，拼砌一個四不像的探究。

概念的定義

「調查」報告中並沒有交代關鍵概念的定義，讓我們先就此作補充修正：

概念

概念定義

父親

父親是一個社會角色 (social role)，是一個關係結構（「家」）下的一個身份 (social status)。家是一種社會建制 (family as a social institution)，而這建制內有一套互動的角色，如母親、兒子或女兒。每個角色都附帶社會／集體價值觀 (social/collective values) 下認可的功能 (functions)。例如，傳統父權社會強調父親在外工作和養家的角色，而母親則負責主內，料理家務和照顧下一代。這些觀念會隨著社會變遷和因應不同背景的社群而有所不同。

自我形象

自我形象則是一個自我評估的概念，關乎個人不同面向 -- 如能力 (capability)、價值 (worthiness) 和重要性 (significance) -- 之反思審定。 (Coopersmith, S. 1967)

如下圖示，我們會在界定概念的過程中，發現不同概念之間的微妙關係。例如，自我形象背後反映的其實是個人對家庭和相關角色的理解和價值觀念。如是者，我們應在概念操作化，以及整體問題的設計中，儘量涵蓋相關的面向，並確保測量工具能搜集足夠的資料去驗證推論的關係。

如何令數據更加豐富？

數據豐富與否，視乎我們如何把概念界定，並逐步將之轉化為測量的工具。假設我們心目中想了解的是父親的自我形象，但這概念太空泛，我們希望在搜集資料的時候有可循的方向可查問。要達到這目的，我們須要在定義的過程中盡量考慮及設想該現象涉及的不同範圍。以自我形象這個概念為例，我們可先分三個面向（能力、價值和重要性），再作不同層面(物質、情感)的次分類：

如此類推，我們可把以上導圖所示的思路操作化為以下的問卷問題。這些問題和附帶的答案便是我們用來量度自我形象的測量工具：

概念

測量問題

自我形象

能力

物質

在過去一年中，你覺得自己是否有能力提供子女在物質上的需求？

非常有能力

有能力

基本滿足

不是太有能力

毫無能力

情感

在過去一年中，你覺得自己是否能夠在子女情緒最低落的時候提供情感上的關懷和支持？

非常有能力

有能力

基本滿足

不是太有能力

毫無能力

價值

對自己的整體評價

整體來說，你覺得自己是一個：　

超級好父親

好父親

合格的父親

強差人意的父親

差勁的父親

自覺別人如何評價自己

整體來說，你覺得自己是外人心目中一個：　

超級好父親

好父親

合格的父親

強差人意的父親

差勁的父親

整體來說，你覺得自己是親友心目中一個：　

超級好父親

好父親

合格的父親

強差人意的父親

差勁的父親

（如適用的話）整體來說，你覺得自己是妻子心目中一個：　

超級好父親

好父親

合格的父親

強差人意的父親

差勁的父親

整體來說，你覺得自己是子女心目中一個：　

超級好父親

好父親

合格的父親

強差人意的父親

差勁的父親

重要性

物質

在提供子女的物質需求上，你認為自己扮演的角色是否重要？

非常重要

頗重要

一般重要

不太重要

毫不重要

情感

在對子女提供情感上的關懷和支持上，你認為自己扮演的角色是否重要？

非常重要

頗重要

一般重要

不太重要

毫不重要

2.2 測量工具的品質

在以上討論何謂好的測量工具時，經常提及信度(Reliability)和效度(Validity)這兩個重要的概念。在社會科學探究中，特別是在量性調查的情況，測量工具的信度和效度是我們必需留心的地方。至於何謂信度和效度，就讓我們以以下例子簡單說明：

2.2.1信度 (reliability)

同一個問題，於不同時間問相同的受訪者，會否得出不同的答案？這便是信度的問題。信度高的測量工具能在重複測試下得出穩定和一致的結果。假設我們分別以兩個容器去重複量度同一體積的清水，而以下是所得數據：

測量次數	體積 (安士）
測量次數	容器一	容器二
1	12	8
2	12.2	7
3	11.9	10
4	12	9
5	12.1	6.5
平均數	12.04	8.1

比較兩個容器，第一個的信度明顯較高，平均數與每次測量體積之差異有限，只是徘徊於0.04至0.16安士之間。反觀第二個容器，可能因為漏水或其他原故，測量結果極不穩定，平均數與每次測量體積之差異少則0.1，多則高達1.9安士，令信度大減。

同一邏輯可應用於社會探究的測量工具。問題和答項所用的詞彙會否含糊不清，導致不同人有不同理解，減低工具的可信性？探究員又會否在訪問時用上帶有指引性的語調，導致數據素質上出現參差？這些都是影響信度的關鍵因素，須多加留意。

(a) 提問詞彙會否含糊不清？

例如，早前提及之「調查」例子中問及，「你認為身為父親感到最大的困擾是什麼？」這問題所指的是受訪者實際遇到的困難，抑或他以為一般為父親會最關心的問題？好的測量工具必須意思明確，因任何詮釋上的含糊都會製造類似容器漏水的問題，減低數據的穩定性。

一般而言，測量工具越劃一化，牽涉越少的主觀詮釋便會信度更高。假設我們只能發問以下一個問題：

問題(一)：在提供物質需要方面，你覺得自己是否一個稱職的父親？
問題(二)：你覺得自己是否一個稱職的父親？

問題(一)把「稱職」劃一定義為滿足子女的物質需要，問題(二)則留給受訪者較多詮釋空間，而對方可能因應當時的情境而聯想到不同的「稱職」指標，減低測量工具的信度。故此，問題（一）較問題（二）擁有較高的信度。

(b) 操作時的人為因素

另外，由於探究往往牽涉人與人之間的互動溝通，我們也須留意操作這些工具時可能產生的偏差問題。例如，我們可能發問以下問題 -- 「在過去的一年中，你曾否參與任何大型遊行？」問題簡單直接，但我們發問的語調可能會令對方感到我們認可或不認可這些行為，這些顧慮都會影響對方會否如實作答。若然我們於發問時的語調不當，使得受訪者誤以為我們並不認同遊行這種行為，結果可能導致受訪者回答沒有（然而事實上他有參與遊行）。換句話說，探究工具不局限於問卷的問題本身，也包括操作工具的探究員。我們需在探究的每個程序保持中立，所蒐集的數據才能保持客觀。

2.2.2 效度 (validity)

信度關乎測量工具的穩定性，效度則評估工具能否真正量度相關概念的實際意思。信度高的測量工具不一定帶有高的效度。假設郵包的真正重量是10千克，而以下是兩個電子磅的測量結果。A磅的測量結果相當穩定，但卻一致地偏離實際重量 5 千克。B磅的測量結果則欠穩定性，結果徘徊於真實數值的 ± 2千克差幅內，但卻比A磅更接近真實重量。兩者比較下，前者信度高、效度低，後者則相反。

測量次數	測量結果 (千克)
測量次數	A磅	B磅
1	5	8
2	5	9
3	5	10
4	5	11
5	5	12
信度
效度

理想的測量工具應兩者兼備。以社會探究問題為例，假設我們想了解受訪者是否有歧視同性戀者，則以下那個問題的效度較高呢？

問題一：你是否認同同性戀？
問題二：你覺得你有否歧視同性戀者？
問題三：假若你同事告訴你知他是同性戀者，你會否因此和他疏遠關係？

測量問題	實際測量的內容	效度
一	對同性戀的認同程度		答案可能和歧視傾向相關，但沒有必然關係
二	有關性向歧視之自我觀念		自我觀念關乎個人之醒覺性，及對歧視定義之理解，未必確切反映當事人的實際行為
三	性向歧視		問題明確量度歧視行為之其中一個面向 (交友準則)，並在問題中表明了因果邏輯

要提高效度，必須弄清自己探究的是什麼，這回歸早前提及之定題和概念定義等問題。