你看到的是事實的全部嗎?從香港勞動人口參與率的例子了解辛普森悖論

❮
❯

你看到的是事實的全部嗎?從香港勞動人口參與率的例子了解辛普森悖論


你有沒有遇過這種情況:每個分組的數字都在上升,但整體的總數卻反而下降?這看起來好像不合理,但其實正是統計學中的一個特殊現象 ─ 辛普森悖論 (Simpson's Paradox)。為了讓大家更容易理解,我們會用香港勞動人口參與率數字的例子來說明。


例子:香港勞動人口參與率

我們來比較一下1994年和2024年香港各年齡層的勞動人口參與率(參與率)。除了最年輕組別人士(15至29歲)的參與率因為教育機會增加而略有下降外,其他年齡組別的參與率均有所上升。
(註:15歲以下人口不會被計算在勞動人口當中。)


按年齡組別劃分的勞動人口參與率


直覺地說,如果大多數年齡組別的參與率都上升,整體參與率也應該會上升吧?然而,整體參與率卻從1994年的61%下降到2024年的55%。這就是辛普森悖論的典型例子:分組數據呈現一種趨勢,但整體數據卻朝向相反方向。


什麼是勞動人口參與率?


勞動人口參與率定義


人口老化如何導致辛普森悖論?

這種看似不合理的現象,其實源於一個未被考慮到的隱性因素 ─ 香港人口的年齡結構在1994年至2024年間有很大改變。

  • 老年人口比例大增:在15歲及以上人口中,60歲及以上人口的比例從1994年的17%大幅上升到2024年的36%。
  • 老年人口的勞動人口參與率偏低:老年人口的參與率即使上升,但其水平仍遠低於其他年齡層,因此拉低了整體參與率。

以上例子闡明了辛普森悖論的關鍵要點:當不同分組的相對份額有顯著變化,且分組的數字(如上面例子中的勞動人口參與率)處於非常不同的水平時,分組趨勢和整體趨勢可能不會同步,甚至會朝向相反的方向。


按年齡劃分的勞動人口及勞動人口參與率


結語:仔細觀察數據

辛普森悖論提醒我們,解讀數據時除了只看整體趨勢,亦要深入分析分組數字,以及注意各組相對比重的變化,才能真正了解數據背後的故事。


黃愷彤
研究經理
2025年9月3日