相關不等於存在因果關係:別讓虛假關係誤導你!

❮
❯

相關不等於存在因果關係:別讓虛假關係誤導你!


在日常生活中,當我們觀察到不同數據之間呈現某些規律時,常會進而推測某一變化是導致另一變化的原因。然而,要正確解讀這些規律,我們必須要釐清數據之間是存在明確的因果關係,還是僅僅是相關,從而避免落入虛假關係的陷阱,即表面上的統計聯繫實際上是由第三因素或巧合造成的。


什麼是相關性?什麼是因果關係?

相關性是指兩個事物之間的統計關係。當我們說兩個事物高度相關時,表示當其中一個事物發生變化,另一個也會傾向同時發生變化。然而,兩者之間不一定存在因果關係。


關於相關性的圖表


因果關係是指兩個事件之間存在的一種作用關係,一個事件(因)導致或促成另一個事件(果)的發生,而這種關係須經過反覆的實驗或嚴謹的觀察證據來支持。

較為耳熟能詳的虛假關係例子有防曬霜和雪糕在夏季期間的銷量同時上升。兩者之間存在相關性是容易理解,但若說存在因果關係,相信大家以常理看也難以接受。實際上,它們都受到第三因素「晴朗天氣」的影響,因而出現相關性(陽光明媚→提高對防曬霜的需求;氣溫升高→增加吃雪糕的慾望)。

這個例子簡單易明,但許多實際情況可能並非如此顯而易見。


相關性和因果關係的例子


數據實例:零售業與膳食服務業的同步起伏

根據由政府統計處發布有關零售業和膳食服務業的統計數字,2024年9月至2025年12月的零售業銷貨價值指數和食肆收益價值指數呈現大致相同的趨勢。


零售業銷貨價值指數及食肆收益價值指數


若單從數據規律分析,有些人可能會推斷:人們因為多了外出用餐,所以有更多機會前往商店購物;亦或有人從相反角度推斷。然而,這兩者之間真的有因果關係嗎?透過邏輯分析,不難發現兩者之間的虛假關係極可能是由第三因素「整體消費意欲及經濟環境」所造成。當消費意欲強烈或經濟環境向好時,既會帶動人們更多外出與親友聚餐(推高食肆收益),同時也刺激購買各類商品的零售開支(推高零售業銷貨額)。


從「數據巧合」到「科學實證」

既然數據的同步波動有可能只是受第三因素影響的虛假關係,我們該如何識別真正的因果關係呢?關鍵在於透過嚴謹的對照實驗來排除其他因素的影響,從而確定一個事件(因)如何影響另一個事件(果)。

一個經典的例子,莫過於醫學界如何將一些單純的統計觀察,昇華為具公信力的科學實證:科學家觀察到吸煙者患上肺癌的比例較高。他們透過控制其他潛在影響因素的水平,仔細研究了這種關係,並進行大量的醫學研究實驗,以證明香煙中的有害物質會損害肺部組織,從而得出「吸煙是導致肺癌的主要成因之一」的結論。這是一個經由反覆實驗驗證,排除了第三因素影響,具科學證據支持的因果關係。


吸煙與癌症


了解相關性和因果關係之間的差異對於有效的數據分析至關重要。透過提升統計知識和運用正確的統計方法進行數據分析,我們可以更準確地解讀事物之間的關係,在日常生活中作出更明智的決策。


羅美珊
統計師
2026年4月16日