![]()
在日常生活中,当我们观察到不同数据之间呈现某些规律时,常会进而推测某一变化是导致另一变化的原因。然而,要正确解读这些规律,我们必须要厘清数据之间是存在明确的因果关系,还是仅仅是相关,从而避免落入虚假关系的陷阱,即表面上的统计联系实际上是由第三因素或巧合造成的。
相关性是指两个事物之间的统计关系。当我们说两个事物高度相关时,表示当其中一个事物发生变化,另一个也会倾向同时发生变化。然而,两者之间不一定存在因果关系。

因果关系是指两个事件之间存在的一种作用关系,一个事件(因)导致或促成另一个事件(果)的发生,而这种关系须经过反覆的实验或严谨的观察证据来支持。
较为耳熟能详的虚假关系例子有防晒霜和雪糕在夏季期间的销量同时上升。两者之间存在相关性是容易理解,但若说存在因果关系,相信大家以常理看也难以接受。实际上,它们都受到第三因素「晴朗天气」的影响,因而出现相关性(阳光明媚→提高对防晒霜的需求;气温升高→增加吃雪糕的欲望)。
这个例子简单易明,但许多实际情况可能并非如此显而易见。

根据由政府统计处发布有关零售业和膳食服务业的统计数字,2024年9月至2025年12月的零售业销货价值指数和食肆收益价值指数呈现大致相同的趋势。

若单从数据规律分析,有些人可能会推断:人们因为多了外出用餐,所以有更多机会前往商店购物;亦或有人从相反角度推断。然而,这两者之间真的有因果关系吗?透过逻辑分析,不难发现两者之间的虚假关系极可能是由第三因素「整体消费意欲及经济环境」所造成。当消费意欲强烈或经济环境向好时,既会带动人们更多外出与亲友聚餐(推高食肆收益),同时也刺激购买各类商品的零售开支(推高零售业销货额)。
既然数据的同步波动有可能只是受第三因素影响的虚假关系,我们该如何识别真正的因果关系呢?关键在于透过严谨的对照实验来排除其他因素的影响,从而确定一个事件(因)如何影响另一个事件(果)。
一个经典的例子,莫过于医学界如何将一些单纯的统计观察,升华为具公信力的科学实证:科学家观察到吸烟者患上肺癌的比例较高。他们透过控制其他潜在影响因素的水平,仔细研究了这种关系,并进行大量的医学研究实验,以证明香烟中的有害物质会损害肺部组织,从而得出「吸烟是导致肺癌的主要成因之一」的结论。这是一个经由反覆实验验证,排除了第三因素影响,具科学证据支持的因果关系。

了解相关性和因果关系之间的差异对于有效的数据分析至关重要。透过提升统计知识和运用正确的统计方法进行数据分析,我们可以更准确地解读事物之间的关系,在日常生活中作出更明智的决策。
罗美珊
统计师
2026年4月16日