データの相関は因果とは限りません

データ分析の多くは、相関があるということをベースに分析が行われています。非常に有益な結果を得ることができますが、一方で時によく考えないと痛い目にあうことがあります。高い精度で予測するなどのケースは相関関係で十分だったりしますが、因果を元に何かをしようとしたりするのはリスクがあったりします。そういう事例を見てみましょう。

因果関係とは、2つの事柄のうち、片方が原因となって、もう片方が結果として生じる関係のことをいいます。つまり「原因」と「結果」の関係で、ある出来事が他の出来事を引き起こすメカニズムを示す概念です。例えば、雨が降ると地面が濡れるというのは因果関係の一例。この場合、地面がぬれると雨が降る、とはならなず、一方向の流れ(有向)があります。

なお、相関関係があっても因果関係が無いケースがあります。こういった現象は擬似相関と呼ばれます。このような見せかけの相関とは、2つの変数が関連しているように見えるものの、実際には因果関係がない状況を指します。このような場合、注意深い分析が必要で、見かけの関連性に惑わされないようにすることが大切です。