今日は、アクセス解析や統計の話を。Excelを使えばいろんなデータから相関関係を簡単に出せますが、だからといってそのデータが問題解決につながるとは限らないのです。
Excelには「CORREL」という関数があり、2つのデータ群について相関関係を簡単に出すことができます。しかし、この「相関関係」と「因果関係」を混同してしまっている例があります。統計ではごく基本的なことなのですが、基本的なことこそ大切なので、改めて解説しておきましょう。
「相関関係」とは、「ある値Aが増えた(減った)状態で、別の値Bが同様の変化を示していること」を意味します。また、ある値Aが増えた状態で別の値Bが減ることを「逆相関」といいます。
たとえば、アクセス解析データで、ある期間の訪問者数とPV数の間で相関関係を出すと、かなり高い相関性が見られるでしょう。つまり、訪問者数が増える状況では、同様にPV数も増えているのです。
また、海外&国内SEO情報で取り上げた「順位決定に与えるSEO要因比較 グーグル vs. Bing」でも、さまざまなSEO要因と順位について相関係数を示しています。
→ http://web-tan.forum.impressrd.jp/e/2010/06/18/8214#pickup01
上記の相関関係のデータは「訪問者数が増えればPV数が上がる」「URLにリンクしているルートドメイン名の数が多ければ多いほど検索結果での順位が上がる」という、原因と結果を表しているデータである可能性が高いでしょう。しかし、そうではない場合も多いのです。
ここで重要なのは、「相関関係」が示すのはあくまでも現象であって、必ずしも「Aが増えればBが増える」という「因果関係」を意味しているわけではないことです。
つまり、「相関性がある=因果関係がある」とは限らないのです。
アクセス解析の例でいうと、「記事に対するTweet数とアクセス数に相関性がある」ことから、Twitterでスパムアカウントを大量に作成して各アカウントでtweetしまくったり、自分のTwitterアカウントで大量に記事へのリンクをtweetしたりしても、おそらくアクセス数はさほどは上がらないでしょう。幅広いアクセスを得るには、見てもらえているTwitterアカウントで、フォロワーが興味をもつ内容のコンテンツをtweetする必要があるのは、Web担当者ならわかることです。
少しアクセス解析から離れて例を示しましょう。
仮に、子供の成績と、その親が持ち家を所有しているかどうかに高い相関性がみられたとします。では、親が持ち家を購入すれば子供の成績が上がるのでしょうか? おそらく、この相関性は、「親が持ち家を購入できるくらい裕福であれば、子供の教育費も比較的多く使い、良い教育を受けさせているから子供の成績が上がる」という関係ですので、親がどれだけがんばって持ち家を購入しても、教育費を増やさなければ子供の成績は上がらないでしょう(あくまでも、これは説明のための仮の例ですよ)。
次のページ<相関係数と因果関係>
続きは会員限定です。無料の読者会員に登録すると続きをお読みいただけます。
- 会員登録 (無料)
- ログインはこちら
関連記事
2008.09.26
2010.04.20
安田 英久
株式会社インプレスビジネスメディア Web担当者Forum編集長
企業のウェブサイト活用やウェブマーケティングに関するメディア「Web担当者Forum」(http://web-tan.forum.impressrd.jp/)を運営しています。