マーケティングキャンパス 基礎から実践までBtoBマーケティングを学ぶサイト

Loading

ホーム > 講座 > ノヤン先生のマーケティング講座 > 『多変量解析』に挑戦!注意すべきポイントはココ!

2006.11.21

『多変量解析』に挑戦!注意すべきポイントはココ!

多変量解析の本には、複雑な数式がいっぱい。実際にいつ、どの方法を使うのが有効?今回は、マーケターの皆様の身近な例をもとにノヤン先生が解説します。

ミミズクのノヤンじゃ。データベースマーケティング一筋にもう20年以上も研究を続けてきたんじゃが、このシリーズでは企業のマーケティング担当者が理論武装するための基礎理論を学んで欲しいんじゃ。

今日は多変量解析の実践編じゃの。
といっても、ややこしい数式をつらつら書く気はないから安心してええんじゃよ・・・。実を言うとワシも文系のミミズクなんじゃ(笑)。
もちろん多変量解析は「統計手法」じゃから本質的には「数学」なんじゃ。じゃから数式を知りたい人は本屋に行って統計コーナーに行けば、レベルに合わせた良い本がたくさん見つかるじゃろう。ここで知ってほしいのはあくまで、「どう使うか」「どこを注意して使うか」というポイントなんじゃ。

ノヤン思い出してみればマーケティングを始めて一番しんどかったのは、20代の頃に「ハフモデル」を使った調査手法を覚えなければならんかった時じゃよ。
これは大型商業施設の売り上げ予測に使うんじゃが、交通量、年齢別、世帯別、所得別などの人口分布、予定している各売り場面積と競合店の同一商品の売り場面積、競合店との距離、品揃え、各売り場の地域内での競合優位性、などの膨大なデータをハフモデルの数式に代入すると、売り上げ予測が出るんじゃよ。

まだ建設前の、それも更地どころか用地買収前の段階で3年後にオープンするショッピングセンターの売り上げ予測が出るのには驚いたワイ・・・。当時カリフォルニア大学の教授じゃったデービッド・ハフ博士の頭の中を見てみたいと思ったもんじゃよ。
実はこのハフモデルも多変量解析の応用の一種なんじゃ・・・。

さて、多変量解析を使うにはいくつかの注意点があるんじゃ。

先ず、「重回帰分析」、「因子分析」、「主成分分析」などとたくさんある多変量解析の中のどれを使うか、という点じゃな。
多変量解析では目的変数(結果)と説明変数(原因)があるというのは前回説明した通りなんじゃが、実は「目的変数」を持たない多変量解析もあるんじゃよ。

例えばWebのコンテンツを「営業研修の情報」「経理研修の情報」「人事研修の情報」「工程管理の情報」などに分けて、アクセスして資料請求をした人をサンプルデータとして解析する場合、どのWebを見たか、で分析する訳じゃから結果つまり「目的変数」はないんじゃ・・・。
この場合は目的変数を持たない多変量解析、つまり「クラスター分析」や「主成分分析」が使えるじゃろう。目的は誰がどのグループに属するのかを判別するためのグルーピングであり、傾向分析なんじゃな。

一方、「目的変数」を持った多変量解析では、例えば、営業マンの営業成績をサンプルにして変数の中の「年間売上金額」を目的変数にして、「担当顧客数」と「訪問件数」「見積もりの提出数」などを説明変数にして、未来を予測したり潜在能力を測ったり、評価したりできるんじゃ。「重回帰分析」や「判別分析」がこの「目的変数を持った多変量解析」に該当するんじゃよ。

ノヤンもうひとつの注意点は、データが「数量データ」か「カテゴリーデータ」か、という点じゃ。「数量データ」とはそのデータが数値として計算する意味を持っているものなんじゃ。じゃから「量的データ」とも呼ぶんじゃの。「カテゴリーデータ」は「質的データ」とも呼ばれて、それを数値として計算することに意味が無いものなんじゃ。

例えば過去3年間に出展した展示会の評価分析をしようとする場合、「小間数」「獲得名刺数」「創出案件数」「投入した人員」「コンパニオンの数」などはみんな「数量データ」じゃ。ちょっと強引じゃが、コンパニオンの外見をきれいな順にポイント化し「10」「5」「3」などと定義すれば、これもある意味「数量データ」なんじゃよ。まぁこれなんか、獲得名刺の数にまともヒットするかも知れんから侮れないデータじゃがの(笑)。

しかし、アンケート項目に業種を入れて、これを「製造業は1」「金融業は2」「サービス業は3」と区別したとしても、この数値は単なる業種の種類を分類しただけであって、数値に大きい小さいなどの意味は無いから計算したり並べ替えたりしても何も得られないんじゃな。

この「目的変数があるか、ないか」と「データは数量データかカテゴリーデータか」によって使う多変量解析が違うんじゃよ。
例えば上で書いた、過去数年で出展した展示会を総合評価したい場合、展示会ごとに「小間数」「獲得名刺数」「創出案件数」「投入した人員」「コンパニオンの数」「コンパニオンの質」「総来場者数」「ブースの位置」(これもコンパニオンの質と同様の数値化をする)などを変数として、「創出案件数」を「目的変数」にし、これに関係性の高そうな変数を選んで「重回帰分析」で演算すれば、貴重なデータが得られるじゃろう。「重回帰分析」は「評価・予測・目的変数に対する影響度」などを知ることができる、マーケターにとって最も頼りになる多変量解析なんじゃ。

ちなみにこれらのデータを見てみると、驚くことに「小間数」や「総来場者数」は「創出案件数」にあまり因果関係が無いことが多いんじゃよ。
これは「標準偏回帰係数」という、これまたややこしい名前の係数を使って出すことができるんじゃ。これは説明変数の目的変数への関係の強さを出す係数なんじゃ。「重回帰分析」の重要なプロセスのひとつじゃの。

おっと、もうひとつ説明変数の選択には大事な注意点があるんじゃよ。
それは、相互に関連性を持つ説明変数を使ってはいけないということなんじゃ。これは説明変数の整理整頓をしないといかん、ということじゃな。言葉で言えば簡単じゃが案外難しくて困るところなんじゃ。

例えばこの展示会の例で言えば、展示会出展コストと小間数の関係には関連があるが、イコールではない。つまり、小間数の単価が30万円で10小間での出展を単純に300万円とするなら、この2つを説明変数にする意味はないんじゃ。しかし現実は主催者へ支払う出展料やブースの施工コストだけは小間数の単価に連動するが、出展コストには他の要素も入るじゃろう。コンパニオンの人件費、プロモーションビデオや会場で配るパンフレットの制作費、ノベルティの購入費などがあるからの。だから説明変数の関連性を考えるのはちょっと難しいんじゃ。

ノヤンまぁ数字を扱うにはこうした行間を読む文系的なセンスも必要なんじゃよ。これで展示会ごとの案件創出への関係を演算すると、最も大きく影響を与えるのは「獲得名刺数」だとわかるんじゃ。だからシンフォニーマーケティングでは「展示会ではとにかく名刺を1枚でも多く収集してください」とクライアントに言っておるんじゃよ。

Copyright © 2006 Noyan All Rights Reserved.・・・・・・・