2021年1月8日 更新

主成分分析とは?(手法解析から注意点まで)

主成分分析について、YouTube動画を基に解説します。

はじめに

この記事はYouTubeにアップした動画との連動記事です。
というよりむしろ動画がメインで、こちらの内容は概要レベルのものとなっております。
内容をしっかり理解するためにも、ぜひ動画と合わせて本文を読んでみてください。

【主成分分析】本より分かりやすい!動画だから分かる!主成分分析とは?

主成分分析とは?

主成分分析とは、観測された多くの量的な説明変数をより少ない合成変数(主成分)にして要約する手法のことです。
たとえば教科の点数を例にとって話すと、国語の点数や数学の点数のような実際に出ている点数(観測変数といいます)を要約して新しく総合学力、という合成変数を作るやり方を主成分分析と言います。
主成分分析の例

主成分分析の例

ちなみに4教科の合計点でもいいのではないか、と思うかもしれませんが、それだと教科によって平均点に差が出てしまうため平均点が高い科目が得意な人が有利になってしまいます。
そういったパターンを避けるために主成分分析は利用されます。

主成分分析は幅広い分野(ビジネス、研究開発等)で使用され、近年では、機械学習でも使用されています

主成分分析の利用シーン

マーケティングリサーチでの利用シーン

マーケティングリサーチにおいて、たくさんの項目を少ない変数で要約(説明)したいときに主成分分析を利用します。
マーケティングリサーチでの利用シーン

マーケティングリサーチでの利用シーン

たとえば上記の図のように味の評価について飲みごたえなど6つの項目があったとします。
それぞれの評価をランキングにすることもできますがたくさんあるので主成分分析を使ってまとめてしまい、総合評価のランキングとしたり、ポジショニングマップを作ったりします。

このように主成分分析は味やブランドの評価、企業の評価をしたいとき、少ない変数で要約するのに利用して総合評価ランキングやポジショニングマップ作成に利用することができます

データサイエンスでの利用シーン

データサイエンスでの利用シーンも基本的にはリサーチの時と同じように、たくさんの項目を少ない変数で要約(説明)したいという場面で使います。
データサイエンスでの利用シーン

データサイエンスでの利用シーン

たくさんのデータがある時、そのまま使うと計算コストがかかるので主成分分析で特徴量を要約し、データを小さくするのに使います。
このような方法を次元削減と言います。

結果の見方

①どのような主成分が作成されたか

主成分分析の結果として、調査会社さんから下記のような数表が納品されると思います。
結果の見方①

結果の見方①

まず最初に、どのような主成分が作成されたか、ということを確認します。
図の枠で囲っている主成分名です。
今回の場合、2つの主成分があり、第1主成分は「総合的な味の良さ」、第2主成分は「爽快さ」ということになります。

②主成分と質問項目はどのような関係か

結果の見方②

結果の見方②

次は主成分と質問項目はどのような関係か、という点を確認します。
上記の図の枠で囲われた部分で「主成分負荷量」とも言います。

今回の場合、第1主成分を見るとすべての質問項目に対してプラスになっています。
このように全部プラスになっていると総合的な能力のある主成分かな、ということで総合的なものと判断します。
主成分分析をすると大体最初の項目は総合能力になることが多いです。

次に第2主成分を見るとプラスとマイナスが混在していますが、黄色く色を付けている後味の良さや爽やかさなどの爽快さが大きな割合を占めているので結果として第2主成分の得点が高くなっています。

③主成分ごとにどれくらい寄与しているか ※余裕があれば

もし余裕があれば主成分ごとにどれくらい寄与しているか、という部分も確認するといいでしょう。
結果の見方③

結果の見方③

上記の図の枠で囲われた部分をご覧ください。
第1主成分の寄与率は43%となっているので、今回この項目は第1主成分で43%のことが表せる、ということです。
そして第2主成分は27%で、足すと累積寄与率が70%となるので、第1主成分と第2主成分で70%のことが表せると言えます。

注意点

全てのデータに主成分分析が適切なわけではありません。

例えば下記のようなデータは不適切です。
相関のないデータ
 →計算できるけど意味がありません。

「総合力」を仮定しない場合
 →因子分析を検討した方がいいでしょう。

主成分分析と因子分析の違い

主成分分析は、要因を総合化して新しい軸(主成分)を作ります
因子分析は、要因に働きかける共通因子を抽出します

文字だとわかりにくいので、具体的に教科の点数を例を挙げるとこのようになります。
主成分分析と因子分析の違い

主成分分析と因子分析の違い

主成分分析だと国語の点数や英語の点数などがあった場合、これらから総合的なものを作るので「主成分」

因子分析だと点数があった場合、裏側に共通の因子があってそれの影響を受けてテストの結果が出ている、と考えます。

このように見ると矢印の向きが違うので、主成分分析と因子分析は似ているけど考え方が違う、と覚えておいてください。

簡単に複数のものを要約して総合的なものを仮定するのであれば主成分分析の方が簡単なのでオススメですが、わからなければ調査会社さんと相談してみてください。

主成分分析の注意点

以下は、結果を見るだけなら、とりあえず理解しなくても大丈夫です。

・主成分の軸は名前は分析者の主観でつけています。
・累積寄与率が70〜80%に達するところまでの主成分数を採用することが多いです。
 (計算上は、観測変数と同じ個数出てきます。)
・観測変数の単位が揃っていないときは、データを基準値に変換して主成分分析を行います。

主成分分析のまとめ

利用シーン

たくさんの項目を少ない変数で要約(説明)したい。
 →たくさんの評価項目を要約して「総合的評価」でランキングを作る。
 →第1主成分と第2主成分の軸を使ってポジショニングマップを作る。

結果の見方

作成された主成分と主成分負荷量を確認する。
 →どのような主成分が作成されたのか。
 →主成分と観測変数はどのような関係か。
 →主成分得点と主成分得点での散布図は素直に見れば大丈夫。
YouTubeでは更に詳しく、わかりやすく解説しています。
ぜひ記事と併せて御覧ください。

https://youtu.be/INmTgriRF7A
42 件

関連する記事 こんな記事も人気です♪

この記事のキュレーター

Sayuri Sayuri