Excelで学ぶ分散と共分散の計算方法

Excelで学ぶ分散と共分散の計算方法 IT

第1章:そもそも分散と共分散って何?

Excelを使ってデータ分析を始めようとすると、よく見かけるのが「分散」や「共分散」という言葉。なんとなく難しそう…と思ってしまいがちですが、実はこの2つの概念は、業務で数字を扱う上で非常に重要な基本です。

ここでは、「分散」と「共分散」が何を意味するのか、それがどう実務に活かせるのかを、できるだけ直感的に解説していきます。


分散とは? ─ データの「ばらつき」を見る指標

たとえば、あなたのチームに営業スタッフが5人いて、それぞれの月の売上が以下のようだったとします。

Aさん:100万円
Bさん:90万円
Cさん:110万円
Dさん:95万円
Eさん:105万円

このデータを見ると「みんな似たような売上だな」と感じるはず。つまり、ばらつきが小さいということ。
この「ばらつき具合」を数値で表すのが「分散」です。

もし、同じ平均売上100万円の別の5人が以下のような成績だったらどうでしょう?

Aさん:50万円
Bさん:150万円
Cさん:80万円
Dさん:120万円
Eさん:100万円

平均は同じでも、上下の差がかなり大きいですね。
こちらはばらつきが大きく、分散も大きいというわけです。

分散は「データが平均からどれくらい離れているかの平均」です。業務における使いどころとしては、チーム内の成績の安定性を判断したり、不確実性(リスク)を数値化することができます。


共分散とは? ─ データ同士の「関係性」を見る

「共分散」は、2つの変数が同時にどう動くか、つまり「一緒に増える?逆方向?」を判断するものです。

例えば、以下のような2つのデータがあるとします。

  • 広告費(万円):10、20、30、40、50
  • 売上(万円):100、150、200、250、300

広告費を増やすほど売上も増えていますね。こうした場合、広告費と売上の「共分散」はプラスとなります。
逆に、広告費が上がると売上が下がる関係なら、共分散はマイナスです。

共分散の特徴は「正・負の方向」が理解できること。どちらも平均からの距離をベースに算出し、「一方が平均より上のとき、もう一方も上ならプラス」「反対の動きならマイナス」という仕組みです。


実務ではどう使う?

分散と共分散は、以下のような場面で活用されています:

  • 営業成績データ: チーム全体の実力差や、個人の売上の安定性を数値で把握
  • マーケティング分析: 広告費と売上、SNSフォロワー数と申込数などの関係を把握
  • 株式投資・経済指標: 資産のリスク分散や、異なる銘柄の動きの相関分析

日常の業務でちょっとしたExcel操作をするだけでも、データの本質をより深く理解できるようになります。
「ただの数字」だった売上が、「チームのばらつき」や「マーケ施策の影響」を教えてくれるようになりますよ。


次章では、実際にExcelを使って分散を計算する方法について詳しく見ていきます。VAR.S関数って何?手動で計算する意味あるの?初めての人でも分かりやすく解説しますので、お楽しみに。

第2章:Excelで分散を求める方法(基礎と関数の使い方)

前章で「分散とはデータのばらつきを表す指標」であると紹介しました。今回は、実際にExcelを使ってその分散を求める方法を学んでいきましょう。

この章を読めば、「Excelに数値を入力 → 分散を計算 → チームの成績の安定性を数値で見る」ができるようになります。


VAR.S と VAR.P の違いを押さえよう

Excelで分散を計算する関数は主に2つあります。

  • VAR.S(分散:標本)
  • VAR.P(分散:母集団)

この違いをざっくり言うと、「データが全体の一部か(標本)」「全体か(母集団)」です。例えば、会社全体の営業スタッフの一部だけを分析するときはVAR.Sを、全員のデータがそろっている場合はVAR.Pを使います。

とはいえ、現場ではどちらもよく使われており、多くのケースではVAR.Sが主流です。これは、多くのビジネスシーンでは「一部のデータで全体の傾向を見る」ことが多いためです。


手動で計算してみよう:理解が深まるプロセス

関数を使えば一瞬で結果が出ますが、まずは1度、自分の手で「分散がどうやって出るか」をざっくり体験してみましょう。

先ほどの例を再掲します。

Aさん:100万円
Bさん:90万円
Cさん:110万円
Dさん:95万円
Eさん:105万円
  1. まず、これらの平均を求めます。
    =AVERAGE(セル範囲)
  2. 各データから平均を引き、差を求めます。
  3. その差を2乗します(偏差の2乗)。
  4. それらを足して、人数マイナス1で割ると分散(標本)です。

このようにして手計算してみると、「なぜ平均と比べるのか」「なぜ2乗なのか」「なぜn-1で割るの?」などが自然と頭に入ってきます。


関数で一発!Excelがあれば怖くない

さて、実務ではいちいち手計算していては時間が持ちません。Excelなら一瞬です。例えば下記のようなデータが、A列に入力されているとします。

A1: 100
A2: 90
A3: 110
A4: 95
A5: 105

このとき、セルB1に次のように入力します。

=VAR.S(A1:A5)

これだけで分散が求められます。もしスタッフ全員分の正確な売上データがそろっているなら、VAR.P関数を使ってもOKです。

関数は
=VAR.S(範囲):標本(部分的なデータ)
=VAR.P(範囲):母集団(全体データ)
と覚えておきましょう。


実務への応用:ばらつきの数値から見るチームの安定感

この分散の数値が大きければ、売上にばらつきが大きい=スタッフ間に実力差や不均衡がある可能性があります。
逆に小さければ、みんな安定して働いている=チーム全体での成果が均質とも判断できます。

たとえば毎月の売上分散を出して変化を追えば、「最近チームの成果が安定しているか?」というマネジメント指標にもなります。


次章では、分散の兄弟的存在である「共分散」について解説します。2つの変数の関係性を見たいときにとても便利な指標です。こちらもExcelで簡単に求められるので、ぜひ続けて読んでみてください。

第3章:共分散をExcelで計算するステップ

前章では、Excelを使って1つの変数の分散(ばらつき)を求める方法を紹介しました。今回はその発展系とも言える「共分散」について学びます。

共分散は、2つの変数の関係性(同じ方向に動く?逆方向に動く?)を探る分析手法です。売上と広告費、アクセス数と購入率など、複数の要因を同時に考える際に使える重要な指標となります。


COVARIANCE.S と COVARIANCE.P の違い

Excelには、共分散を求める専用の関数が2種類あります。それが以下です。

  • COVARIANCE.S(array1, array2):標本にもとづく共分散(よく使う)
  • COVARIANCE.P(array1, array2):母集団にもとづく共分散

第2章の分散と同じく、データが一部(標本)か全体(母集団)かによって関数を使い分けます。ビジネスの現場では全データがそろっていることは少ないため、基本的にはCOVARIANCE.Sを使うケースが多いです。


実際のデータ例:広告費と売上の関係

ここでは、広告費と売上のデータを使って、2つの変数にどのような関係性があるのかをExcelで調べてみます。

以下は仮のデータです(単位:万円)。

広告費 売上
1月 10 100
2月 20 150
3月 30 200
4月 40 250
5月 50 300

このデータから、「広告費を増やすと売上がどうなるのか?」を共分散で確認してみましょう。


Excelでの入力方法

データをExcelのシートに次のように入力します。

A列:広告費(A2〜A6)
B列:売上(B2〜B6)

A列:
A2: 10
A3: 20
A4: 30
A5: 40
A6: 50

B列:
B2: 100
B3: 150
B4: 200
B5: 250
B6: 300

共分散を求めたいセルに次の関数を入力します。

=COVARIANCE.S(A2:A6, B2:B6)

この関数で返ってくるのが、「広告費と売上の共分散」です。
結果が正の値であれば、「広告費が上がると売上も上がる」傾向があるということ。逆に負の値であれば、「広告費が上がると売上は下がる」可能性があると解釈できます。


なぜ共分散が重要なのか?

1つの数字だけ見ているとわからない関係性も、共分散を使うことで数値として表現できます。特に次のような場面で有効です:

  • マーケティング施策(広告費と売上の連動性)
  • 営業活動(訪問件数と成約数の関係)
  • 財務データ(売上と利益)

さらに、複数の要因が絡み合う現実のビジネスでは、「1つの数字」より「関係性の見える化」が成果を上げるカギになります。


注意点:相関係数との違いにも触れておこう

共分散は、値が大きければ関係性が強いように見えがちですが、数値の単位やスケールに依存するため、比較しにくいという弱点もあります。

例えば「円」や「万円」「千人」「件数」など、単位が違うと数値の大きさにも違いが出ます。だからこそ、次のステップとして「相関係数」も学ぶと、より明確に関係性を判別できるようになります。


次章では、共分散の数値をさらに直感的に理解するために、Excelでの「グラフ可視化」に挑戦していきます。
散布図を描いて、2つの変数がどう動いているかを目で見てみましょう。

第4章:グラフで直感的に!分散・共分散の可視化テクニック

これまでの章で、Excelを使って分散や共分散を計算する方法を学びました。数値としての理解も大切ですが、実務ではそれだけでは不十分なときもあります。「数字の意味をチームに共有」したい場面では、グラフを使った直感的な可視化がとても効果的です。

この章では、Excelでできる視覚化テクニックとして、散布図の作成方法とそこから何が読み取れるのかを解説していきます。


散布図とは?共分散を「目で見る」方法

散布図(英:Scatter plot)は、2つの変数の関係性を二次元グラフで表現する方法です。X軸に広告費、Y軸に売上を割り当てたグラフを作成すれば、「広告費が上がると売上も上がる傾向があるか」が一目瞭然になります。

たとえば、第3章で使用した以下のデータを対象としましょう。

広告費(X軸) 売上(Y軸)
1月 10 100
2月 20 150
3月 30 200
4月 40 250
5月 50 300

このようなデータを使って、散布図を描いてみましょう。


Excelで散布図を作成する手順

  1. データをExcelに入力(例:A列に広告費、B列に売上)
  2. データ範囲(A2:B6)を選択
  3. メニューから[挿入] → [散布図(X,Y)] → [マーカーのみの散布図]を選択
  4. 散布図が挿入されるので、必要に応じてタイトルや軸ラベルを追加

完成した散布図を見ると、右上がりに点が並んでいることがわかります。これは「広告費が増えると売上も増える」という正の共分散を直感的に示すものです。


Excelグラフでの相関のイメージを深める

散布図に加えてExcelでは「近似曲線」や「相関係数の表示」を行うこともできます。以下を試してみましょう。

  1. 散布図上のデータ点をクリック
  2. 右クリック→[近似曲線の追加]
  3. 右パネルで[線形]を選び、「グラフに数式を表示」「R²値をグラフに表示」にチェック

このR²値(決定係数)は、2つの変数の相関がどの程度か(相関係数を二乗した値)を表すもの。これにより、共分散だけでなく「どのくらい強いか?」という強さの指標も可視化できます。


分散・共分散と「相関係数」の関係性を理解しよう

ここで整理しておきたいのが、分散・共分散・相関係数の関係性です。

  • 分散: 1つの変数が平均からどれくらいズレているか
  • 共分散: 2つの変数がどちらの方向に動くか(正か負か)
  • 相関係数: 共分散を標準化したもの(-1〜+1で強さがわかる)

共分散は、値の単位やスケールによって数値が左右されますが、相関係数はスケールに関係なく比較できる標準化された値です。たとえば、売上と広告費だけでなく、フォロワー数やWebアクセス数など別の単位のデータとも関係を比べることが可能になります。

これはつまり、「共分散でおおまかな関係性を知り、相関係数で強さを測る」という使い方が実務では多いということ。


ビジュアル化の魅力:数字を「伝わる分析」に変える

グラフによる可視化は、ただの自己分析ではなく、チームや上司への報告・提案資料にも非常に効果を発揮します。

「広告費と売上には正の関係があります」と数字だけで書くよりも、散布図を1枚貼るだけで、相手は一目で理解できます。
データ分析のゴールは「わかる」だけでなく「伝わる」にあることを忘れずに、視覚的なアプローチも積極的に取り入れてみてください。


次章では、この分散・共分散を実際のビジネスでどう活かすかという観点から解説していきます。
リスク管理やデータ分析の第一歩としての活用法、さらに今後の応用(相関分析・回帰分析)にも触れていくので、ぜひラストまでご覧ください。

第5章:分散・共分散を業務にどう活かす?

ここまでで、分散と共分散の概念的な理解と、Excelを使った実際の計算・可視化方法について学んできました。では、この分析結果を実務にどう活かせばよいのでしょうか?

この章では、分散・共分散によって得られた数値を、実際の意思決定や業務改善に役立てる方法を紹介しつつ、次の一歩となるデータ分析手法にも触れていきます。


リスクの「見える化」:ばらつきから学ぶ意思決定のヒント

まず、その基本となる考え方が「分散=リスクの大きさ」と捉えることです。

たとえば、次のような売上データがあるとします。

  • 営業A:月によって売上が上下するけど、たまに大きな成果を出す
  • 営業B:毎月安定して平均的な売上を維持している

この2人の売上平均が同じだったとしても、分散を見れば営業Aは不安定(分散大)、営業Bは安定(分散小)と判断できます。

この結果をもとに、例えば次のような意思決定に活用できます:

  • 新規プロジェクトにはリスクが少ないBをアサイン
  • Aのようなハイリスク・ハイリターン型はコア業務以外で活用

つまり分散は、パフォーマンスだけでなく安定性を客観視するツールとして大いに活用できるのです。


共分散は「戦略のヒント」をくれる

共分散は、2つの変数の動き方を示す指標でした。業務に置き換えると、それは「施策と成果の関係性を見る」ことにあたります。

まさに、マーケや営業戦略の効果を定量的に測る武器になるわけです。

例を挙げましょう:

  • 広告費と売上:共分散が正なら広告投資が効果的
  • 教育費と生産性:負の共分散なら施策のズレかも?
  • 残業時間と退職率:正なら働き方の見直しが必要

こうした「関係性の見える化」は、主観だけに頼らないロジカルな提案や判断を可能にします。


「分析の第一歩」としての価値

分散・共分散は、統計分析のなかでは比較的シンプルな部類に入りますが、それだけにビジネス分析の入り口として非常に優秀です。

ここを足掛かりにすれば、次のようなより高度な分析にも自然とつながっていきます。

  • 相関係数: 共分散を標準化して強さを判断する
  • 回帰分析: 「広告費をあと10万円増やせば売上は何万円増える?」といった予測分析
  • ポートフォリオ分析: 投資やリソース配分の最適化

これらに共通しているのが、「分散・共分散の考え方がベースになっている」という点です。つまり、今身につけた知識は、今後あらゆる分析の基礎として生きるものになります。


データを見る目を、ひとつ高める

単なる売上や広告費の数字を見るだけでは見えてこない世界が、「分散や共分散」といった分析軸をもつことで、ぐっとクリアに見えるようになります。

これは、1つ1つの施策の成果をちゃんと把握し、数字をもとに語れるビジネスパーソンになるための第一歩です。

もしあなたが、「もっと説得力のある報告や提案をしたい」と感じているなら、今回学んだ分散と共分散の使い方は、その強力な味方になってくれるはずです。


まとめ:次に進むべきステップ

  • 分散と共分散で基礎分析力UP → 実務の課題発見に有効
  • リスクや関係性を見える化することで、判断・提案が論理的に
  • 次は 相関係数・回帰分析 を学んで、予測や戦略設計へ

まずは身近なExcelから始めて、「数字を読む力」を育てていきましょう。その先には、データが導くスマートな働き方がきっと待っています。

コメント

NewsTowerをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む