Excelで標準偏差を使ったリスク分析の基本

Excelで標準偏差を使ったリスク分析の基本 IT

標準偏差って何?Excelで「リスク」を数字にする考え方

仕事で「この数字、どれくらい信用できる?」「見込みとズレる可能性は?」と聞かれたとき、感覚だけで答えるのは危険です。そこで役に立つのが標準偏差。ざっくり言うと、データの散らばり(ブレ)の大きさを表す指標です。

たとえば、同じ「平均10」のデータでも、次の2つでは意味が変わります。

  • A:毎回ほぼ10(9.8〜10.2)
  • B:ばらつく(5〜15)

平均が同じでも、Bの方が結果が読みにくく、計画が崩れる確率も上がります。ここでいう「読みにくさ」「ズレる可能性」こそが、ビジネスでいうリスクの一部です。

Excelで標準偏差を扱えるようになると、次のような「リスクの数値化」ができます。

  • 売上のブレ:月次売上が安定しているか(予算達成の読みやすさ)
  • 工数のブレ:作業時間が安定しているか(納期遅延リスク)
  • 顧客対応のブレ:問い合わせ件数が急増しやすいか(人員配置リスク)

ポイントは、標準偏差は「良い/悪い」を直接示す数字ではなく、ブレの量を示す数字だということです。ブレが大きい=必ず悪い、ではありません。たとえば、攻めの施策(新規広告、キャンペーン)では売上が大きく動く分、標準偏差も大きくなりがちです。一方、運用が成熟した定常業務では標準偏差が小さい方が望ましいことが多い。つまり標準偏差は、状況に応じた判断材料になります。

もう一つ、実務での捉え方として重要なのが、標準偏差は「平均との差の平均」ではない点です。平均との差の単純平均はプラスとマイナスで相殺されて0になってしまうため、ブレが測れません。そこで、差を二乗して(マイナスを消して)平均し、最後に平方根を取ることで、元の単位(円、時間、件など)に戻したものが標準偏差です。

難しく見えますが、使い方はシンプルです。平均=中心標準偏差=ブレ幅。この2つがそろうと、「だいたいこの範囲に収まりそう」という見立てが作れます。たとえば、データがある程度きれいに分布しているなら、目安として

  • 平均±1σ(標準偏差):多くがこの範囲に入る
  • 平均±2σ:かなり広い範囲までカバー

という感覚で、「最悪どこまで振れるか」の会話がしやすくなります(※分布の形によって精度は変わります)。

ここまでの結論は、Excelで標準偏差を使うことは、単なる統計の勉強ではなく、リスクを“言語化”ではなく“数値化”する武器を持つこと。次章では、実際にExcelで平均・分散・標準偏差を計算する手順(STDEV.P/STDEV.S)を押さえて、すぐ手元のデータで試せる状態にします。

まずはここから|平均・分散・標準偏差をExcelで計算する手順(STDEV.P/STDEV.S)

標準偏差のイメージがつかめたら、次はExcelで計算できる状態にしましょう。現場で使うときは、だいたい「平均(中心)」「分散(ブレの大きさの元)」「標準偏差(ブレ幅)」の3点セットで押さえると便利です。

0) まずはデータを縦に並べる

例として、A2:A13に「月次売上」や「作業時間」などのデータを入れます(数値は何でもOK)。以降、範囲はA2:A13として説明します。

1) 平均:=AVERAGE(範囲)

平均は分布の「中心」です。セルに次を入力します。

=AVERAGE(A2:A13)

平均はこの後の計算(分散・標準偏差)や、リスク会話の基準点になるので、まず最初に作っておくのがコツです。

2) 分散:=VAR.P/=VAR.S(標準偏差の“平方”)

分散は「平均との差を二乗して平均したもの」で、単位が元データの二乗になります(円なら“円^2”)。“ブレの強さ”は分かりますが、そのままだと直感的に読みにくいので、実務では標準偏差の方をよく使います。

  • 母集団の分散=VAR.P(A2:A13)
  • 標本の分散=VAR.S(A2:A13)

3) 標準偏差:=STDEV.P/=STDEV.S(実務で一番使う)

標準偏差は分散の平方根なので、単位が元データに戻ります(円、時間、件など)。「平均±◯」の形でブレ幅をそのまま扱えるのが強みです。

  • 母集団の標準偏差=STDEV.P(A2:A13)
  • 標本の標準偏差=STDEV.S(A2:A13)

STDEV.PとSTDEV.S、どっちを使う?判断基準

ここで迷いがちですが、結論はシンプルです。

  • STDEV.P(母集団):データが「全数」だと言い切れるとき(例:昨年12か月分を“昨年の実績全体”として評価する)
  • STDEV.S(標本):一部データから全体を推定するとき(例:数週間の工数ログから、今後の工数ブレを見積もる)

実務では「手元のデータは全体の一部」であることが多いので、迷ったらSTDEV.Sを選ぶケースが多めです。とはいえ、月次レポートなどで「この期間の実績のブレ」を言いたいだけなら、STDEV.Pでも問題になりにくい場面もあります。重要なのは、どちらを使ったかを自分で説明できることです。

最短で形にする:平均と標準偏差だけでもOK

分散は「標準偏差の裏側の値」なので、まずは

  • 平均:=AVERAGE(A2:A13)
  • 標準偏差:=STDEV.S(A2:A13)(またはSTDEV.P

の2つを並べて出すだけで、リスクの会話は一気に進みます。次章では、この標準偏差を使って「ブレ幅」をどう読み解くか(変動係数や平均との差も含めて)を実務目線で整理します。

リスク分析の基本|標準偏差で「ブレ幅」を読み解く(変動係数・平均との差もセットで)

2章で平均と標準偏差を出せるようになったら、次は「その数字をどう読むか」です。標準偏差は“ブレの量”を示しますが、実務では①ブレ幅の目安(レンジ)②相対的なブレ(比較)、そして③どの日(どの月)が異常寄りかまでセットで見ると、リスク分析として一気に使いやすくなります。

1) まずは「平均±1σ」でブレ幅をレンジ化する

基本はシンプルで、平均を中心に標準偏差ぶん上下に振れると考えます。Excelで平均がB2、標準偏差がB3にあるなら、次のように「想定レンジ」を作れます。

下限(-1σ):=B2-B3
上限(+1σ):=B2+B3

データの分布が極端に歪んでいない前提なら、「だいたいこの範囲に収まりやすい」という会話ができます。さらに慎重に見るなら、

下限(-2σ):=B2-2*B3
上限(+2σ):=B2+2*B3

のように±2σまで広げて「悪いほうに振れたケース」を想定します。工数なら「納期遅延の可能性」、売上なら「予算未達の可能性」を、感覚ではなく範囲で語れるようになります。

2) 「標準偏差が大きい=危険」とは限らない。比較には変動係数(CV)

標準偏差は元データと同じ単位で直感的ですが、弱点があります。それは平均の大きさが違うデータ同士を比較しにくいこと。

例:新規事業(平均が小さい)と既存事業(平均が大きい)を比べると、既存事業の方が標準偏差が大きく見えても、実は相対的には安定していることがあります。

そこで使うのが変動係数(Coefficient of Variation:CV)です。計算は簡単で、

変動係数(CV):= 標準偏差 / 平均

Excelなら、平均がB2、標準偏差がB3の場合:

=B3/B2

表示形式を「パーセンテージ」にすると読みやすくなります。CVは「平均に対して何%ブレるか」を表すので、部署別・商材別・施策別など、スケールが違うものを横並びに比較できます。

  • CVが小さい:相対的に安定(読みやすい、計画が立てやすい)
  • CVが大きい:相対的に不安定(振れが大きく、バッファ設計が必要)

「標準偏差(絶対のブレ)」と「変動係数(相対のブレ)」を併記すると、上司や関係者への説明が通りやすくなります。

3) 「平均との差」を出して、リスクの原因候補をあぶり出す

レンジやCVで全体像を押さえたら、次はどのデータがブレを作っているかを見に行きます。そのために各データの平均との差を列で作ります。

たとえばA列にデータ(A2:A13)、平均がB2にあるなら、B列に:

=A2-$B$2

として下までコピー。これで

  • プラス:平均より上振れ(売上なら好調、工数なら超過)
  • マイナス:平均より下振れ(売上なら不調、工数なら短縮)

が一発で分かります。さらに、ブレの大きさだけ見たい場合は絶対値も便利です。

=ABS(A2-$B$2)

平均との差(またはABS)を並べると、「特定の月だけ異常にズレている」「この案件が工数を押し上げている」など、原因候補を掘るための当たりがつきます。標準偏差は“結果のブレ”を教えてくれますが、平均との差は“ブレの中身”に近づくための入口になります。

ここまでできると、

  • 平均:通常の水準(中心)
  • 標準偏差:ブレ幅(絶対のリスク)
  • 変動係数:比較できるブレ(相対のリスク)
  • 平均との差:ブレを作っている箇所(原因候補)

という形で、リスクを「数字→読み解き→次の打ち手」につなげられます。次章では、これらをグラフや条件付き書式、ヒストグラムで見える化して、会議で伝わる形に整えていきます。

実務で使える見せ方|グラフ・条件付き書式・ヒストグラムでリスクを可視化する

標準偏差やCV、平均との差まで作れたら、次は「一目で伝わる形」にします。数字の表だけだと、会議では「で、結局どれが危ないの?」で止まりがち。ここでは、Excelでサクッとできて、上司にも刺さりやすい3つの見せ方を紹介します。

1) 折れ線+「平均線」「±1σ(±2σ)帯」で“いつ危ないか”を見せる

月次売上や工数のような時系列は、折れ線グラフが最短です。さらに平均とレンジ(±1σ、余裕を見るなら±2σ)を同じグラフに重ねると、ブレの大きさと異常の気配が一気に伝わります。

  • データ列:実績(A列)
  • 別列で「平均」を全行に同じ値で入れる(例:=$B$2を下までコピー)
  • 別列で「上限(+1σ)」:=$B$2+$B$3
  • 別列で「下限(-1σ)」:=$B$2-$B$3

あとは4列まとめて選択し、挿入 → 折れ線。実績が上限・下限を突き抜けた月(週)は、「通常運転ではない」可能性が高いので、原因深掘りの優先順位がつきます。

2) 条件付き書式で「異常っぽい行」を自動で赤くする

表で強いのは、条件付き書式です。ポイントは「平均との差」や「Zスコア(標準化)」を使って、赤くする根拠を数字で持つこと。

たとえば、A列が実績、平均がB2、標準偏差がB3なら、C列にZスコアを作れます。

=(A2-$B$2)/$B$3

このC列に対して条件付き書式で、

  • |Z| >= 2:かなり要注意(赤)
  • |Z| >= 1:注意(黄)

のように色分けすると、「感覚で怪しい」ではなく“統一ルールで怪しい”に変わります。会議で突っ込まれても「平均との差が標準偏差2個分以上です」で説明が通ります。

3) ヒストグラムで「ブレ方のクセ(偏り)」を見抜く

標準偏差は“ブレの量”ですが、実務ではブレ方の形も重要です。そこで使うのがヒストグラム(度数分布)。

Excelならデータ範囲を選択して、挿入 → 統計グラフ → ヒストグラムでOK。棒の山が左右どちらかに寄っているなら、平均よりも中央値の方が実態に合うケースもありますし、右に長い尾が出るなら「たまに大事故(工数爆増)が起きる」タイプのリスクかもしれません。

ヒストグラムは特に、同じ標準偏差でも性格が違うことを示すのに効きます。例えば「普段は安定だが、たまに極端に悪化」なのか、「常にほどほどにバラつく」のか。打ち手(バッファ設計、アラート設計、外れ値対策)が変わります。

まとめると、折れ線+±σで“いつ”、条件付き書式で“どれ”、ヒストグラムで“どんなクセか”。この3点で、標準偏差の分析は「計算できた」から「意思決定に使える」に進みます。次章では、外れ値やデータ数、分布の前提など、ハマりやすい落とし穴と改善アプローチを整理します。

落とし穴と次の一手|外れ値・データ数・正規分布の前提、Excelでの改善アプローチ

標準偏差は便利ですが、使い方を間違えると「それっぽい数字」で誤判断しがちです。ここでは実務でハマりやすい落とし穴を3つに分けて、Excelで取れる改善アプローチまでつなげます。

1) 外れ値(たまたまの事故)が標準偏差を“盛る”

一発のトラブル(月末障害で工数が爆増、キャンペーンで売上が跳ねた等)が入ると、標準偏差は一気に大きくなります。その結果「普段から危ない」と見えてしまうのが罠。まずは外れ値候補をZスコアで機械的にあぶり出しましょう。

=(A2-$B$2)/$B$3

目安として|Z|>=2は要確認。ここで大事なのは「消す」より先に理由をラベル付けすることです(例:障害対応、特需、締め処理)。分析用には、通常運転だけの標準偏差(外れ値除外)も併記すると説明が通ります。

  • 通常運転のみ:=STDEV.S(通常データ範囲)
  • 全期間(事故込み):=STDEV.S(全データ範囲)

2) データ数が少ないと、ブレの推定が不安定

3〜5件のデータで標準偏差を出すと、数値がブレやすく「結論がころころ変わる」状態になります。最低限、件数(N)を一緒に出しておくと誠実です。

=COUNT(A2:A13)

また、全体推定ならSTDEV.Sを使う(2章)前提で、期間を伸ばす・粒度をそろえる(週次と月次を混ぜない)など、データ設計を先に整えるのが次の一手です。どうしても短期しかないなら、「暫定」「参考値」を明記して運用しましょう。

3) 「正規分布っぽい」前提を置きすぎない

平均±1σ、±2σは便利な目安ですが、データが歪んでいる(右に長い尾、下限が0で天井がない等)と精度が落ちます。特に売上・工数はゼロ未満にならないので、分布が非対称になりがちです。

改善アプローチとしては、まず4章のヒストグラムで形を確認し、歪みが強いなら中央値四分位もセットで出すのが安全です。

  • 中央値:=MEDIAN(A2:A13)
  • 四分位(例:第1四分位):=QUARTILE.INC(A2:A13,1)
  • 四分位(例:第3四分位):=QUARTILE.INC(A2:A13,3)

「平均±σ」だけで語らず、中央値+IQR(Q3-Q1)も見ると、“たまに起きる大ブレ”に引っ張られた判断を避けられます。

結論として、標準偏差は万能ではなく、前提つきの武器です。外れ値は「理由を分けて併記」、データ数は「Nを出して慎重に」、分布は「形を見て中央値・四分位も併用」。この3点を押さえるだけで、Excelのリスク分析は一段“実務で使える精度”に上がります。

コメント

NewsTowerをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む