Excelで外れ値を可視化する箱ひげ図の作り方

Excelで外れ値を可視化する箱ひげ図の作り方 IT
  1. 箱ひげ図でわかること(外れ値・分布・ばらつきをサクッと理解)
  2. 作る前に整える!Excelで箱ひげ図に適したデータ形式と注意点
    1. 基本は「1列=1グループ」か「1列=1変数」
    2. 「縦持ちデータ(1列に値、別列にカテゴリ)」はそのままだと迷子になりやすい
    3. 空白・文字列・ゼロの扱いで「外れ値」の見え方が変わる
    4. 単位混在(分・時間・円・千円)が一番危険
    5. 最低限の件数と、同じ条件で集めたデータかを確認する
  3. 最短手順:Excelで箱ひげ図を作成する方法(挿入→統計グラフ)
    1. 手順1:範囲選択は「見出し+数値」までまとめて
    2. 手順2:「挿入」→「統計グラフ」→「箱ひげ図」
    3. 手順3:グループの向きが違うときは「行/列の切り替え」
    4. 手順4:外れ値が出ないときのチェック(よくある原因)
    5. 手順5:タイトルだけ最低限入れて「何の分布か」を明確に
  4. 外れ値を見やすくするカスタマイズ(表示設定・軸・色・ラベル調整)
    1. 外れ値の「点」を確実に出す:系列のオプション確認
    2. 軸を整える:外れ値で“箱”が潰れる問題を回避
    3. 色で「外れ値があるグループ」を目立たせる
    4. ラベルは「全部に付けない」が正解:必要な数値だけ見せる
    5. 仕上げ:タイトルと単位を強制的に伝える
  5. 読み取りと実務活用(外れ値の扱い方、よくあるミス、報告での使い方)
    1. 外れ値は「消す前に理由をメモ」するのが基本
    2. 読み取りのコツは「外れ値の点」より「箱の位置と幅」
    3. よくあるミス:外れ値=異常と決めつける/平均で語る
    4. 報告での使い方:結論→根拠(箱ひげ図)→打ち手 の順でまとめる

箱ひげ図でわかること(外れ値・分布・ばらつきをサクッと理解)

Excelで「外れ値」を見つけたいとき、平均や最大・最小だけを眺めても、実は判断しづらいことが多いです。たとえば残業時間や売上、処理時間などは一部の“飛び値”が全体の印象を大きく変えます。そこで役に立つのが箱ひげ図。データの中心・散らばり・外れ値を、1枚でパッと可視化できます。

箱ひげ図は、ざっくり言うと次の要素で構成されます。

  • 箱(四分位範囲):データの真ん中50%が入る範囲
  • 中央値(箱の中の線):データの“ど真ん中”
  • ひげ:外れ値を除いた範囲(一般的に箱から一定の基準まで伸びる)
  • 点(外れ値):基準から外れた値として個別に表示される

この図が優れているのは、平均値では見えない「分布のクセ」が見えることです。たとえば中央値が箱の下寄りなら上側にデータが広がっていて、少数の高い値が混ざっている可能性がある。逆に箱がコンパクトなら、値が安定している(ばらつきが小さい)と判断できます。

特に実務で効くのが「比較」です。部署別の残業時間、店舗別の客単価、月別の処理件数など、カテゴリごとの箱ひげ図を並べると、

  • どのグループがばらつきが大きい
  • どこに外れ値が集中しているか
  • 平均との差ではなく典型値(中央値)で比べるとどうか

が一瞬でつかめます。20代の会社員だと、資料作りでは「結論が伝わるか」が勝負ですが、箱ひげ図は数字の説得力を保ったまま、話を早く進められるのが強みです。

もうひとつポイントは、外れ値が見つかったときに「異常だ!」で終わらせないこと。箱ひげ図はあくまで“候補”を示してくれる可視化です。外れ値が

  • 入力ミス(桁違い、単位違い)
  • 一時的な特殊要因(キャンペーン、障害対応)
  • 構造的な問題(特定工程だけ遅い、特定顧客で高単価)

のどれなのか、次の分析につなげる入口になります。次章では、箱ひげ図でズレないために、Excelで整えるべきデータ形式と注意点を押さえます。

作る前に整える!Excelで箱ひげ図に適したデータ形式と注意点

箱ひげ図は「挿入」からすぐ作れますが、元データの形がズレていると、外れ値の点が出なかったり、グループが意図と違って分かれたりします。作成前に、まずは“箱ひげ図向きの表”に整えましょう。

基本は「1列=1グループ」か「1列=1変数」

Excelの箱ひげ図は、基本的に列(もしくは行)ごとの分布を描きます。たとえば部署別の残業時間を比較したいなら、次のように部署ごとに列を分けるのが一番ラクです。

  • A列:営業部の残業時間(数値が縦に並ぶ)
  • B列:開発部の残業時間
  • C列:管理部の残業時間

列の1行目は「営業部」などのグループ名(見出し)にしておくと、グラフの凡例・軸ラベルが自動で整います。

「縦持ちデータ(1列に値、別列にカテゴリ)」はそのままだと迷子になりやすい

実務データは、日付/部署/残業時間のように「縦持ち(ロング形式)」で管理されていることが多いです。この形のまま箱ひげ図を作ると、Excelが意図どおりにカテゴリ分けしてくれず、思った比較にならないケースがあります。

おすすめは、ピボットテーブルで横持ち(ワイド形式)に変換する方法です。例:

  • 行:個人名(または日付)
  • 列:部署
  • 値:残業時間(平均ではなく「値」を並べたいので、元データの一覧が作れる形に)

難しければ、まずはフィルタで部署ごとに抽出して、列に貼り分けるだけでもOK。大事なのは比較したい単位ごとに列を分けることです。

空白・文字列・ゼロの扱いで「外れ値」の見え方が変わる

箱ひげ図は四分位数(25%・50%・75%)を使うため、欠損や誤った値が混ざると分布が崩れます。特に注意したいのは次の3つ。

  • 空白:未入力が混ざっても、計算上は除外されやすい一方、データ件数が減って歪みます(少数データだと箱が不安定)。
  • 文字列の数値:「10」が文字として入っていると、箱ひげ図の対象から外れてしまうことがあります。VALUE関数や「区切り位置」で数値化を。
  • ゼロ:本当に0なのか、欠損を0で埋めたのかで意味が真逆。後者なら外れ値以前にデータ作りのルール違反になりがちです。

単位混在(分・時間・円・千円)が一番危険

外れ値の多くは「異常」ではなく単位違いで発生します。残業時間が「2.5(時間)」と「150(分)」で混ざる、売上が「円」と「千円」で混ざる、など。箱ひげ図はそれを“外れ値っぽく”見せてしまうので、作る前に単位を統一し、見出しにも「(時間)」「(円)」のように明記しておくと、後の説明がラクになります。

最低限の件数と、同じ条件で集めたデータかを確認する

箱ひげ図は件数が少ないと形が極端になります。目安として1グループ20件以上あると安定しやすいです(少なくても10件は欲しい)。また、部署別比較なら「同じ期間」「同じルール」で取ったデータかも重要。期間が違うと、外れ値ではなく母集団の違いが原因になります。

ここまで整えられたら準備は完了です。次章では、Excelの挿入→統計グラフで最短で箱ひげ図を作る手順を、そのまま真似できる形で紹介します。

最短手順:Excelで箱ひげ図を作成する方法(挿入→統計グラフ)

データ形式が整ったら、あとはExcel標準機能で一気に作れます。ここでは「挿入」→「統計グラフ」を使った最短ルートだけに絞って手順を紹介します(Excel 2016以降のイメージ)。

手順1:範囲選択は「見出し+数値」までまとめて

まずは、箱ひげ図にしたい範囲を選択します。ポイントは1行目の見出し(例:営業部、開発部…)も含めて選ぶこと。見出しを含めると、グラフの横軸ラベルが自動でキレイに入ります。

  • OK例:A1:C31(1行目が見出し、2行目以降が数値)
  • 注意:途中に合計行や平均行など集計行が混ざっていると分布が崩れるので、含めない

手順2:「挿入」→「統計グラフ」→「箱ひげ図」

リボンの[挿入]タブを開き、[統計グラフの挿入](棒グラフや折れ線の並び付近)から[箱ひげ図]を選択します。これで箱・中央値・ひげ・外れ値(条件に該当する場合の点)が一発で出ます。

手順3:グループの向きが違うときは「行/列の切り替え」

「思ったより箱の数が多い」「部署ではなく日付がグループになってる」など、グループの切り方が逆になったら、グラフをクリックしてから次を試します。

  1. グラフ上で右クリック → [データの選択]
  2. [行/列の切り替え]を押す

箱ひげ図は列(または行)単位で1グループの扱いなので、ここがズレると「比較」が成立しません。2章で整えた「1列=1グループ」を前提に、最終調整として切り替えを覚えておくと早いです。

手順4:外れ値が出ないときのチェック(よくある原因)

「外れ値を見たいのに点が出ない」場合、異常がないケースもありますが、次の原因で“表示されていないだけ”のこともあります。

  • 数値が文字列扱いになっている(見た目は数字でもグラフ対象外になる)
  • 件数が少なすぎる(四分位が安定せず、外れ値判定が出にくい)
  • 単位混在で分布が想定外になっている(外れ値以前にデータが破綻)

まずは選択範囲の中身が「純粋な数値」になっているか、空白や不要な行が混ざっていないかを確認しましょう。

手順5:タイトルだけ最低限入れて「何の分布か」を明確に

作った直後の段階でも、最低限グラフタイトルは入れておくのがおすすめです。たとえば「部署別 残業時間(時間)箱ひげ図」のように、指標名+単位まで書くと、資料に貼った瞬間に伝わる速度が変わります。

ここまでで箱ひげ図自体は完成です。ただ、実務では「外れ値が見えるだけ」だと弱く、見やすさ(点・軸・色・ラベル)で説得力が決まります。次章では、外れ値をより目立たせて読み取れるようにするカスタマイズをまとめます。

外れ値を見やすくするカスタマイズ(表示設定・軸・色・ラベル調整)

箱ひげ図は作って終わりではなく、「外れ値がどこに・どれくらい出ているか」が一瞬で伝わる状態に整えるのが実務向きです。ここではExcel標準の範囲でできる、効き目が大きい調整だけに絞ります。

外れ値の「点」を確実に出す:系列のオプション確認

まず基本。点が見えない場合は、外れ値がないだけでなく設定で非表示になっていることがあります。

  1. 箱(系列)をクリック → 右クリック → [データ系列の書式設定]
  2. [系列のオプション][外れ値を表示] にチェック

合わせて、平均も見せたい資料なら[平均マーカーを表示]もONにすると、「平均は高いけど中央値は低い」などの説明がしやすくなります(外れ値が平均を押し上げているケースの説得力が増えます)。

軸を整える:外れ値で“箱”が潰れる問題を回避

外れ値が極端に大きい(または小さい)と、縦軸が引っ張られて箱がペタンコになりがちです。これだと「ばらつき」の比較が死にます。

  • 縦軸を右クリック → [軸の書式設定]
  • 最小値/最大値固定にして、比較しやすいレンジに寄せる

ただしレンジを切りすぎると外れ値自体が見切れるので、“箱が読める”+“外れ値が画面内に残る”落とし所がベター。報告用なら、必要に応じて「外れ値が大きいので軸は○○で固定」と一言添えると誤解を防げます。

色で「外れ値があるグループ」を目立たせる

20代の会社員が上司・他部署に見せる資料では、見た瞬間に“注目ポイント”が分かる配色が強いです。

  • 通常グループ:グレーや薄い青など控えめ
  • 外れ値が多い/重要なグループ:濃い色で強調

操作は、強調したい箱を2回クリック(系列→要素の選択)→右クリックで塗りつぶし変更。全体を派手にすると比較しづらいので、「他は薄く、主役だけ濃く」が鉄板です。

ラベルは「全部に付けない」が正解:必要な数値だけ見せる

箱ひげ図は情報量が多いので、データラベルを全部に付けると一気に読めなくなります。おすすめは次のどちらか。

  • 外れ値だけに値ラベルを付ける(「どの程度外れてるか」が即わかる)
  • 中央値だけを強調する(典型値で比較したい資料向き)

外れ値にラベルを付ける場合は、外れ値の点をクリックして選択→右クリック→[データ ラベルの追加]。ラベル位置は重なりやすいので、右側/上側に逃がすと読みやすいです。

仕上げ:タイトルと単位を強制的に伝える

最後に、見出しだけで誤読を防ぎます。グラフタイトルは「何を」「どの単位で」まで入れるのが最低ライン。

  • 例:部署別 残業時間(時間)
  • 例:店舗別 客単価(円)

このひと手間で、「分?時間?」「円?千円?」みたいな無駄な確認が減り、外れ値の議論にすぐ入れます。

読み取りと実務活用(外れ値の扱い方、よくあるミス、報告での使い方)

箱ひげ図を作って外れ値が見えたら、次は「どう扱うか」が勝負です。実務では外れ値=悪ではなく、ミス/一時要因/構造的な差のどれかを切り分けて、行動につなげるのが目的になります。

外れ値は「消す前に理由をメモ」するのが基本

外れ値を見つけたとき、いきなり削除すると後で炎上しがちです。まずは対象データを行レベルで特定し、理由を仮説でいいのでメモしましょう。

  • 入力ミス:桁違い、単位違い、転記ミス(例:2.5時間のつもりが150分)
  • 一時的な特殊要因:障害対応、月末締め、キャンペーン、突発の依頼
  • 構造的な差:特定顧客だけ重い、特定工程がボトルネック、属人化

「除外する」のは、基本的に入力ミスと確定できたものだけ。特殊要因や構造的な差は、むしろ改善ネタなので残して議論した方が価値が出ます。

読み取りのコツは「外れ値の点」より「箱の位置と幅」

外れ値に目が行きがちですが、報告で刺さるのは分布の差です。

  • 中央値の比較:典型的な水準がどこか(平均より誤解が少ない)
  • 箱が大きい:ばらつきが大きく、運用が安定していない可能性
  • ひげが片側に長い:遅延・高騰が片側に偏って起きているサイン

たとえば「A部署は中央値は低いが、上側のひげと外れ値が多い」なら、普段は回っているが詰まる日が定期的にある、という説明ができます。

よくあるミス:外れ値=異常と決めつける/平均で語る

箱ひげ図でありがちなミスは次の2つです。

  • 外れ値を“犯人探し”に使う:個人攻撃に見えると協力が得られません。まずは要因(業務・仕組み)を疑う。
  • 平均だけで結論を出す:外れ値が平均を押し上げ、実態とズレることがあります。箱ひげ図があるなら、説明の主語は中央値+ばらつきに置くのが堅いです。

報告での使い方:結論→根拠(箱ひげ図)→打ち手 の順でまとめる

スライドや社内報告では、箱ひげ図を「貼る」だけだと読み手が迷子になります。おすすめはこの型です。

  1. 結論:例「開発部は残業のばらつきが大きい」
  2. 根拠:例「箱が大きく、上側のひげと外れ値が目立つ(中央値は他部署と同程度)」
  3. 打ち手:例「外れ値日の案件を3件抽出し、発生要因(障害/リリース/顧客対応)を分類」

さらに一言、前提(期間・単位・除外ルール)も添えると信頼度が上がります。例:「対象:2025年10〜12月、単位:時間、入力ミス確定分のみ除外」。これだけで「その外れ値って何?」の無駄な往復が減ります。

箱ひげ図は、外れ値を見つけるツールというより“議論を前に進める図”です。点を消すか残すかではなく、分布の差を言語化して、次のアクションに落とし込みましょう。

コメント

NewsTowerをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む