まず押さえるべき「平均・中央値・最頻値」の違い(1分でわかる基礎)
Excelでデータを集計するとき、「とりあえず平均」を出して終わり……になりがちです。でも、平均は万能ではありません。数字の性質によっては、平均が“実態を誤解させる値”になることもあります。そこでまず、平均・中央値・最頻値がそれぞれ何を表していて、どんな場面でズレやすいのかを1分で押さえましょう。
平均(Average)は、合計を件数で割った値です。たとえば売上や工数など、全体の規模感を一発で掴めるのが強み。一方で弱点は明確で、極端に大きい/小さい値(外れ値)に強く引っ張られること。たった1件の異常値で「全体的に多い(少ない)」と見えてしまうことがあります。
中央値(Median)は、データを小さい順に並べたときの真ん中の値です(件数が偶数なら中央2つの平均)。特徴は、外れ値の影響を受けにくいこと。つまり「典型的な一人」「ふつうの案件」「一般的な水準」を表したいときに強い指標です。平均よりも“現場感”に近い数字になりやすいので、給与、残業時間、リードタイムなど、偏りが出やすいデータで活躍します。
最頻値(Mode)は、最も多く出現する値です。これは「いちばん多い選択」「よくある値」を示します。アンケートの回答(例:満足度1〜5)や、商品サイズ、問い合わせカテゴリなど、同じ値が何度も出るデータと相性が良いです。逆に、売上金額のように値が細かく散らばって同じ数字がほぼ出ないデータだと、最頻値は意味を持ちにくい(またはそもそも存在しない)こともあります。
感覚を掴むために、極端な例を見てみましょう。
- 残業時間(5人):10, 12, 12, 13, 80
このとき、
- 平均:25.4時間(80が強すぎて「みんな25時間くらい」に見える)
- 中央値:12時間(“真ん中”なので実態に近い)
- 最頻値:12時間(いちばん多いのは12)
同じデータでも、どの指標を使うかで「伝わる印象」が変わります。平均は“全体の総量の割り算”、中央値は“ふつうの代表”、最頻値は“いちばん多いパターン”。この3つを押さえるだけで、Excel集計の説得力が一段上がります。
次の章では、ここから一歩進めて「結局どれを使うべきか?」を外れ値・分布・目的で判断する基準を整理します。
結論:どれを使うべき?使い分けの判断基準(外れ値・分布・目的)
平均・中央値・最頻値の違いがわかったら、次は実務で迷いがちな「結局どれを採用する?」の判断です。結論はシンプルで、外れ値の有無、分布(ばらつき・偏り)、伝えたい目的の3つで決めるのが最短ルートです。
判断基準①:外れ値があるなら「中央値」寄り
1章の残業時間の例のように、1件の異常値が混ざると平均は一気にズレます。たとえば、たまたま深夜対応が続いた社員が1人いるだけで「部署は平均25時間残業」と見えてしまい、現場感とズレることも。
この手のデータでは中央値が安定します。なぜなら中央値は“真ん中”なので、端にある外れ値の影響を受けにくいからです。「ふつうはどれくらい?」を説明したいときは、まず中央値を候補に入れてください。
判断基準②:分布が左右対称に近いなら「平均」が強い
データが極端に偏っておらず、山が真ん中にある(左右が似た形)なら、平均は非常に便利です。平均は全体を一つの数字で要約でき、総量ベースの比較にも向きます。
- 例:日次の処理件数、一定に近い作業時間、品質スコアなど
ポイントは、平均は「代表値」というより“全体のバランス点”だということ。分布が素直なら、説明もしやすく、納得も得やすいです。
判断基準③:「一番よくある」を言いたいなら「最頻値」
最頻値は、同じ値が繰り返し出るデータで真価を発揮します。たとえばアンケート(1〜5)や問い合わせカテゴリ、購入プラン(A/B/C)のように、選択肢が限られているケースです。
逆に、売上金額のように細かい数値がバラけるデータだと「同じ金額が一番多い」は起きにくく、最頻値が空振りしがちです。値の種類が多すぎるデータには向かないと覚えておくと失敗しません。
まとめ:迷ったら「目的」→「外れ値」→「分布」で決める
実務での意思決定は、次の順に考えるとブレません。
- 目的:何を伝えたい?(総量感/ふつう/一番多い)
- 外れ値:異常に大きい/小さい値は混ざってる?
- 分布:偏ってる?山が複数ある?
ざっくり結論を置くなら、
- 経営層に「全体の規模感」を見せたい → 平均
- 現場に「実態(ふつうの水準)」を伝えたい → 中央値
- ユーザー傾向として「最も多い選択」を示したい → 最頻値
この判断軸を持っておけば、「平均で出したら突っ込まれた」「現場の体感と違う」といった事故が減ります。次章では、ここで決めた指標をExcelでどう計算するか(AVERAGE/MEDIAN/MODE)を式レベルでまとめます。
Excelでの求め方まとめ(AVERAGE/MEDIAN/MODE.SNGL・MODE.MULT)
2章で「どの指標を使うべきか」を決めたら、あとはExcelで正しく計算するだけです。この章では、平均・中央値・最頻値を関数名と使いどころで整理します。前提として、データが A2:A101 に入っている想定で説明します。
平均:=AVERAGE(全体の“規模感”を一発で)
平均はもっとも定番で、式もシンプルです。
=AVERAGE(A2:A101)
注意点は、平均は外れ値に引っ張られやすいこと(これは1〜2章で触れた通り)。なお、空白セルは無視されますが、0は「0」として計算されます。未入力を0で埋めている表だと、平均が意図せず下がるので要注意です。
中央値:=MEDIAN(外れ値に強い“ふつう”)
中央値は、現場感に近い「典型値」を出したいときの第一候補。式はこちら。
=MEDIAN(A2:A101)
こちらも空白は無視されます。件数が偶数の場合は「中央2つの平均」になりますが、そこはExcelが自動で処理してくれます。
最頻値(1つだけ欲しい):=MODE.SNGL(いちばん多い値)
最頻値を「代表として1つ」出すなら、基本はこれです。
=MODE.SNGL(A2:A101)
ただし実務でつまずきやすいのが、最頻値が存在しないケース。たとえば全ての数値が1回ずつしか出ないときは、#N/A が返ります(エラーではなく「該当なし」の意味)。見た目を整えるなら、次のようにします。
=IFNA(MODE.SNGL(A2:A101),"最頻値なし")
最頻値(複数あるかも):=MODE.MULT(同率1位を全部)
アンケートのように「同じ回数で並ぶ」ことがあるデータでは、最頻値が複数になる場合があります。そのときは MODE.MULT を使います。
=MODE.MULT(A2:A101)
返り値は複数になり得るので、出力先を縦(または横)に確保しておくのがコツです。Microsoft 365などの動的配列に対応したExcelなら、1セルに入れるだけで下方向に“スピル”して候補が並びます。旧バージョンの場合は配列数式(Ctrl+Shift+Enter)が必要になることがあります。
どれを使う関数か迷ったら(この章の結論)
- 平均を出す →
AVERAGE - 中央値を出す →
MEDIAN - 最頻値を1つに絞る →
MODE.SNGL(必要ならIFNAで保険) - 最頻値が複数あり得る →
MODE.MULT
次の章では、給与・残業時間・売上・アンケート集計など、実務でよくあるケース別に「結局どれを使うのが安全か」を具体例で紹介します。
実務でよくあるケース別おすすめ(給与・残業時間・売上・アンケート集計)
ここからは「で、実務ではどれを出せば怒られないの?」に答えるパートです。ポイントは、同じデータでも“誰に何を伝えるか”で正解が変わること。給与・残業・売上・アンケートは、代表値選びで印象が大きく変わりやすい定番4テーマなので、型で覚えておくと集計が速くなります。
ケース①:給与(年収・月給)→基本は「中央値」
給与は一部の高給(役職者・専門職)で上に伸びやすく、平均が実態より高く見えがちです。メンバー向けに「うちの部署の一般的な水準」を示すなら、まずは中央値が安全です。
- 社員の体感に近い水準を出したい → 中央値
- 人件費の規模感・予算感を語りたい → 平均(ただし外れ値の説明を添える)
実務の落とし穴は、平均だけを貼って「思ったより高い/低い」と炎上すること。中央値+平均をセットにすると、納得感が一気に上がります。
ケース②:残業時間→「中央値」+(参考で)平均
残業時間はトラブル対応や繁忙期で、一部の人が突出しやすいデータです。部署の働き方を説明したいなら「ふつうは何時間?」を示せる中央値が鉄板。
- 実態(みんなの標準)を示す → 中央値
- 総労働時間の負荷を見たい → 平均
たとえば、中央値12時間でも平均25時間なら「少数の長時間残業が全体負荷を押し上げている」と読めます。ここまで言語化できると、集計が改善につながる資料になります。
ケース③:売上(取引額・客単価)→目的で分ける(平均が万能ではない)
売上は「大口1件」で分布が歪みがち。にもかかわらず、平均だけを出すと“普段の取引”の感覚とズレることがあります。
- 全体の規模感(月次売上の勢い)→ 平均(または合計も併記)
- 通常案件の単価感(営業の肌感に合わせる)→ 中央値
さらに実務あるあるとして、売上金額は値が細かく散らばるので、最頻値は「そもそも出ない(#N/A)」ことが多いです。売上で最頻値を使うより、単価を「価格帯(例:1万刻み)」に丸めてから最頻帯を見るほうが、傾向把握としては有効です。
ケース④:アンケート集計(1〜5段階、選択式)→「最頻値」+平均/中央値
満足度(1〜5)や選択式の質問は、同じ数字が何度も繰り返されるため最頻値が効きます。「一番多い意見」を1行で言えるからです。
- 最も多い回答を示したい → 最頻値(MODE.SNGL / MODE.MULT)
- 全体の傾向を滑らかに見たい → 平均(スコアとして扱う)
- 極端な回答に引っ張られたくない → 中央値
使い方のコツは、「最頻値=結論」「平均/中央値=補足」の構図にすること。たとえば「最頻値は4(満足寄り)が最多。ただし平均は3.6で、一定数の不満も混在」と書けると、読み手が状況を誤解しません。
ここまでのケース別おすすめを押さえれば、代表値選びで迷う時間が減り、集計の説得力も上がります。次章では最後に、外れ値・欠損・見せ方で事故らないためのチェックポイントをまとめます。
失敗しないためのチェックポイント(データの偏り・外れ値・欠損・見せ方)
平均・中央値・最頻値を使い分けても、最後にコケやすいのが「データの状態チェック」と「見せ方」です。ここを雑にすると、数字は合っているのに「それ、実態と違わない?」と突っ込まれます。集計前に次の4点だけ確認しておけば、代表値まわりの事故はかなり減ります。
チェック①:分布の偏り(“片側に伸びてないか”)を先に見る
代表値を出す前に、まずヒストグラムや並べ替えで分布感を掴みましょう。右に長い(高い値が少数だけある)なら平均は上振れし、左に長いなら下振れします。
- 偏りが強い → 中央値を主役にする
- 山が2つ以上(例:新人とベテランで二極化)→ 平均1本で語らず、層別(部署/年代/商材)してから代表値を出す
「全体の平均は〜」が危ないのは、たいてい混ざってはいけない集団が混ざっているのが原因です。
チェック②:外れ値は“消す前に理由を確認”する
外れ値があると平均が壊れます。ただし、外れ値を見つけた瞬間に削除すると、今度は恣意的(都合の良い集計)に見えがちです。
- 入力ミス(桁違い、単位違い、マイナスなど)→ 修正/除外してOK
- 正しい異常(大口案件、障害対応で残業が突出)→ 消さずに、中央値+平均を併記して「一部が押し上げている」と説明
実務では「外れ値をどう扱ったか」を1行添えるだけで、納得感が段違いになります。
チェック③:欠損(空白)と0を同じにしない
Excelでは空白は無視されやすい一方、0は0として計算されます。ここを混同すると、平均・中央値が簡単に歪みます。
- 未回答/未集計(空白)なのに0で埋めている → 平均が不自然に下がる
- 「0件」が意味を持つデータ(例:クレーム0件)→ 0は0として残すべき
迷ったら、空白=不明、0=ゼロだったと定義して、表の作り方を揃えましょう。集計前に「この0は本当にゼロ?」を確認するだけでミスが減ります。
チェック④:数字は“1つだけ”で断言しない(見せ方の型)
代表値は便利ですが、1個の数字に要約した瞬間に情報が落ちます。おすすめは次の見せ方です。
- 中央値(実態)+平均(負荷/規模)をセットで書く
- アンケートは最頻値(結論)+平均/中央値(補足)の並びにする
- 可能なら件数(n)も添える(例:「n=28」)
さらに一段プロっぽくするなら、四分位(25%/50%/75%)や「最小〜最大」を1行足すと、「一部だけが高い」などの誤解が起きにくくなります。
平均・中央値・最頻値は、正しく使えば説得力が上がり、雑に使うと一気に信用を落とします。偏り→外れ値→欠損→見せ方の順にチェックしてから数値を出す。これだけで、Excel集計の失敗はかなり防げます。


コメント