1章:回帰分析で「売上予測」ができる理由(相関と因果の違いも押さえる)
「来月の売上、どれくらいになりそう?」と聞かれて、感覚だけで答えるのは怖い。そこで役立つのが回帰分析です。回帰分析は、過去データから売上(目的変数)に影響しそうな要因(説明変数)との関係を数式で表し、同じ条件を入れたときの売上を“推定”できます。Excelでできるのも強みで、現場の手元で試算→改善のサイクルを回せます。
考え方はシンプルです。たとえば、売上が「広告費」と一緒に増減していそうなら、
売上 =(係数)×広告費 +(切片)
のような式で関係を近似します。係数が「広告費が1増えると売上がどれくらい増えるか」の目安、切片は「広告費が0でも出る売上」を表します(実務では“基礎売上”のイメージ)。この式に来月の広告費を入れれば、来月の売上が予測できます。さらに説明変数を増やせば、売上=広告費+値引き率+来店者数…のように現実に近づけることも可能です。
ただし、ここで絶対に押さえたいのが相関と因果の違いです。
- 相関:一緒に動く(広告費が増える月は売上も増える、など)
- 因果:原因→結果になっている(広告費を増やしたから売上が増えた)
回帰分析は基本的に「相関」を数式化する手法です。相関があるからといって因果とは限りません。たとえば「アイスの売上」と「ビールの売上」は相関しやすいですが、原因は“気温”かもしれません。もし気温を入れずに予測すると、「アイスが売れたからビールが売れる」みたいな誤解を生み、施策判断を誤るリスクがあります。
つまり、回帰分析で売上予測を当てにいくコツは、式を作る前に『売上が動く理由』を業務目線で仮説化すること。広告費、単価、客数、季節性(曜日・月・繁忙期)、キャンペーン、在庫、Web流入など、「売上のドライバー」を洗い出し、説明変数として入れる候補を決めます。回帰分析は“魔法の自動予測”ではなく、仮説を数字で検証して予測に落とし込む道具です。
この前提さえ押さえておけば、Excelでも「説明できる予測」が作れます。次章では、予測精度を左右するデータ準備(項目選び・欠損・外れ値)を実務向けに整理します。
2章:予測の精度が決まる!Excelに入れるデータ準備(項目選び・欠損・外れ値)
回帰分析は「式を作る作業」よりも、その前のデータ準備で精度の8割が決まると言っても過言ではありません。ここで雑にやると、どんなにExcelで綺麗に回しても「それっぽいけど当たらない予測」になります。ポイントは①項目選び(説明変数)②欠損の扱い③外れ値の扱いです。
①項目選び:売上の“ドライバー”だけを入れる
まずは列(項目)を整えます。基本形は1行=1期間(例:1日/1週/1か月)、列=売上(目的変数)+要因(説明変数)です。期間粒度は重要で、月次売上を予測したいなら月次に揃えるのが原則(週次データを無理に混ぜない)。
説明変数は「売上に効いていそう」だけでなく、予測時点で事前に分かるものを優先します。例えば来月の売上を当てたいのに、来月が終わらないと確定しない「来月の来店者数」を入れると、当たって見えるだけのズルいモデルになります。
- 入れやすい例(事前に計画・取得できる):広告費、値引き率、営業日数、キャンペーン有無、価格、在庫、配信数、曜日ダミー・月ダミー(季節性)
- 注意が必要な例(結果に近い・事後に確定):アクセス数、来店者数、問い合わせ数(使うなら「予測時点で分かる見込み値」や「前週までの値」などに設計)
また、説明変数を増やしすぎると現場Excelでは管理しづらく、過去には合うのに未来に弱い(過学習)方向へ寄りがちです。はじめは3〜6個くらいからスタートし、精度と運用のバランスを取りましょう。
②欠損:空白は“情報”ではなく“エラーの種”
Excelの空白や「-」は、回帰分析にかけると行ごと落ちる、または意図しない扱いになりやすいです。まずは欠損の理由を分けます。
- 未計測:単純に取れていない(計測ルール/集計の仕組みを見直す)
- 存在しない:キャンペーン未実施など(この場合は0が自然)
- 欠番:データ抜け(その期間の行を丸ごと再作成 or 近い期間から補完)
実務でやりがちなのが「とりあえず0で埋める」。未計測を0にすると、“その要因がゼロだった”と誤解され、係数が歪みます。迷ったら、まずは欠損のある行を除外して試算→影響が大きいなら補完方法を検討、の順が安全です(除外でデータが減りすぎる場合は、平均・中央値・前月値などの補完をルール化)。
③外れ値:現場の“例外月”をどう扱うか
回帰分析は、極端な値に引っ張られます。例えば「一度だけ大型案件が入った月」「システム障害で販売停止した週」などが混ざると、その1点のせいで係数が不自然になります。外れ値は削除が正義ではなく、“原因が説明変数で表現できるか”で判断します。
- 原因が説明できる:大型キャンペーン、値上げ、店舗増、広告出稿増など → その要因を列に追加(ダミー変数:実施=1/未実施=0)
- 偶発・再現不能:災害、障害、イレギュラーな一括計上 → その期間は除外、または「異常フラグ」を入れて切り分け
Excel上ではまず散布図で「売上 vs 各説明変数」を見て、明らかに飛んでいる点がないか確認します。次に、売上や主要変数にフィルターをかけ、上位/下位が“何が起きた数字か”をメモしておくと、3章以降の分析が一気に楽になります。
ここまで整えると、回帰分析の結果が「それっぽい数字」ではなく、業務の言葉に翻訳できる数字になります。次章では、このデータを使ってExcelで回帰分析を回す方法(分析ツールと関数)を、最短ルートで進めます。
3章:Excelで回帰分析を実行する2つの方法(分析ツール/関数でサクッと)
データが整ったら、いよいよExcelで回帰分析を回します。方法は大きく2つ。①分析ツール(回帰)でまとめて出す、②関数で必要な数字だけサクッと使うです。現場では「まず分析ツールで全体像→運用は関数で予測シート化」が最短です。
方法①:分析ツール(回帰)で一発出力する
まず、Excelの「分析ツール」が使える状態か確認します。
- [ファイル]→[オプション]→[アドイン]
- 「管理:Excel アドイン」→[設定]
- [分析ツール]にチェック→[OK]
準備できたら、[データ]タブ→[データ分析]→[回帰]を開きます。入力は以下の通り。
- 入力Y範囲:売上(目的変数)の列(見出し含む/含まないは後述)
- 入力X範囲:広告費、値引き率、営業日数…など説明変数の列をまとめて指定
- ラベル:見出し行を範囲に含めたならチェック(含めないならオフ)
- 出力先:新しいワークシートを選ぶと見やすい
ここで迷いがちなポイントが「定数(切片)を0にする」というチェック(「定数を0にする」など表記)。基本はチェックしないでOKです。切片は“基礎売上”として必要になることが多く、ゼロ固定はモデルを歪めやすいです(理屈があるときだけ使う)。
[OK]を押すと、係数やR²、p値、残差などが一覧で出ます。4章で読み方を解説しますが、この章では「計算して結果表を作る」ところまで押さえれば十分です。
方法②:関数で回帰式を作り、予測を量産する
分析ツールは便利ですが、「毎月更新して予測だけ出したい」場合は関数の方が運用向きです。特に使うのは次の2つです。
(A)単回帰ならFORECAST.LINEARで即予測
説明変数が1つ(例:広告費だけ)なら、予測はこれで済みます。
=FORECAST.LINEAR(予測したいX, 売上の範囲, Xの範囲)
例:来月の広告費(X)を入力したセルを参照すれば、来月売上(Y)が出ます。単回帰の「まず当てにいく」には最速です。
(B)重回帰ならLINESTで係数を取って予測式を作る
説明変数が複数(広告費+値引き率+営業日数…)なら、LINESTが実務的です。係数をまとめて返してくれるので、予測シートに落とし込みやすい。
=LINEST(売上の範囲, 説明変数の範囲, TRUE, FALSE)
- 第3引数TRUE:切片あり(通常はTRUE)
- 第4引数FALSE:まずは係数だけ返す(統計量まで欲しければTRUE)
ポイントは、LINESTが返す係数の並びです。Excelは右端の説明変数→左端の説明変数の順で係数を返します(列順と逆になりがち)。ここでズレると、予測が一気に崩れます。係数を別セルに出したら、予測セルでは
予測売上=切片+(係数1×X1)+(係数2×X2)+…
の形で計算します。説明変数は「来月時点で分かる値(計画値)」を入れる、という2章のルールをここでも徹底すると、実務で使える予測になります。
まとめると、分析ツール=結果を一気に見てモデルを確認、関数=予測を毎月回すための仕組み化です。次章では、出てきた結果(係数・R²・p値・残差)を「現場で判断できる言葉」に翻訳し、精度を上げる改善ポイントまで落とし込みます。
4章:結果の読み方と改善ポイント(係数・R²・p値・残差を超実務目線で)
回帰分析の出力結果を見て「数字がたくさん…で、結局使えるの?」となる人が多いですが、現場で押さえるべきは4点(係数・R²・p値・残差)だけでOKです。ここを読めるようになると、予測が「雰囲気の式」から「意思決定に使える式」に変わります。
①係数:施策の“効き具合”を、単位つきで読む
係数は「説明変数が1増えると売上がどれだけ動くか」です。たとえば広告費の係数が2.5なら、(他条件が同じなら)広告費を1万円増やすと売上が2.5万円増えるイメージになります。ここでの実務ポイントは次の2つ。
- 単位を揃える:広告費が「円」か「万円」かで係数の意味が変わります。後で説明するときに事故るので、列の単位は見出しに書く(例:広告費(万円))。
- 符号(+/−)の妥当性:値引き率が上がるほど売上が上がるのは自然か?逆なら「粗利は上がるが売上は下がる」など、定義ミスやデータのクセを疑うきっかけになります。
切片は「全部ゼロのときの売上」ですが、実務では基礎売上(何もしなくても出る土台)として扱うと便利です。ただし「広告費0・営業日数0」のような現実にない状態も含むので、切片そのものを過信するより、予測式全体の妥当性で判断します。
②R²:当たり外れの“理由”まで理解する指標
R²(決定係数)は、ざっくり言うと売上のブレをどれだけ説明できているかです。数値が高いほど「過去データには合っている」傾向があります。ただし、実務ではR²だけで合否判定しないのが鉄則です。
- 高すぎるR²(例:0.98):変数を入れすぎて過学習、または「事後に確定する数字」を入れてズルく当てている可能性(2章の注意点)
- 低いR²(例:0.40):変数が足りない、季節性(曜日・月・繁忙期)が未反映、データ粒度がズレている、など改善余地のサイン
おすすめは、R²を「通知表」ではなく改善のレーダーとして見ること。特に季節性が強い商材は、月ダミーや繁忙期フラグを入れるだけで一気に改善することがあります。
③p値:その変数、残す?切る?の判断材料
p値は「その係数がたまたま出た数字ではなく、意味がありそうか」を見る指標です。一般にp値<0.05なら有意、と説明されがちですが、現場ではもう少し柔らかく使います。
- p値が高い:売上との関係が弱い/データ数が少ない/他変数と被っている(後述の多重共線性)可能性。まずは「変数の定義が適切か」を確認。
- p値が低い:効いている可能性は高いが、因果が確定したわけではない(1章の相関と因果)。施策判断に使うなら、業務仮説とセットで。
そして実務的な結論はこれです:p値が高い変数は、原則いったん外して再計算。モデルをシンプルにすると、運用しやすく、未来にも強くなりやすいです(ただし季節性など「入れておかないと歪む」変数は例外)。
④残差:改善ポイントが一番見える“現場の宝”
残差は実績−予測のズレです。ここを見ずに「R²がそこそこだからOK」で終わると、予測は伸びません。残差で見るべきは次の3つ。
- ズレが特定の月だけ大きい:イレギュラー要因(大型施策、障害、欠品)が起きていないか。起きているならダミー変数化(2章の外れ値対応)。
- 残差がずっとプラス/マイナスに偏る:そもそも重要な変数を入れ忘れている、季節性が未反映、切片や単位が不整合の可能性。
- 売上が大きい月ほど残差も大きい:スケールにより誤差が増えるタイプ。売上を対数化する、または期間粒度を見直す検討余地。
残差を表やグラフで眺め、「ズレた月に何があったか」をメモしていくと、次に入れるべき説明変数が見えてきます。回帰分析は、結果表より“ズレの理由探し”が本番です。
よくある改善パターン:多重共線性(似た変数の入れすぎ)
実務でハマりやすいのが、説明変数同士が似すぎている状態です(例:広告費と表示回数、来店者数とアクセス数)。これが起きると、係数が極端になったり、p値が不安定になったりして「解釈できない式」になります。対処はシンプルで、似ている変数はどれか一つに絞る、または「どちらが予測時点で確実に分かるか」で採用します。
ここまで読めれば、回帰分析の結果を「読んで終わり」ではなく、変数を足す/減らす→再計算→残差で確認の改善サイクルにできます。次章では、このモデルを予測シートとして業務で回せる形(シナリオ比較や注意点まで)に落とし込みます。
5章:売上予測を業務で使える形にする(予測シート化・シナリオ比較・注意点)
回帰分析は「当てる」だけだと続きません。業務で本当に効くのは、毎月更新できて、上司に説明できて、意思決定に使える形にすること。ここでは、Excelでそのまま運用できる「予測シート化」と「シナリオ比較」、最後に事故を防ぐ注意点をまとめます。
①予測シート化:入力(計画)→出力(予測)を分ける
おすすめは、Excelを「入力シート」「係数(モデル)シート」「予測シート」の3枚構成にするやり方です。
- 入力シート:過去実績(売上と説明変数)を期間ごとに蓄積。2章の欠損・外れ値メモもここに。
- 係数シート:LINESTや分析ツールで出した係数・切片を固定で置く(いつのデータで作ったモデルか日付も記載)。
- 予測シート:来月以降の「計画値」を入れると売上が出る。ここが現場の主戦場。
予測シートは列を揃えると強いです。例:広告費(万円)/値引き率(%)/営業日数/キャンペーン(0/1)/予測売上。係数と掛け算する部分はセル参照を固定($)して、下にコピーすれば複数月分を量産できます。
②シナリオ比較:1つの予測より「3案」で意思決定
実務では「予測は1本」より、ベース/強気/弱気の3シナリオが刺さります。理由はシンプルで、未来はブレるから。Excelなら難しくなくて、説明変数の計画値を3列用意するだけです。
| 項目 | 弱気 | ベース | 強気 |
|---|---|---|---|
| 広告費(万円) | 80 | 100 | 130 |
| 値引き率(%) | 5 | 8 | 10 |
| キャンペーン(0/1) | 0 | 1 | 1 |
そして行ごとに同じ予測式を当てれば、「広告費を+30万積むと、売上はどれくらい増える見込みか」を数字で説明できます。ポイントは「係数=施策の効き具合(4章)」を活かして、“予測”を“施策会話”に翻訳すること。ここまでできると、予測は単なる報告ではなく、提案になります。
③注意点:そのまま信じると危ない3つの落とし穴
- (A)予測時点で分からない変数を入れてしまう
2章でも触れた通り、アクセス数や来店者数など“結果に近い数字”を混ぜると、過去は当たって見えるのに運用で詰みます。予測シートに入れるのは事前に決められる計画値に限定しましょう。 - (B)「過去の範囲外」の入力で精度が落ちる
回帰式は、基本的に過去に観測した範囲で強いです。広告費が過去ずっと50〜120万円なのに、急に300万円を入れて出た予測は当たりにくい(外挿)。予測シートに過去最小〜最大を表示して、範囲外ならセルを色付けする運用にすると事故が減ります。 - (C)モデルは“固定資産”ではなく“消耗品”
価格改定、販路追加、競合参入などが起きると係数は変わります。最低でも月次でデータ追加→四半期で係数更新くらいのリズムをおすすめします。更新日とデータ期間をシートに残すだけで、説明責任が一気にラクになります。
回帰分析のゴールは「当たる式を作る」ではなく、予測を起点に、施策を選び、結果で学び、また更新する仕組みを作ること。Excelでも、予測シートとシナリオ比較まで落とし込めば、売上予測は“作業”から“武器”に変わります。


コメント