Excelで回帰分析を使った売上予測を行う方法

1章：回帰分析で「売上予測」ができる理由（相関と因果の違いも押さえる）
2章：予測の精度が決まる！Excelに入れるデータ準備（項目選び・欠損・外れ値）
3章：Excelで回帰分析を実行する2つの方法（分析ツール／関数でサクッと）
1. 方法①：分析ツール（回帰）で一発出力する
2. 方法②：関数で回帰式を作り、予測を量産する
  1. （A）単回帰ならFORECAST.LINEARで即予測
  2. （B）重回帰ならLINESTで係数を取って予測式を作る
4章：結果の読み方と改善ポイント（係数・R²・p値・残差を超実務目線で）
5章：売上予測を業務で使える形にする（予測シート化・シナリオ比較・注意点）

1章：回帰分析で「売上予測」ができる理由（相関と因果の違いも押さえる）

「来月の売上、どれくらいになりそう？」と聞かれて、感覚だけで答えるのは怖い。そこで役立つのが回帰分析です。回帰分析は、過去データから売上（目的変数）に影響しそうな要因（説明変数）との関係を数式で表し、同じ条件を入れたときの売上を“推定”できます。Excelでできるのも強みで、現場の手元で試算→改善のサイクルを回せます。

考え方はシンプルです。たとえば、売上が「広告費」と一緒に増減していそうなら、

売上＝（係数）×広告費＋（切片）

のような式で関係を近似します。係数が「広告費が1増えると売上がどれくらい増えるか」の目安、切片は「広告費が0でも出る売上」を表します（実務では“基礎売上”のイメージ）。この式に来月の広告費を入れれば、来月の売上が予測できます。さらに説明変数を増やせば、売上＝広告費＋値引き率＋来店者数…のように現実に近づけることも可能です。

ただし、ここで絶対に押さえたいのが相関と因果の違いです。

相関：一緒に動く（広告費が増える月は売上も増える、など）
因果：原因→結果になっている（広告費を増やしたから売上が増えた）

回帰分析は基本的に「相関」を数式化する手法です。相関があるからといって因果とは限りません。たとえば「アイスの売上」と「ビールの売上」は相関しやすいですが、原因は“気温”かもしれません。もし気温を入れずに予測すると、「アイスが売れたからビールが売れる」みたいな誤解を生み、施策判断を誤るリスクがあります。

つまり、回帰分析で売上予測を当てにいくコツは、式を作る前に『売上が動く理由』を業務目線で仮説化すること。広告費、単価、客数、季節性（曜日・月・繁忙期）、キャンペーン、在庫、Web流入など、「売上のドライバー」を洗い出し、説明変数として入れる候補を決めます。回帰分析は“魔法の自動予測”ではなく、仮説を数字で検証して予測に落とし込む道具です。

この前提さえ押さえておけば、Excelでも「説明できる予測」が作れます。次章では、予測精度を左右するデータ準備（項目選び・欠損・外れ値）を実務向けに整理します。

2章：予測の精度が決まる！Excelに入れるデータ準備（項目選び・欠損・外れ値）

回帰分析は「式を作る作業」よりも、その前のデータ準備で精度の8割が決まると言っても過言ではありません。ここで雑にやると、どんなにExcelで綺麗に回しても「それっぽいけど当たらない予測」になります。ポイントは①項目選び（説明変数）②欠損の扱い③外れ値の扱いです。

①項目選び：売上の“ドライバー”だけを入れる

まずは列（項目）を整えます。基本形は1行＝1期間（例：1日/1週/1か月）、列＝売上（目的変数）＋要因（説明変数）です。期間粒度は重要で、月次売上を予測したいなら月次に揃えるのが原則（週次データを無理に混ぜない）。

説明変数は「売上に効いていそう」だけでなく、予測時点で事前に分かるものを優先します。例えば来月の売上を当てたいのに、来月が終わらないと確定しない「来月の来店者数」を入れると、当たって見えるだけのズルいモデルになります。

入れやすい例（事前に計画・取得できる）：広告費、値引き率、営業日数、キャンペーン有無、価格、在庫、配信数、曜日ダミー・月ダミー（季節性）
注意が必要な例（結果に近い・事後に確定）：アクセス数、来店者数、問い合わせ数（使うなら「予測時点で分かる見込み値」や「前週までの値」などに設計）

また、説明変数を増やしすぎると現場Excelでは管理しづらく、過去には合うのに未来に弱い（過学習）方向へ寄りがちです。はじめは3〜6個くらいからスタートし、精度と運用のバランスを取りましょう。

②欠損：空白は“情報”ではなく“エラーの種”

Excelの空白や「-」は、回帰分析にかけると行ごと落ちる、または意図しない扱いになりやすいです。まずは欠損の理由を分けます。

未計測：単純に取れていない（計測ルール/集計の仕組みを見直す）
存在しない：キャンペーン未実施など（この場合は0が自然）
欠番：データ抜け（その期間の行を丸ごと再作成 or 近い期間から補完）

実務でやりがちなのが「とりあえず0で埋める」。未計測を0にすると、“その要因がゼロだった”と誤解され、係数が歪みます。迷ったら、まずは欠損のある行を除外して試算→影響が大きいなら補完方法を検討、の順が安全です（除外でデータが減りすぎる場合は、平均・中央値・前月値などの補完をルール化）。

③外れ値：現場の“例外月”をどう扱うか

回帰分析は、極端な値に引っ張られます。例えば「一度だけ大型案件が入った月」「システム障害で販売停止した週」などが混ざると、その1点のせいで係数が不自然になります。外れ値は削除が正義ではなく、“原因が説明変数で表現できるか”で判断します。

原因が説明できる：大型キャンペーン、値上げ、店舗増、広告出稿増など → その要因を列に追加（ダミー変数：実施=1/未実施=0）
偶発・再現不能：災害、障害、イレギュラーな一括計上 → その期間は除外、または「異常フラグ」を入れて切り分け

Excel上ではまず散布図で「売上 vs 各説明変数」を見て、明らかに飛んでいる点がないか確認します。次に、売上や主要変数にフィルターをかけ、上位/下位が“何が起きた数字か”をメモしておくと、3章以降の分析が一気に楽になります。

ここまで整えると、回帰分析の結果が「それっぽい数字」ではなく、業務の言葉に翻訳できる数字になります。次章では、このデータを使ってExcelで回帰分析を回す方法（分析ツールと関数）を、最短ルートで進めます。

3章：Excelで回帰分析を実行する2つの方法（分析ツール／関数でサクッと）

データが整ったら、いよいよExcelで回帰分析を回します。方法は大きく2つ。①分析ツール（回帰）でまとめて出す、②関数で必要な数字だけサクッと使うです。現場では「まず分析ツールで全体像→運用は関数で予測シート化」が最短です。

方法①：分析ツール（回帰）で一発出力する

まず、Excelの「分析ツール」が使える状態か確認します。

［ファイル］→［オプション］→［アドイン］
「管理：Excel アドイン」→［設定］
［分析ツール］にチェック→［OK］

準備できたら、［データ］タブ→［データ分析］→［回帰］を開きます。入力は以下の通り。

入力Y範囲：売上（目的変数）の列（見出し含む/含まないは後述）
入力X範囲：広告費、値引き率、営業日数…など説明変数の列をまとめて指定
ラベル：見出し行を範囲に含めたならチェック（含めないならオフ）
出力先：新しいワークシートを選ぶと見やすい

ここで迷いがちなポイントが「定数（切片）を0にする」というチェック（「定数を0にする」など表記）。基本はチェックしないでOKです。切片は“基礎売上”として必要になることが多く、ゼロ固定はモデルを歪めやすいです（理屈があるときだけ使う）。

［OK］を押すと、係数やR²、p値、残差などが一覧で出ます。4章で読み方を解説しますが、この章では「計算して結果表を作る」ところまで押さえれば十分です。

方法②：関数で回帰式を作り、予測を量産する

分析ツールは便利ですが、「毎月更新して予測だけ出したい」場合は関数の方が運用向きです。特に使うのは次の2つです。

（A）単回帰ならFORECAST.LINEARで即予測

説明変数が1つ（例：広告費だけ）なら、予測はこれで済みます。

=FORECAST.LINEAR(予測したいX, 売上の範囲, Xの範囲)

例：来月の広告費（X）を入力したセルを参照すれば、来月売上（Y）が出ます。単回帰の「まず当てにいく」には最速です。

（B）重回帰ならLINESTで係数を取って予測式を作る

説明変数が複数（広告費＋値引き率＋営業日数…）なら、LINESTが実務的です。係数をまとめて返してくれるので、予測シートに落とし込みやすい。

=LINEST(売上の範囲, 説明変数の範囲, TRUE, FALSE)

第3引数TRUE：切片あり（通常はTRUE）
第4引数FALSE：まずは係数だけ返す（統計量まで欲しければTRUE）

ポイントは、LINESTが返す係数の並びです。Excelは右端の説明変数→左端の説明変数の順で係数を返します（列順と逆になりがち）。ここでズレると、予測が一気に崩れます。係数を別セルに出したら、予測セルでは

予測売上＝切片＋（係数1×X1）＋（係数2×X2）＋…

の形で計算します。説明変数は「来月時点で分かる値（計画値）」を入れる、という2章のルールをここでも徹底すると、実務で使える予測になります。

まとめると、分析ツール＝結果を一気に見てモデルを確認、関数＝予測を毎月回すための仕組み化です。次章では、出てきた結果（係数・R²・p値・残差）を「現場で判断できる言葉」に翻訳し、精度を上げる改善ポイントまで落とし込みます。

4章：結果の読み方と改善ポイント（係数・R²・p値・残差を超実務目線で）

回帰分析の出力結果を見て「数字がたくさん…で、結局使えるの？」となる人が多いですが、現場で押さえるべきは4点（係数・R²・p値・残差）だけでOKです。ここを読めるようになると、予測が「雰囲気の式」から「意思決定に使える式」に変わります。

①係数：施策の“効き具合”を、単位つきで読む

係数は「説明変数が1増えると売上がどれだけ動くか」です。たとえば広告費の係数が2.5なら、（他条件が同じなら）広告費を1万円増やすと売上が2.5万円増えるイメージになります。ここでの実務ポイントは次の2つ。

単位を揃える：広告費が「円」か「万円」かで係数の意味が変わります。後で説明するときに事故るので、列の単位は見出しに書く（例：広告費（万円））。
符号（＋/−）の妥当性：値引き率が上がるほど売上が上がるのは自然か？逆なら「粗利は上がるが売上は下がる」など、定義ミスやデータのクセを疑うきっかけになります。

切片は「全部ゼロのときの売上」ですが、実務では基礎売上（何もしなくても出る土台）として扱うと便利です。ただし「広告費0・営業日数0」のような現実にない状態も含むので、切片そのものを過信するより、予測式全体の妥当性で判断します。

②R²：当たり外れの“理由”まで理解する指標

R²（決定係数）は、ざっくり言うと売上のブレをどれだけ説明できているかです。数値が高いほど「過去データには合っている」傾向があります。ただし、実務ではR²だけで合否判定しないのが鉄則です。

高すぎるR²（例：0.98）：変数を入れすぎて過学習、または「事後に確定する数字」を入れてズルく当てている可能性（2章の注意点）
低いR²（例：0.40）：変数が足りない、季節性（曜日・月・繁忙期）が未反映、データ粒度がズレている、など改善余地のサイン

おすすめは、R²を「通知表」ではなく改善のレーダーとして見ること。特に季節性が強い商材は、月ダミーや繁忙期フラグを入れるだけで一気に改善することがあります。

③p値：その変数、残す？切る？の判断材料

p値は「その係数がたまたま出た数字ではなく、意味がありそうか」を見る指標です。一般にp値<0.05なら有意、と説明されがちですが、現場ではもう少し柔らかく使います。

p値が高い：売上との関係が弱い/データ数が少ない/他変数と被っている（後述の多重共線性）可能性。まずは「変数の定義が適切か」を確認。
p値が低い：効いている可能性は高いが、因果が確定したわけではない（1章の相関と因果）。施策判断に使うなら、業務仮説とセットで。

そして実務的な結論はこれです：p値が高い変数は、原則いったん外して再計算。モデルをシンプルにすると、運用しやすく、未来にも強くなりやすいです（ただし季節性など「入れておかないと歪む」変数は例外）。

④残差：改善ポイントが一番見える“現場の宝”

残差は実績−予測のズレです。ここを見ずに「R²がそこそこだからOK」で終わると、予測は伸びません。残差で見るべきは次の3つ。

ズレが特定の月だけ大きい：イレギュラー要因（大型施策、障害、欠品）が起きていないか。起きているならダミー変数化（2章の外れ値対応）。
残差がずっとプラス/マイナスに偏る：そもそも重要な変数を入れ忘れている、季節性が未反映、切片や単位が不整合の可能性。
売上が大きい月ほど残差も大きい：スケールにより誤差が増えるタイプ。売上を対数化する、または期間粒度を見直す検討余地。

残差を表やグラフで眺め、「ズレた月に何があったか」をメモしていくと、次に入れるべき説明変数が見えてきます。回帰分析は、結果表より“ズレの理由探し”が本番です。

よくある改善パターン：多重共線性（似た変数の入れすぎ）

実務でハマりやすいのが、説明変数同士が似すぎている状態です（例：広告費と表示回数、来店者数とアクセス数）。これが起きると、係数が極端になったり、p値が不安定になったりして「解釈できない式」になります。対処はシンプルで、似ている変数はどれか一つに絞る、または「どちらが予測時点で確実に分かるか」で採用します。

ここまで読めれば、回帰分析の結果を「読んで終わり」ではなく、変数を足す/減らす→再計算→残差で確認の改善サイクルにできます。次章では、このモデルを予測シートとして業務で回せる形（シナリオ比較や注意点まで）に落とし込みます。

5章：売上予測を業務で使える形にする（予測シート化・シナリオ比較・注意点）

回帰分析は「当てる」だけだと続きません。業務で本当に効くのは、毎月更新できて、上司に説明できて、意思決定に使える形にすること。ここでは、Excelでそのまま運用できる「予測シート化」と「シナリオ比較」、最後に事故を防ぐ注意点をまとめます。

①予測シート化：入力（計画）→出力（予測）を分ける

おすすめは、Excelを「入力シート」「係数（モデル）シート」「予測シート」の3枚構成にするやり方です。

入力シート：過去実績（売上と説明変数）を期間ごとに蓄積。2章の欠損・外れ値メモもここに。
係数シート：LINESTや分析ツールで出した係数・切片を固定で置く（いつのデータで作ったモデルか日付も記載）。
予測シート：来月以降の「計画値」を入れると売上が出る。ここが現場の主戦場。

予測シートは列を揃えると強いです。例：広告費（万円）／値引き率（%）／営業日数／キャンペーン（0/1）／予測売上。係数と掛け算する部分はセル参照を固定（$）して、下にコピーすれば複数月分を量産できます。

②シナリオ比較：1つの予測より「3案」で意思決定

実務では「予測は1本」より、ベース／強気／弱気の3シナリオが刺さります。理由はシンプルで、未来はブレるから。Excelなら難しくなくて、説明変数の計画値を3列用意するだけです。

項目	弱気	ベース	強気
広告費（万円）	80	100	130
値引き率（%）	5	8	10
キャンペーン（0/1）	0	1	1

そして行ごとに同じ予測式を当てれば、「広告費を＋30万積むと、売上はどれくらい増える見込みか」を数字で説明できます。ポイントは「係数＝施策の効き具合（4章）」を活かして、“予測”を“施策会話”に翻訳すること。ここまでできると、予測は単なる報告ではなく、提案になります。

③注意点：そのまま信じると危ない3つの落とし穴

（A）予測時点で分からない変数を入れてしまう
2章でも触れた通り、アクセス数や来店者数など“結果に近い数字”を混ぜると、過去は当たって見えるのに運用で詰みます。予測シートに入れるのは事前に決められる計画値に限定しましょう。
（B）「過去の範囲外」の入力で精度が落ちる
回帰式は、基本的に過去に観測した範囲で強いです。広告費が過去ずっと50〜120万円なのに、急に300万円を入れて出た予測は当たりにくい（外挿）。予測シートに過去最小〜最大を表示して、範囲外ならセルを色付けする運用にすると事故が減ります。
（C）モデルは“固定資産”ではなく“消耗品”
価格改定、販路追加、競合参入などが起きると係数は変わります。最低でも月次でデータ追加→四半期で係数更新くらいのリズムをおすすめします。更新日とデータ期間をシートに残すだけで、説明責任が一気にラクになります。

回帰分析のゴールは「当たる式を作る」ではなく、予測を起点に、施策を選び、結果で学び、また更新する仕組みを作ること。Excelでも、予測シートとシナリオ比較まで落とし込めば、売上予測は“作業”から“武器”に変わります。