単回帰分析とは?売上予測に使える基本の考え方
単回帰分析とは、ひとことで言うと「1つの要因をもとに、結果を予測するための分析方法」です。ビジネスの現場では、売上予測や来店数の見込み、広告費に対する成果予測など、さまざまな場面で活用できます。
たとえば、「広告費を増やすと売上も増えるのか」「訪問件数が多い営業担当ほど受注金額が高いのか」といった関係を、感覚ではなくデータで確認したいことがあります。このときに使えるのが単回帰分析です。
単回帰分析では、予測したい結果を目的変数、結果に影響を与える要因を説明変数と呼びます。売上予測で考えるなら、たとえば「売上」が目的変数、「広告費」や「営業訪問数」が説明変数になります。
ポイントは、単回帰分析では説明変数を1つだけ使うことです。つまり、「広告費から売上を予測する」「来店客数から売上を予測する」というように、1つの要因と売上の関係をシンプルに見る分析方法だと考えると分かりやすいでしょう。
単回帰分析の結果は、一般的に次のような式で表されます。
売上 = a × 説明変数 + b
この式を回帰式と呼びます。たとえば、広告費と売上の関係を分析した結果、「売上 = 3 × 広告費 + 50」という式が得られたとします。この場合、広告費を100万円かけると、売上は「3 × 100 + 50」で350万円と予測できます。
もちろん、実際の売上は市場環境や季節要因、競合状況などにも左右されるため、予測が必ず当たるわけではありません。しかし、過去のデータに基づいて一定の傾向をつかめるため、経験や勘だけに頼るよりも説得力のある売上予測を作ることができます。
特にExcelを使えば、難しい統計ソフトを使わなくても単回帰分析を行えます。グラフにデータを表示し、近似曲線を追加するだけで、売上予測に使える回帰直線や回帰式を確認できます。普段からExcelを使っているビジネスパーソンにとって、単回帰分析は比較的取り入れやすいデータ分析手法です。
売上予測を作るうえで大切なのは、「何が売上に影響していそうか」を仮説として決めることです。広告費、商談数、サイト訪問数、資料請求数など、自社の売上と関係がありそうな数値を選び、その関係をExcelで確認していきます。
まずは単回帰分析を、「1つの要因から売上の傾向を読み取り、将来の売上を予測する方法」と押さえておきましょう。
売上予測に必要なデータをExcelで準備する方法
単回帰分析で売上予測を行うには、まずExcel上で分析しやすい形にデータを整理する必要があります。ここでの準備が雑だと、後でグラフを作ったり回帰式を確認したりするときに、正しい結果が得られない可能性があります。
まず決めるべきなのは、何をもとに売上を予測するかです。たとえば、広告費から売上を予測したい場合は「広告費」が説明変数、「売上」が目的変数になります。Webマーケティングであれば「サイト訪問数」、営業活動であれば「商談件数」や「架電数」などを使うケースもあります。
Excelでは、次のように列ごとに項目を分けてデータを入力します。
| 月 | 広告費(万円) | 売上(万円) |
|---|---|---|
| 1月 | 50 | 210 |
| 2月 | 60 | 245 |
| 3月 | 70 | 280 |
このとき、単回帰分析に使うデータは、基本的に説明変数の列と売上の列の2つです。上の例では「広告費(万円)」が横軸に置くデータ、「売上(万円)」が縦軸に置くデータになります。
データを準備する際は、単位をそろえることも重要です。ある月は「50万円」、別の月は「500,000円」のように単位が混在していると、Excel上では正しく比較できません。「万円」で統一するのか、「円」で統一するのかを決めてから入力しましょう。
また、空白や文字列が混ざっていないかも確認します。たとえば売上のセルに「未確定」「-」などの文字が入っていると、グラフや計算でエラーの原因になります。まだ確定していないデータは除外するか、分析対象期間を変更するなどして、数値だけで扱える状態に整えてください。
異常値にも注意が必要です。たとえば、特別な大型案件があった月や、キャンペーンで一時的に売上が急増した月があると、通常の傾向とは違う結果になることがあります。異常値を必ず削除する必要はありませんが、「なぜその数値になったのか」を確認しておくと、分析結果を解釈しやすくなります。
データ件数は多いほど傾向をつかみやすくなります。最低でも数か月分、できれば12か月以上のデータがあると、売上との関係を見やすくなります。月次データだけでなく、週次や日次のデータを使うことも可能ですが、期間の粒度はそろえておきましょう。
最後に、Excelで扱いやすいように1行目には項目名を入力し、2行目以降に実際の数値を並べます。途中に空白行を入れたり、メモを書き込んだりするとグラフ作成時に範囲選択を間違えやすくなるため、分析用の表はできるだけシンプルに整えるのがおすすめです。
ここまで準備できれば、次はExcelのグラフ機能を使って、説明変数と売上の関係を視覚的に確認していきます。
Excelのグラフ機能で回帰直線を表示する手順
データの準備ができたら、次はExcelのグラフ機能を使って、説明変数と売上の関係を視覚的に確認します。単回帰分析では、まず散布図を作成し、そこに回帰直線を表示する流れが基本です。
散布図とは、2つの数値データの関係を見るためのグラフです。今回の例であれば、横軸に「広告費」、縦軸に「売上」を置きます。点が右上がりに並んでいれば、広告費が増えるほど売上も増える傾向があると考えられます。
Excelで散布図を作成する手順は、次のとおりです。
- 分析に使う「広告費」と「売上」のデータ範囲を選択する
- Excel上部のメニューから「挿入」をクリックする
- グラフの一覧から「散布図」を選択する
- 表示された散布図を確認する
ここで注意したいのは、折れ線グラフではなく散布図を選ぶことです。折れ線グラフは時系列の変化を見るときには便利ですが、広告費と売上のように2つの数値の関係を見るには散布図のほうが適しています。
散布図が作成できたら、次に回帰直線を表示します。グラフ上の点をクリックすると、データ系列が選択されます。その状態で右クリックし、メニューから「近似曲線の追加」を選びます。
近似曲線の種類はいくつかありますが、単回帰分析では基本的に「線形近似」を選択します。線形近似を選ぶと、散布図の中に1本の直線が表示されます。この直線が、広告費と売上の関係を表す回帰直線です。
回帰直線が右上がりであれば、説明変数が増えるほど売上も増える傾向があると読み取れます。反対に、右下がりであれば、説明変数が増えるほど売上が下がる傾向を示します。また、点が直線の近くにまとまっているほど、説明変数と売上の関係が強い可能性があります。
さらに、近似曲線の設定画面では、「グラフに数式を表示する」にチェックを入れることができます。これをオンにすると、グラフ上に「y = ax + b」のような式が表示されます。ここで表示される式が、売上予測に使う回帰式です。
あわせて、「グラフにR-2乗値を表示する」にもチェックを入れておくと便利です。R-2乗値は、回帰直線がデータの傾向をどの程度説明できているかを示す指標です。詳しい見方は後の章で説明しますが、予測の信頼度を確認するための参考になります。
最後に、グラフタイトルや軸ラベルも整えておきましょう。たとえば、グラフタイトルを「広告費と売上の関係」、横軸を「広告費(万円)」、縦軸を「売上(万円)」のように設定しておくと、後から見返したときにも内容を理解しやすくなります。
ここまで設定できれば、Excel上で回帰直線を確認する準備は完了です。次の章では、グラフに表示された回帰式を使って、実際に将来の売上を予測する方法を見ていきます。
回帰式を使って将来の売上を予測する方法
Excelのグラフに回帰式を表示できたら、次はその式を使って将来の売上を予測します。回帰式は基本的に、次の形で表示されます。
y = ax + b
ここで、yは予測したい売上、xは広告費や商談件数などの説明変数です。aは説明変数が1増えたときに売上がどれくらい変化するかを表し、bは説明変数が0のときの基準値を表します。
たとえば、Excelのグラフ上に次のような回帰式が表示されたとします。
y = 3.2x + 48
この式で「x」が広告費、「y」が売上だとすると、広告費を1万円増やすごとに、売上が約3.2万円増える傾向があると読み取れます。また、広告費が0万円の場合でも、売上は48万円程度になるという計算です。
では、来月の広告費を80万円にする予定だとします。この場合、回帰式のxに80を入れて計算します。
売上予測 = 3.2 × 80 + 48 = 304
つまり、来月の売上は約304万円と予測できます。このように、将来予定している広告費や商談件数を回帰式に代入するだけで、売上の見込みを簡単に計算できます。
Excel上で計算する場合は、予測用の表を作っておくと便利です。
| 月 | 予定広告費(万円) | 売上予測(万円) |
|---|---|---|
| 来月 | 80 | =3.2*80+48 |
| 再来月 | 90 | =3.2*90+48 |
実際には、セル参照を使うとさらに扱いやすくなります。たとえば、B2セルに予定広告費が入っている場合、C2セルに次のように入力します。
=3.2*B2+48
この数式を下の行にコピーすれば、複数月分の売上予測をまとめて作成できます。広告費の予定を変更した場合も、B列の数値を変えるだけで売上予測が自動的に更新されるため、予算案の比較にも使いやすいでしょう。
また、Excelには回帰予測に使える関数もあります。代表的なのがFORECAST.LINEAR関数です。過去の広告費と売上データを指定し、予測したい広告費を入力すると、回帰式にもとづいた売上予測を返してくれます。
形式は次のとおりです。
=FORECAST.LINEAR(予測したいx, 売上データ範囲, 説明変数データ範囲)
たとえば、広告費がB2:B13、売上がC2:C13に入力されていて、来月の予定広告費がB16にある場合は、次のように入力します。
=FORECAST.LINEAR(B16, C2:C13, B2:B13)
グラフに表示された回帰式を使って手計算しても、FORECAST.LINEAR関数を使っても、基本的な考え方は同じです。将来の説明変数を入力し、それに対応する売上を予測する流れになります。
ただし、回帰式から出た数値はあくまで過去データにもとづく予測値です。実際の売上は、季節要因や競合の動き、キャンペーン内容などによって変わります。そのため、予測結果は「確定値」ではなく、売上計画を立てるための目安として活用しましょう。
予測精度を高めるために確認すべきポイント
単回帰分析で売上予測を作ったら、最後に「その予測はどのくらい信頼できるのか」を確認しましょう。Excelで回帰式を出せても、データの状態や使い方によっては、実態とズレた予測になることがあります。
まず確認したいのが、グラフに表示できるR-2乗値です。R-2乗値は、回帰直線がデータの傾向をどれくらい説明できているかを示す指標です。数値は0〜1の範囲で表示され、1に近いほど当てはまりがよいと判断できます。
たとえば、R-2乗値が0.85であれば、売上の変動の多くを説明変数で説明できている可能性があります。一方、0.2や0.3のように低い場合は、その説明変数だけで売上を予測するのは難しいかもしれません。広告費と売上の関係が弱いなら、商談数やサイト訪問数など、別の説明変数を検討する必要があります。
次に、散布図の点の並びも確認しましょう。点が回帰直線の近くにまとまっていれば、予測は比較的安定しやすくなります。反対に、点が大きくバラついている場合は、同じ広告費でも売上に差が出やすい状態です。この場合、予測値をそのまま使うのではなく、「おおよその目安」として幅を持たせて考えるのが現実的です。
また、異常値の扱いにも注意が必要です。大型案件の受注、特別セール、在庫切れ、競合の撤退など、通常とは違う要因で売上が大きく変動した月があると、回帰式に影響を与えることがあります。そのデータを含めるべきか、除外して通常時の傾向を見るべきかを判断しましょう。
予測に使う範囲にも気をつけてください。過去データでは広告費が50万〜100万円の範囲しかないのに、300万円の広告費を入れて売上予測をすると、精度が大きく落ちる可能性があります。過去にない大きな数値を使った予測は、過信しないことが大切です。
さらに、単回帰分析は「1つの要因」だけで売上を予測する方法です。実際の売上は、季節性、商品力、営業人数、競合状況、景気など複数の要因に左右されます。そのため、重要な意思決定に使う場合は、単回帰分析の結果だけで判断せず、現場の状況や他の指標もあわせて確認しましょう。
予測精度を高めるには、分析を一度きりで終わらせないことも重要です。毎月、予測売上と実績売上の差を確認し、ズレが大きい場合はデータを追加して回帰式を更新します。Excelで予測表を作っておけば、新しい実績を追加するだけで見直しもしやすくなります。
単回帰分析は、完璧に未来を当てるためのものではありません。過去データから傾向をつかみ、売上計画や予算判断の精度を上げるための道具です。R-2乗値、散布図のバラつき、異常値、予測範囲を確認しながら使えば、Excelでも実務に役立つ売上予測を作れるようになります。


コメント