統計解析ソフト JMP ブログ

プログラミングなしで使える、インタラクティブで可視的な統計解析ソフト「JMP(ジャンプ)」です。統計初心者の方、データ分析を始めてみたい方に向けて情報を発信しています。

「令和婚」によって結婚する人は増えていく? ~日本の婚姻件数を可視化、予測してみる~

f:id:JMP_Japan:20191223151852j:plain

 

今年話題になった「令和婚」。今回は統計解析ソフト「JMP」で、近年の婚姻件数を可視化し、年や月ごとの傾向を見ていきます。

皆さん、令和婚は婚姻件数にどれくらいのインパクトを与えたと思いますか?

さらに「時系列分析」で、将来の婚姻件数まで予測してみましょう。

 

 

今年も終わりに近づいて来ました。5月に元号が平成から令和になり、その時は「新たな時代の幕開けだな」と感じましたが、正直なところ今はその実感が薄れ、個人的には10月に実施された消費税増税インパクトの方が強かった印象です。

 

令和に関連する事項として、元号が令和に変わるタイミングで結婚をする「令和婚」が話題になりました。ワイドショーやメディアで取り上げられた「令和婚」、しかし、「令和婚」によって今年結婚した人は本当に増えたのでしょうか?データを使って考察してみます。

 

 

厚生労働省の人口動態統計を参照することにより、月ごとの婚姻件数がわかります。そこで、2014年1月~2019年9月(本記事執筆時点における最新の公表月)の婚姻件数*1を可視化してみます。

 

  • 婚姻件数は減少傾向

下図は、年ごとの婚姻件数を棒グラフにしたものです。出生数が年ごとに減少傾向にあることはよく話題にされますが、その前段階である婚姻件数も年ごとに減少傾向にあることがわかります。

f:id:JMP_Japan:20191223151223p:plain

年ごとの婚姻件数:JMP

2019年は9月までのデータしかありませんが、昨年(2018年)9月までの婚姻件数とほぼ同じであることがわかります。しかし、2019年の月ごとの婚姻件数の分布は、他の年と比べ大きく異なりますね。

 

そうです。元号が令和に変わった5月の婚姻件数が非常に多いのです。ということは、他の月の婚姻件数が少なくなったとも言えます。

 

  • 婚姻件数が多い月は?

月ごとの婚姻件数の推移をみるために、折れ線グラフにしてみます。赤色は月ごとの婚姻件数をつなげた折れ線グラフであり、青色はトレンドを示す「平滑線」というグラフです。

f:id:JMP_Japan:20191223151247p:plain

月ごとの婚姻件数(折れ線グラフ):JMP

平滑線をみると、婚姻数は減少傾向にあることがわかりますが、実際の婚姻件数は月ごとに多かったり、少なかったりと変動していることがわかります。何よりも、2019年5月が異常なほど婚姻件数が多くなっていることがわかります。

 

具体的にどの月の婚姻件数が多いのでしょうか。下のように、横軸を月(1月~12月)とし、各年を重ね合わせた折れ線グラフを描いてみます。

f:id:JMP_Japan:20191223151256p:plain

月による婚姻件数の比較

2014年から2018年までの折れ線をみると、年度末である3月の婚姻件数多く、次いで11月、7月が多いことがわかります。引用している人口動態統計では日ごとの婚姻件数(いわゆる入籍日)の情報はないので詳しくはわかりませんが、7月は「七夕」(7月7日)がありますし、11月は「いい夫婦の日」(11月22日)があることが影響しているのかもしれません。

 

2019年は、他の年とは異なる傾向を示しているのがわかります。令和婚の反動でしょうか、7月の婚姻件数は多くなっていませんし、4月は極端に少なくなっています。どうせなら平成の終わりより、令和の始まりにしようといったところでしょうか。

 

ちなみに入籍日として大安の日を選ぶことが多いかと思いますが、2019年7月が特別に大安の日が少なかったということはありません。2019年7月の大安は4日あり、2014年、2015年、2017年の7月の大安も4日です。

 

  • 時系列分析による2019年の異常傾向を確認してみる

令和婚の影響で2019年は他の年とは違う傾向を示していることを見てきましたが、時系列分析により、もう少し詳しく見ていくことにします。

 

時系列分析は、主に今までの傾向から将来の傾向を予測する目的で使われますが、ここでは2019年の傾向が、それ以前の年と比べて異常な傾向をしていることを確かめるために用いてみます。

 

2014年から2018年までのデータを用いて時系列モデル(指数平滑化モデルを使用)をあてはめ、2019年の月ごとの婚姻件数の予測値を出してみます。すると2014年から2018年の時系列の傾向から、2019年はこれぐらいの婚姻件数になるだろうという予測ができるのです。すなわち、その月に期待される婚姻件数がわかります。この予測では婚姻件数が減少傾向であるということも考慮されています。

 

下図の折れ線グラフは、時系列モデルにより予測した婚姻係数を示します。黒の点(2014年~2018年)や赤の点(2019年)は実際の婚姻件数であり、折れ線と点が離れている月は、「実際の婚姻件数」と「(時系列分析により)予測された婚姻件数」の間に乖離があることを示します。

f:id:JMP_Japan:20191223151444j:plain

時系列予測:JMP

図の右側、緑色で塗られた部分である2019年の結果を見てみましょう。極端に赤色と折れ線が離れている月は、5月です。他の月は折れ線と点がほぼ重なっているか、点が折れ線より下にあることがわかります。

 

もう少しわかりやすく、2019年の各月について、実際の婚姻件数から、時系列分析によって予測された婚姻件数を引き算して乖離度合い(予測誤差)を見てみます。下のグラフは、月ごとの乖離度合いを示したものです。実際の婚姻件数と予測された婚姻件数が一致する場合、縦軸の値は0になります。

f:id:JMP_Japan:20191223151543j:plain

2019年の予測誤差

やはり5月の乖離度合いが突出していることがわかり、他の月は5月の反動もあってか、予測される婚姻件数とほぼ同等か、少なくなっていることがわかります。すなわち、5月は期待された婚姻件数を大幅に上回り、他の月は期待された婚姻件数並み、または下回っていることになります。

 

  • 2020年の婚姻件数の予測

では、2020年の婚姻件数を予測したいとき、現在持っている2019年9月までのデータを使ってみるとどうなるでしょうか。その結果が下図です。緑色の部分が2020年の婚姻件数の予測値となります。

f:id:JMP_Japan:20191223151451j:plain

2020年、婚姻件数の予測値1

2020年で突出して値が大きくなっているのは5月です。時系列の予測では、今年5月の令和婚の婚姻件数が考慮された予測結果になっているからです。しかし、実際2020年5月に何か特別なことでもない限り、婚姻件数が多くなることは考えにくいです。

 

時系列分析ではデータの背景をきちんと考えないと、想定とは大きくかけ離れる予測結果が得られることがあります。今回の令和婚の例はそうですし、製品を販売している会社が将来の販売個数を予測する際、突発なキャンペーンで販売個数が急激に増えたことを考慮せずに、将来の予測する例が挙げられます。このようなケースでは、例外となるイベントを説明変数として含めて分析する方法が考えられますが、ここでは2019年のデータは使わずに、2018年までのデータを使って、2020年の婚姻件数を予測した結果を下図に示します。

f:id:JMP_Japan:20191223151537j:plain

2020年、婚姻件数の予測値2

2018年までのデータで2020年を予測するとなると、1年以上も後を予測することになりますので、予測の精度は悪くなってしまいます。グラフで水色に塗りつぶされている箇所は予測区間になり、予測がぶれる範囲だと考えてください。実際に2020年の予測区間は広くなっていることを確認できます。ただ予測値(水色の折れ線)を確認すると、まあ、実際の婚姻件数もこれぐらいに落ち着くのではと思ってしまいます。

 

来年、この予測結果が実際はどうだったか検証してみる予定です。日本の将来を考えると、予測値よりさらに上にぶれていると良いですが。

 

By 増川 直裕 (SAS Institute Japan 株式会社 JMPジャパン事業部 テクニカルグループ)

 

さあ始めましょう。最新版JMP 15 のダウンロードは下から!

www.jmp.com

 

*1:注意:すべての月に対し速報値のデータを用いています。