hmnの妄言

主に妄言、妄想など、つれづれと

「コロナで自殺者8千人増、20代女性最多 東大試算」についての考察

以下の記事が、自殺者数の推移からの直観的な推測とずれが大きかったため、考察してみました。

自殺者数の推移は以下のとおりです。

元となっていると思われる資料

元となっている分析の結果は以下かと思われます。

資料1. コロナ禍の超過自殺

https://www.bicea.e.u-tokyo.ac.jp/policy-analysis-24/

上記で参照されている資料として

資料2. 分析の詳細

https://www.carf.e.u-tokyo.ac.jp/wp/wp-content/uploads/2022/07/F542.pdf

資料3. 日本でのコロナ危機の自殺への影響を分析した論文

https://tmghig.jp/research/release/cms_upload/japanese.pdf

が紹介されています。

※ ここで、以降の考察でのわかりやすさのために、各資料に附番をしています。以降、資料1~3のように記載します。

はじめに

「まとめ・考察」にも記載していますが、推計に使用されているのは資料2のように思われます。

資料3は使われていないような気がするため、資料3の考察については、特に必要がなければ、流し読み、もしくは飛ばしてください。

注意書き

統計、数値解析については、学生時代に多少触った程度です。

過去の記憶遺産をフル再稼働で考察しているため、内容はざっくりした部分が多いです。

考察の流れ

  1. 対象とするモデルと分析結果の確認
  2. コロナ前(2019年)を基準とした自殺者数の増加を推計
  3. 資料3(日本でのコロナ危機の自殺への影響を分析した論文)の内容からの考察
  4. 資料2(分析の詳細)の内容からの考察

前述の通り、実際の計算は資料2で、資料3は使われていないように思えるため、特に必要がなければ、資料3の考察は、飛ばしてください。

対象とするモデルと分析結果の確認

以下は資料1(コロナ禍の超過自殺)の4ページ、各モデルからの結果から

本記事では、比較的検証がしやすい、年齢、性別を考慮しないモデル4の超過自殺が、約6830人となるケースについて考察していきたいと思います。

コロナ前(2019年)を基準とした自殺者数の増加を推計

以下、資料3の「分析方法」より

厚生労働省が公表する(データ提供は警察庁)「地域における自殺の基礎資料(2016年11月から2020年10月まで)」等を用いて

また、資料2の「3 Data」より

We collect monthly suicide data from the Ministry of Health, Labor, and Welfare (MHLW) for different genders and age groups

との事なので、以下のデータを元に考察します。

以下は2019年を基準とした場合の自殺者数の増加の推計です。

2022年については、7月までの合計の前年倍率(0.98倍)から、年間の増加を推計しています。

2020年3月から2022年6月までの2年4か月だと、おおよそ、のべ1890人程度が増加していると思われます。

資料3(日本でのコロナ危機の自殺への影響を分析した論文)の内容からの考察

2016年~2019年の3年をコントロール期間、2020年を処置期間として、差の差分法(Differencein-Differences design)により、コロナ流行下の自殺率の変動を評価しています。すなわち、感染症拡大が始まった2020年2月から10月において、過去3年間の同月と似たように自殺率が推移したと仮定した場合と比較して、実際の自殺者数がどれほど異なっているかを推計しています。

コロナ前の3年間(2016~2019)から推計されているようです。

以下、2016~2019の傾向が直線的に続くと仮定して、2020年3月から2022年6月までの2年4か月に当てはめてみました。

のべ2300人程度の自殺者数の減少を見込んだ推測となり、超過自殺は先述の1890人と合わせて、約4190人の増加と推計されます。

資料1(コロナ禍の超過自殺)のモデル4の結果である超過自殺、約6830人と比べると2600人近く開きがあり、資料3の仮定は使われていないように思われます。

資料2(分析の詳細)の内容からの考察

以下、資料2(分析の詳細)の 2.2 Model から要点のみ抜粋

※ パラメータや添え字については、資料2(分析の詳細) 2.2 Model についてざっくり解釈を参照してください。

We estimate the model parameters for each group of age and gender equation-by-equation using Ordinary Least Squares. We use data in the pre-COVID period from January 2010 to February 2020 for the estimation.

ざっくり、年代・性別ごとに最小二乗法を使って式(1)のパラメータを推定しているという感じだと思います。

式の感じだと、時間(月)を横軸、自殺者数を縦軸として、直線的な近似のように見えます。

a, g, m の添え字は、それぞれ年代(age)、性別(gender)、月ごとの影響(month)が考慮されている感じかと思います。

各属性に対する直線的な近似(+失業率影響部)といった感じで、基本は直線的な近似のように見えます。

モデル4については、年齢、性別を考慮しない事から、式(1)で a, g の添え字を省略して、以下のように見るとわかりやすいと思います。

また、例えば、具体的な推計対象月として2022/8を選ぶと、以下のような感じになり、月ごとに直線的な近似といった感じのように思われます。

※ ここでt^\primeには2022/8にあたる数値が入ります。おそらく、UTC時間など、基準が一定していれば何でもいいと思います。また、 \deltaの効果で \sumが消えています。 \deltaについては、資料2(分析の詳細) 2.2 Model についてざっくり解釈を参照してください。

また、上述の引用文から、使われているデータは2010/1~2020/2の自殺者数(→S)と失業率(→U)と思われます。

ここでは、先ほどの資料3の場合と同様に2010~2020までの傾向が直線的に続くと仮定して、2020年3月から2022年6月までの2年4か月に当てはめてみます。

データは以下より

超過自殺の推計は以下の通り

※ ここで、資料2では2020/2までのデータが使用されているようですが、簡単のため、ここでは2020の2か月は除外して、2010~2019の自殺者数のデータを使用して年単位で推計します。

のべ5120人程度の自殺者数の減少を見込んだ推測となり、超過自殺は先述の1890人と合わせて、約7010人の増加と推計されます。

資料1(コロナ禍の超過自殺)のモデル4の結果である超過自殺、約6830人と比べると差は約180人で、近い値のように思われます

資料1の中で「分析の詳細」として参照されているように、資料1の分析結果は、仮定などを含め全体的に資料2がベースに分析された結果ではないかと思われます。

補足

ここでの推計は、前述の式がさらに簡略化されて、以下のようなイメージになります。

 S_t = \alpha + \beta t + \epsilon_t

年齢・性別に加えて、月ごとの影響を考慮していないため、 \sumの部分が消えています。

また、失業率を考慮していない事は、 \gamma=0に相当し、 \gamma U_tの部分も消えています。

誤差項を除けば、線形近似となっています。

まとめ・考察

前述の通り、資料1の分析結果は、全体的に資料2がベースに分析された結果ではないかと思われます。

資料1. コロナ禍の超過自殺

https://www.bicea.e.u-tokyo.ac.jp/policy-analysis-24/

資料2. 分析の詳細

https://www.carf.e.u-tokyo.ac.jp/wp/wp-content/uploads/2022/07/F542.pdf

資料2がベースであるとすると、以下のグラフの、R22~R1の傾向が継続するという仮定での推計ではないかと思われます。

資料2で採用されている式は、直線的な近似のように見えますが、R22~R1の傾向を見ると、H28から減少傾向が緩んでおり、直線的な近似は妥当でない気がします。

「H22~R1」の傾向からすると、直近の3年間「H28~R1」の傾向が続くか、横ばいになると仮定するのが妥当であるように思われます。

また、「H22~R1」の期間はコロナ前(R1まで)の傾向を見る上で、減少傾向が最大に近く、対象期間の選択として疑問を感じます。

※ グラフから見ると、減少傾向が最大となるのは「H23~R1」期間だと思われますが、「H22~R1」期間とほとんど変わらないと思われます。

研究自体は、判断のための1つの材料として、有益な研究だと思いますが、この試算だけを捉えて報道する事には問題があるように思われます。

少なくとも、報道する上で、推計の仮定を記載する事は必須に近いように思われます。 (判断の材料として使われる場合、その場合も仮定記載は必須に思われます。)

資料2(分析の詳細) 2.2 Model についてざっくり解釈

※ 以下あくまで、個人的なざっくりとした理解です。正確な内容は以下の資料を参照してください。

資料2. 分析の詳細

https://www.carf.e.u-tokyo.ac.jp/wp/wp-content/uploads/2022/07/F542.pdf

使用されている式について

使用されている式はざっくり以下のような感じかと思います。

基本式

コロナ前の実際の自殺者数(→S)、実際の失業率(→U)から、最小二乗法で各パラメータの推定

基本式(1)に推定パラメータ+コロナ前失業率予測を適用した式

おそらく、コロナが無かった場合の推計にあたる式

→ 式(1) - 式(2) = 超過自殺?

基本式(1)に推定パラメータ+実際の失業率を適用した式

パラメータについて

パラメータはざっくり以下のような感じかと思います。

S:自殺者数

t:対象月

α+βt:失業率に依らない、直線的な時間変化部分

δ:添え字のtとmが一致する場合は1、それ以外は0?

各式のシグマ内で、対象月のみ抽出するようなパラメータと思われる

γ:失業率の寄与に対する倍率

U:失業率

ε:誤差項

ハットなし変数:実際の値

ハット付き変数:推定値

添え字について

パラメータの添え字はざっくり以下のような感じかと思います。

F:コロナ前失業率予測の意(予測そのもの、もしくは関連・依存)

a:年代グループ

g:性別

m:月