ロジスティック回帰によるバイナリ健康結果の予測におけるサンプリング設計の無視の影響: マラウイの人口統計と健康調査からの証拠
ホームページホームページ > ブログ > ロジスティック回帰によるバイナリ健康結果の予測におけるサンプリング設計の無視の影響: マラウイの人口統計と健康調査からの証拠

ロジスティック回帰によるバイナリ健康結果の予測におけるサンプリング設計の無視の影響: マラウイの人口統計と健康調査からの証拠

Jan 23, 2024

BMC Public Health volume 23、記事番号: 1674 (2023) この記事を引用

1 オルトメトリック

メトリクスの詳細

人口の出生率と死亡率は、どの国でも社会経済政策を計画する上で重要な重要な統計の 1 つです。 5 歳未満死亡率は国民の健康状態を監視する指標の 1 つであるため、定期的かつ正確な推定が必要です。 国民が容易に入手できる全国的な人口動態と健康調査のデータは、関連する統計手法を使用して、アフリカの人々の健康に関するほとんどの質問に答える手段となっています。 ただし、このようなアプリケーションの多くは、分析をサポートする統計ツールが利用できるにもかかわらず、推定において調査設計の効果を無視する傾向があります。 5 歳未満児の死亡率を予測する際に生成される不正確な情報の量についてはほとんどわかっていません。 この研究では、全国的な調査データを使用して、マラウイの5歳未満児死亡率を予測するために非加重ロジスティック回帰法と加重ロジスティック回帰法を適用したときに遭遇するバイアスを推定し、比較しています。 偏りを決定するために、2004年、2010年、2015年から2016年のマラウイの人口統計と健康調査のデータが使用されました。 分析は、R ソフトウェア バージョン 3.6.3 および Stata バージョン 12.0 で実行されました。 子供、母親、世帯に関するさまざまな生物的および社会的人口統計的要因を含むロジスティック回帰モデルを使用して、5 歳未満の死亡率を推定しました。 その結果、全国の 5 歳未満死亡率の予測精度は、モデルに重み付けがされているかどうかに関係なく、全体的な子供の死亡予測確率のクラスター重み付けに依存することが示されました。 モデルの重み付けにより、さまざまな固定効果推定値に小さなプラスとマイナスの変化が生じ、これにより、適合した死亡確率における重み付けの結果が拡散しました。 同様に、加重モデルを使用して得られた全体の予測死亡率と加重なしモデルで得られた全体の予測死亡率の間に差はありませんでした。 バイナリの健康状態の結果に対するイベントの全体的な予測確率を計算する際に、調査クラスターの重みを考慮することをお勧めします。 これは、母集団パラメータの予測を目的としたモデルのフィッティング中の重みを気にせずに行うことができます。

査読レポート

生後 0 か月から 59 か月の小児の死亡率は、国および世界の健康目標を監視するための有用な指標です [1、16、32]。 したがって、5 歳未満の年齢層で観察された総死亡者数の推定には、政策決定のための正確な近似値を得るために、堅牢で信頼性の高い技術が必要です [13、16]。 サハラ以南のアフリカ諸国の医療施設では、生命維持システムの登録が不十分であり、過小報告されている死亡率が高いことが報告されている[23、28、55]。 この地域における 5 歳未満死亡率の推定のほとんどは、人口動態・健康調査 (DHS) データなどの全国調査から収集された情報に基づいています [21、22、42、46]。 このため、正確な推定値を得るには、サンプリング重み付けなどの調査設計に基づく統計分析を使用する必要があります [5、19、20、40、44、53]。 サンプルの重みは、サンプルに被験者が含まれる確率の逆数です。 これは、サンプリングされた各単位が表す母集団内の被験者の数を示します。 回帰分析中に、被験者の体重は調査データに適用されるモデルの共変量の関数として導入され、不均等なサンプルの使用、無回答、サンプリング フレームの過少カバレッジを補正します [7, 11] 、36、42、50、57]。

しかし、サハラ以南アフリカにおける 5 歳未満死亡率の推定に使用される回帰手法のほとんどの適用では、調査設計の効果が無視されており、推定と予測に偏りが生じる可能性があります [18、41、43、52]。 この問題は、死亡率とは別に二元的な健康結果を分析した他の研究にも当てはまることが判明しました。 たとえば、患者における糖尿病 [48]、下痢 [33]、住血吸虫症 [14、31]、マラリア [29] の有無などです。 この傾向は、バイナリ健康データに回帰手法を適用する際に、調査設計の技術的使用を実証する研究が利用できないことを反映している可能性があります。 また、レビューされた研究のほとんどが、何らかの方法で集団内で達成される可能性のある健康状態自体の程度を予測するのではなく、関連する健康状態の危険因子を特定することを目的としていたという事実も原因である可能性があります[9、17、 54]。 全国的な5歳未満児死亡率やその他の二項回答の健康データが、設計効果を考慮せずに大規模な全国調査から予測された場合に犯しそうなバイアスに関する文献は不足している。 したがって、この研究では、調査加重ロジスティック回帰法と非加重ロジスティック回帰法を使用して、5歳未満児死亡率を予測する際に研究者が犯し得るバイアスを推定した。 5 歳未満児死亡率の推定におけるバイアスとは、無作為サンプルから推定された死亡率と、日常的な観察で報告される実際の死亡率との間の差異です。 2 つの値の差がゼロであると予想される場合、調査データに適用される推定量は不偏であると言われます [39]。 本研究では、2004年、2010年、2015~16年のマラウイにおける最近の3つの人口統計・健康調査(DHS)データセットと、それぞれのDHSが報告した公式の5歳未満児死亡率を使用してバイアスを計算している。 バイアス推定におけるサンプル サイズの影響を考慮するために、各 DHS データセットのさまざまなサンプル サイズが使用されます。