それでいいのか??欠損値!!

アンケートを無事回収できても、よく見ると、回答が虫食い状態。
アンケートで回答がない部分を欠損値と言います。
みなさんは欠損値を見たらどうしますか??
看護研究でよく行われるのは、

回答に不備のあるデータを削除しデータ解析を行った。

というものです。
しかし、この方法にもいろんな問題があります。
今回は、欠損値への対応について考えて見たいと思います。

欠損値を見たらどうする??

さきほど紹介した

回答に不備のあるデータを削除しデータ解析を行った。

は、リストワイズ削除と言われるものです。
看護研究では、このリストワイズ削除が用いられることが多いですが、他にはペアワイズ削除と言われる手法があります。
リストワイズ削除では、すべての質問に対する回答が揃っているデータのみを採用します。

リストワイズ削除

リストワイズ削除では、すべての質問に対する回答が揃っているデータのみを用いて分析をします。

no1とno2の分析をする場合を考えます。
上の例では、id=2のno1の質問、id3のno3の質問に欠損があります。
リストワイズ削除では、全ての質問に対する回答が揃っているデータのみを採用するので、id=2とid=3のデータは削除されます。

リストワイズ削除のメリットは??

  • 看護研究では一般的
  • excelなどでの処理がしやすい(欠損値が含まれるデータを消せばOK)

リストワイズ削除のデメリットは??

  • 分析に用いるデータ数が減少する
  • 必ずしも分析精度が向上しない

ペアワイズ削除

ペアワイズ削除では、分析に用いる質問の回答が揃っているデータを用いて分析をします。

リストワイズ削除と同じno1とno2の分析をする場合を考えて見たいと思います。
id=2はno1のデータが欠損しているので、削除します。
しかし、id=3はno1とno2のデータは揃っているため、分析に用います。

ペアワイズ削除のメリットは??

  • 分析に用いるデータが増加する。

ペアワイズ削除のデメリットは??

  • 看護では一般的でない
  • リストワイズ削除と比べて精度が高いわけではない。
  • excelなど分析ツールによってはできないことも。

欠損値を埋める方法はないのか??

使用するデータを減らさないという点では、穴埋めできればいいんですが・・・。
方法としては、

  • 他のデータの平均値で埋める。
  • 他のデータによる回帰分析の結果を使う。
  • 最尤法という方法を用いて推定する。
  • 穴埋めしたデータを複数用意して分析結果を統合

などなですがど、統計に詳しくないとまず手を出せません。

まとめ

どんな方法を使うにせよ、欠損値への対応は一筋縄では行きません。
欠損値をなくすことは難しいですが、まずは

欠損値が出にくいアンケートを作る

ことが大事です。
Let’s enjoy nursing research!!

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

トップへ戻る