母集団と標本とは?:論文の読解、臨床研究に必要な基礎知識

論文を読んでいたり、研究を行う時に「母集団」を意識したことはありますか?

わざわざ論文には「この研究の母集団は〜」とは記載されていません。

実際は母集団で研究はできないので、対象者は「標本」といわれる集団になっています。

 

基本的なところですが、研究初心者は意識しないで論文を読んでいると思います。

(少なくとも私がそうでしたので)

 

研究を行うには必須の概念ですし、論文を読む際にも重要になります。

知ってしまえば簡単に理解できますので、今回まとめてみました。

スポンサードサーチ

母集団と標本とは?

研究を行ったり、論文を読み解くには、頭に入れておかなければならないことがあります。

その1つが、「対象者」が何を示しているかということです。

ここで例題をもとに解説していきます。


例:肺がん術後の運動耐用能について知りたい

肺がんの術後運動耐用能に関する因子について研究を行いたいと思います。

対象はA病院で肺がんの手術を行った患者50名。

術前後の運動耐用能の指標として「6分間歩行試験」を行った。

その他に、年齢などの背景因子、呼吸機能検査、筋力なども測定し、運動耐用能に関連する因子を検討する。


 

(すごくざっくりですが)このような研究の場合、「対象者」は何をしめしているでしょうか?

この研究での対象者は、あくまでA病院で肺がんの手術を行った患者50名です。

本来は日本全体の肺がんの手術を行った患者全てを検証することが望ましいですが、現実的にはとても無理です。

そのため、選ばれた50名で得られた結果が、日本全体の肺がんの手術を行った患者であれば反映できる、と考えます。

 

研究の結果を反映したい全体の対象のことを「母集団(population)」といいます。

・・・今回の例では、日本全体の肺がんの手術を行った患者全てです。

実際に研究で対象にする代表者(被験者)のことを「標本(sample)」といいます。

・・・今回の例では、A病院の50例の術後患者です。

 

図にするとわかりやすいので、以下に図で示します。

これが「母集団」と「標本」の関係になります。

さらに、標本を母集団から選んでくることを「標本の抽出(sampling)」といいます。

標本で得られた結果を母集団に反映させることを「推測(inference)」といいます。

標本の「対象者数」と「分布」に注意

対象者数(集められたデータ数、標本数)

母集団と標本の関係を理解して、自施設で標本を集めたとしても、対象者が少なすぎると研究が行えません。

まずは、対象者数(集められたデータ数、標本数)がどのくらいあるかが重要です。

具体的に対象者が何名必要かどうかは、対象者の希少性などにも影響されますし、明確な基準はありません。

しかし対象者は多い方が望まれます。(母集団を推測できます)

統計解析を行う際も、対象者が少ないと行えない解析もありますので、「対象者:標本数」は意識しないといけません。

 

データの分布

データがどのような分布をしているかも重要になります。

「母集団」は「正規分布」していると仮定される必要があります。

データをまとめた際に、中央の階級のデータが最も多くなり、左右に階級が移動するにつれてデータが少なくなります。

このようにデータの分布が左右対称の釣鐘型になることをデータが「正規分布に従っている」と表現します。(以下の図)

データが正規分布に従っていない場合は、統計手法も変わってきますので、データの分布状況は注意が必要です。

 

正規分布については以下のサイトを参考にしてください。

EZRの使い方:正規分布とは?正規分布の求め方

 

母集団と標本を考えるうえでの注意点を1つお示しします。

以下のように自施設のデータが母集団を反映しにくい場合をイメージしてみてください。

このように、自施設が高齢患者ばかりで、「日本の肺がん術後患者」を反映できな場合は、「日本の高齢肺がん術後患者」を母集団とした研究が望まれます。

スポンサードサーチ

まとめ

  • 研究の対象を考えるときは「母集団」と「標本」を理解する必要があります。
  • 母集団とは、研究の結果を反映したい全体の対象のことをいいます。
  • 標本とは、実際に研究で対象にする代表者(被験者)のことをいいます。
  • 標本を考えるときは、標本数と分布を考える必要があります。

 

研究の基本的な知識になりますが、論文を読む際にも重要な内容です。

簡単に理解できるようにまとめましたので参考にしていただけたら幸いです。