【サンプルサイズ設計の必要項目】⑤ αエラー（第一種の過誤）

備忘録として臨床研究について学んだことを記します

今回は臨床研究におけるサンプルサイズ設計の必要項目の１つの「αエラー（第一種の過誤）」についての記事です

【復習】サンプルとは何か？サンプルサイズとは何か？
αエラー（第一種の過誤）とは？
有意水準
両側検定 or 片側検定
最後に

【復習】サンプルとは何か？サンプルサイズとは何か？

それぞれの用語は臨床研究において以下のように定義されます。

● サンプル（sumple）：臨床研究の対象となる集団のこと

● サンプルサイズ（sumple size）：ある臨床研究における参加者の数、「n数」という用語も同様の意味で用いられる

これから始まる「サンプルサイズ設計編」の最も基礎的な知識なので是非覚えて下さい♪

αエラー（第一種の過誤）とは？

αエラーとは、真実としては２つのグループに「差がない」にも関わらず、誤って２つのグループに「差がある」と判断してしまうエラーを指します。

このようなエラーは以下のような呼び方があります。

● αエラー

● 第一種の過誤（Type Ⅰ error）

● 偽陽性

これらは全て同じ、「差がない」ものを誤って「差がある」と判断してしまうエラーのことです。

それではαエラーを発生させない手段はないのでしょうか？

残念ながら臨床研究において「100%正しい真実を導き出す」ことは不可能です。

例えば、「脳卒中患者を対象とする研究」を行うとして、世界中、あるいは日本中の脳卒中患者のデータを収集・分析することなどできないからです。

研究対象全てのデータが得られない以上は、研究者が手にしたデータによって算出された値が、真の値と乖離している可能性を捨てきれません。

つまり「差がない」ものを、誤って「差がある」と判断しうるのです。

しかしながら、αエラーを防ぐ策が全く講じられないのかと言うと、そうではありません。

αエラーを防ぐ手段が「有意水準」という概念です。

有意水準

臨床研究において「100%正しい真実を導き出す」ことは不可能です。

しかしどんな研究結果も「αエラーが生じている可能性を捨てきれないから信用しない」としてしまっては埒が明きません。

そのため、まず臨床研究では「統計モデルが正しいという仮定と研究で得られたデータとが矛盾する程度」を数値として算出します。

これがP値です。

そして臨床研究においては、「P値がある水準に収まる場合は ”統計モデルが正しいという仮定に矛盾がある（＝統計モデルが正しくない）” と判断します。」ということで折り合いを付けています。

このP値の水準こそ、有意水準であり、

● 「許容可能なαエラーの発生確率」 = 「有意水準」

ということが言えるのです。

リハビリテーション分野の臨床研究においては、有意水準を「P値が5%以下」とすることが一般的です。

かの有名な「有意水準は P≦5% とする」とはαエラーの対策だったのですね♪

なお、「統計モデル」とは以下の条件を満たすものです。

① 対象者がランダムに割り付けられるなど交絡因子がない

② データにバイアスがない

③ 研究計画が遵守されている（＝示された方法の通りに研究が行われている）

④ 帰無仮説が正しい（研究者自身が立てた仮説を否定する仮説）

研究計画の段階で有意水準を設定するとは、「P値が有意水準以下になった場合には①～④のどれか（１つとは限らない、複数の可能性もある）に誤りがあると判断する」と宣言したことと同じ意味です。

ただし、ケース群とコントロール群とを科学的に質の高い比較をする場合には、当然、①～③を満たさなければなりません。（①～③を満たさない比較は科学的に質の高い比較とはとても言えないし、臨床研究としての価値もない）

よって科学的に質の高い研究においては、P値が有意水準以下となった場合は、④の「帰無仮説が正しい」という条件が誤りであると判断されます。

帰無仮説が正しいとするには矛盾があるならば、それは間接的に研究者が立てた仮説（ケース群とコントロール群の間には差があるとする仮説）は「どうやら確からしい」と判断される訳です。

つまり研究計画の段階で

● αエラー（＝「差がある」か「差がないか」を見誤ること）を100%防ぐことはできない

● ケース群とコントロール群とを比較して「差がないとするには矛盾する」という判断基準（＝有意水準）を研究計画の段階で設定する

以上のことを行う訳です。

P値に関してより詳細に学びたい方は以下の記事をご覧下さい♪

● 【解説】P値とは何か？

● 【統計解析】よくあるP値に関する５つの誤解

両側検定 or 片側検定

臨床研究では、ケース群とコントロール群とを比較して差の有無を確認するために、統計的検定が行われます。

統計的検定を行う際には

● 両側検定

● 片側検定

のどちらを行うか選択する必要があります。

両側検定はケース群とコントロール群の差の方向性が定まっていない場合に用いられます。

例えば、「脳卒中片麻痺患者の運動麻痺の治療に関して、電気刺激と反復促通療法はどちらが効果的か？」という問いでは、研究者自身どちらが効果的か判断しかねています。

このような場合は両側検定を用います。

片側検定はケース群とコントロール群の差の方向性が定まっている場合に用いられます。

例えば、「脳卒中片麻痺患者の運動麻痺の治療に関して、電気刺激は反復促通療法よりもどの程度効果的か？」という問いでは、研究者自身は電気刺激がより効果的と考え、その効果の差の程度を示そうとしています。

このような場合は片側検定を用います。

なお、この記事は電気刺激と反復促通療法のどちらが効果的かを断定するものではありません。
あくまでも例えということをご理解下さい。

最後に

今後も臨床研究に関して学んだことを記していきたいと思います

ありがとうございました!!