厚生労働省の統計によれば、1999年以降2011年までにうつ病患者は3 倍に増加している。この推移には相次いで登場した新規抗うつ薬の登場、それに伴うdisease-mongeringの風潮が大きく影響している。
今日のうつ病診療においては、HAM-D、MADRSという評価尺度がゴールドスタンダードとして浸透し、これらの点数が治療の重要な指標となっている。こうした尺度の各項目の数値は、順位尺度としての大きさ、すなわち大小関係を数字に置き換えたものにすぎず、公理として四則計算(加減乗除)を行うことができない。にもかかわらず、その総得点がうつ病の重症度として長く用いられてきた。同時に、これらの尺度は、抑うつ気分、不眠、心気症状、不安などさまざま症状を評価するが、各項目の総得点に対する重みづけ(寄与率)は考慮しない。たとえばHAM-D が20 点から10点に減少しても、残された10 点の中に寄与率の高い項目が含まれていれば、現実には50%減少したとはいえない。HAM-DやMADRSによる「反応」や「寛解」の判定にはこのように疑問があるが、これらの尺度は異なる抗うつ薬どうしを比較するために、やむを得ず使われてきた側面がある。
一方、治験のデータを見るうえでは、データがPPS(Per-protocol-set)あるいはITT(Intention-to-treat)のどちらの方法で解析されたかを知る必要がある。PPSはプロトコールに従った対象のみを解析する方法、ITTは最初に割り付けた対象をすべて含めて評価する方法であり、ITTは実臨床に近く信頼度は高いが薬剤間の差が出にくい。ITTは現実には難しいことから、不適格例を除いた広義のITT解析とされるFAS(Full-analysis-set)が用いられることが多い。さらに欠損値のデータの扱いについては、Last Observation Carried Forward(LOCF)とObserved Case(OC)という二つの方法があり、この両者の結果が変わらないことが重要である。LOCF法では、脱落に至るほどの副作用がない薬剤ほど有効性が高く見積もられる。たとえば、疾患が軽度で実薬の副作用が強ければ服薬が中止されやすく、結果は実薬が不利になる。
うつ病の治療によってHAM-Dが半減する反応例は2/3程度とされ、HAM-Dが7点以下となる寛解例は1/3程度とされる。つまり、抗うつ薬は単剤で急性期治療を行う限り、期待されるほどには効果がない。薬剤の実力を知る上ではNNT(患者一人が効果を得るために何人の治療が必要か)も重要である。臨床試験の成績は、試験に何種類の実薬が組み込まれているかによって、実薬およびプラセボに対する反応率は大きく変わってくる。うつ病診療では、抗うつ薬が本当に必要な患者を見極め、冷静かつ客観的な視点でevidenceを整理し、目前の患者の予後・転帰にとって最適かつ最小負荷の介入を心がけることが大切である。