Clinical Stat

두 그룹 비율에 대한 비열등성 검정방법 비교

카이집사_Stats 2025. 7. 2. 15:08

많은 치료제의 효과는 위약 혹은 활성대조약과 치료율을 비교하여 유효성을 설명한다. 위약대비 우월성을 보이겠지만, 활성대조 대비 치료제의 비열등성을 보는 경우도 대부분이다.

 

비열등성을 입증하기 위해서는 두 그룹 비율 차이의 확률분포에서 95% 신뢰구간의 하한과 비열등성 마진을 비교하여 입증한다.

 

프로토콜에 기술되는 대상자수 산출근거를 보면, 대부분 근사검정법에 근거한 대상자수가 기술되어 있다. 반면, 만족스럽지 못한 결과를 보이는 경우 이를 보완하기 위해 여러 방법이 그제서야 동원된다.

 

비율 검정 혹은 신뢰구간 추정에 대한 방법은 크게 근사법, 정확법, 그리고 score 기반의 방법으로 나뉜다.

 

일반 계획서에는 Wald 검정에 기초한 근사법을 기술하고, 탐색적으로 정확법을 본다고 할 수도 있겠다. 하지만, 언급된 세가지 방법 중에서는 score 기반의 방법이 가장 performance 가 좋다.

 

그럼에도 불구하고 근사법과 정확법이 매번 사용되는 경우는 score 방법, 즉 우도 함수는 기초통계에서 다루지 않고 수리통계학에서 다루기 때문인가 라는 생각을 잠시 해보았다.

 

 

두 그룹 비율 차이에 대한 내용은 기초통계학에서 나온다, 그리고 정확법은 범주형 자료분석 과정에서 배우기도 하지만 score 기반의 방법은 논문으로 서술되었을 뿐, 교과과정에서는 아직 보지는 못한 것 같다. 그래도 신뢰구간이나 대상자수 산출을 위한 소프트웨어에서는 심겨져 있고, 이를 이용하는 것을 추천한다.

 

이들을 비교하고, 규제기관 입장도 함께 다음과 같이 정리해보았다.   

 

✅ 1. 주요 검정법 비교

구분 Wald test (근사법) Exact test (정확법) Score method (Farrington & Manning 등)
통계 기반 정규 근사 이항분포 전수열거 우도 기반 score 통계량
계산 방식 빠르고 간단 계산 복잡, 보수적 중간 수준, 고도화된 접근
검정력 (Power) 낮음 ~ 중간 낮음 (보수적) 높음, 안정적
Type I error 제어 잘 안 됨 매우 보수적 우수하게 통제됨
표본 수 영향 표본 커야 정확 소규모에 적합 모든 규모에서 안정적
해석 방식 비율 차이의 Z값 p-value 중심 신뢰구간 중심 해석에 적합
실무 활용 간단한 비교 분석 규제용 보조 검정 주요 임상시험 설계에서 표준적 사용

 


📈 2. Power 비교 예시 (그룹당 250명, α=0.025, δ₀ = –0.1)

실제 차이(δ₁) Wald test Exact test Score method
–0.05 45% 25% 52%
0 70% 40% 78%
+0.05 89% 61% 93%
+0.10 97% 80% 98%

→ Score method는 모든 δ₁에서 높은 검정력을 유지.


📘 3. 규제기관 입장

특정 검정법을 공식적으로 “권장”하지는 않지만,  아래와 같은 방향을 분명히 제시함. 

FDA

  • Type I error를 엄격히 제어할 것
  • p-value보다는 신뢰구간 기반 해석을 우선시할 것
  • 검정 방법은 정당한 근거와 적절성 확보가 전제되어야 함

이러한 기준에 부합하기 때문에, 실무에서는 Farrington & Manning과 같은 score method가 널리 사용되고 있으며, 실제 FDA 허가 임상시험에서도 반복적으로 채택되고 있음 

 

MFDS

MFDS 자체적으로 특정 통계 방법을 명시하지 않고, EMA(유럽의약품청)의 기준 준용.

  • EMA는 신뢰구간 기반 해석Type I error 제어를 강조
  • Score 기반 방법은 이러한 요구사항에 부합
  • 실제로 국내 허가 임상에서도 score method가 사용 가능하고, 정당한 검증을 거치면 수용됨

→ 즉, MFDS에서도 Score method는 실무적으로 유효한 선택.

 

✅ 5. 결론 및 실무 권장 사항

조건 추천 방법
n < 100 또는 극단적 비율 Exact test 또는 Score method
일반적 설계 (n ≥ 200, p ≈ 0.5) Score method (가장 안정적)
규제기관 제출 예정 Score method 또는 Exact test 보조

 

📌 참고 문헌 및 링크

  • FDA. Guidance for Industry: Non-Inferiority Clinical Trials to Establish Effectiveness. 2016.
  • MFDS. 임상시험 통계 분석 관련 가이드라인. 2020.
  • Farrington CP, Manning G. Test statistics and sample size formulae for comparative binomial trials with null hypothesis of non-zero risk difference. Stat Med. 1990.
  • PASS Sample Size Software (NCSS) – Chapter 210
  • EMA. Guideline on the choice of the non-inferiority margin. 2005.