Clinical Stat

Alpha-spending function

카이집사_Stats 2025. 8. 19. 20:07

💡 Alpha Spending Function이란 무엇인가?

임상시험에서 중간분석(interim analysis)은 매우 중요한 역할을 한다.

시험 도중에 데이터를 미리 살펴보고,

  • 효과가 매우 좋으면 조기 종료하여 빠르게 치료를 환자에게 제공하고,
  • 효과가 없거나 부작용이 크면 중단해 환자 안전을 지키고 자원을 아끼는 것이 가능하다.

하지만 이때 생기는 문제는 Type I error (거짓양성 오류)의 증가이다.
한 번만 분석한다면 α = 0.05일 때 5%의 오류만 허용하면 되지만,
중간에 “여러 번” 테스트를 하면 → 우연히 효과가 있는 것처럼 보일 확률이 누적되어 전체 오류율이 0.05를 넘겨버릴 수 있다.

👉 그래서 고안된 개념이 Alpha Spending Function (α 분배 함수)이다.
이는 전체 α를 시험 기간에 따른 정보량(information fraction) 또는 시간(t)에 따라 “얼마나 사용할지” 미리 정의하는 수학적 함수이다.


🔍 어떤 경우에 사용되는가?

Alpha spending function은 다음과 같은 적응형(adaptive) 임상시험 설계에서 사용된다:

 

사용 상황 목적
치료 효과를 빠르게 파악하고 싶을 때 효능이 압도적이면 조기 승인 가능
무의미한 시험 지속을 줄이고 싶을 때 중간에 효과 없음을 확인 후 종료
샘플 수를 중간에 수정(Unblinded SSR)해야 할 때 Type I error inflation을 통제하기 위한 도구
Multi-stage adaptive design 각 분석 시점에 사용 가능한 α를 미리 배분

즉, 임상시험 데이터를 길게 들여다보면서 설계나 분석을 유연하게 바꾸고 싶을 때 필수적인 장치이다.


📘 대표적인 α Spending 방법 3가지

 

방식 α 분배특징 경계(boundary) 성격 대표적 사용 목적
O’Brien–Fleming (OBF) 초기에 아주 적게, 후기에 많이 매우 보수적 효과가 매우 강한 경우에만 조기 종료하고 싶을 때
Pocock 골고루 일정하게 분배 공격적 중간에 멈출 확률을 높이고 싶을 때
Hwang–Shih–DeCani (HSD) 파라미터 γ로 형태 조절 가능 유연함 시험 특성에 맞게 OBF~Pocock 사이 조절하고 싶을 때

🔧 HSD 방식의 경우 γ=-4 이면 OBF와 비슷, γ=0이면 Pocock과 비슷하다고 보면 된다.


💻 R 코드 예제 (gsDesign 패키지)

아래는 전체 α=0.05, 중간분석 2회 + 최종분석 1회 (총 3회 분석)를 가정한 코드이다. 

# install.packages("gsDesign")  # 처음 한 번만 설치
library(gsDesign)

###############################################################################
# 1. O’Brien–Fleming 방식
###############################################################################
design_obf <- gsDesign(k = 3,
                       alpha = 0.05,
                       sfu = "OF")
print(design_obf)


###############################################################################
# 2. Pocock 방식
###############################################################################
design_pocock <- gsDesign(k = 3,
                          alpha = 0.05,
                          sfu = "Pocock")
print(design_pocock)


###############################################################################
# 3. Hwang–Shih–DeCani 방식 (gamma = -2 예시)
#    gamma = -4 → 더 보수적(OBF 쪽), gamma = 0 → Pocock 유사
###############################################################################
design_hsd <- gsDesign(k = 3,
                       alpha = 0.05,
                       sfu = "HSD",
                       sfupar = -2)
print(design_hsd)
 

📊 출력 해석 방법

각 분석 시점마다 Nominal p-value 또는 Z-boundary가 출력되는데, 이는 “이 시점에서 조기 종료하려면 Z값이 얼마를 넘어야 하는지를 알려주는 기준”이다.

  • OBF: 1차 분석 Z>3.4 → 매우 어렵다 → 후반으로 갈수록 완화
  • Pocock: 세 번 모두 Z≈2.2 → 훨씬 쉽게 멈출 수 있음
  • HSD: γ값에 따라 중간적 성격 띔

⚙ 실제 설계 시 고려사항

  • 윤리성 vs 통계적 엄밀성의 균형이 중요 → 초기에 멈추고 싶은지, 후반까지 보고 싶은지에 따라 spending 함수 선택
  • 시험 계획 단계에서 미리 spending function 공개/등록해야 함 (ClinicalTrials.gov, SAP 등)
  • 샘플 수 재조정(adaptive SSR; adaptive sample size recalculation)이 동반된다면 spending approach를 사용해 오류율 보정 필요

✅ 요약 

Alpha spending function은 중간분석을 포함하는 임상시험에서 전체 Type I error(보통 α=0.05)를 보존하기 위해, 분석 시점별로 α를 어떻게 사용할지 미리 정하는 통계학적 도구이다.
OBF, Pocock, HSD 등 여러 방식 중 시험 목적에 맞게 선택하며, R 등의 소프트웨어로 boundary 계산이 가능하다.


 

Appendix.

📄 1. SOP에 기술하는 예시 문구

중간분석 및 오류율 통제 절차

본 시험은 총 3회(2회 중간분석 및 1회 최종분석)의 group-sequential design을 적용한다.
전체 1종 오류(type I error) α=0.05를 유지하기 위해 O’Brien-Fleming alpha spending function을 적용하며, 분석 시점별 경계값(boundary)은 통계분석계획서(SAP)에 정의한다.
중간분석 시점에서 경계값을 초과한 경우, PI 및 DSMB에 결과를 보고하고 시험 중단 또는 지속 여부를 논의한다.
모든 분석은 gsDesign 패키지로 사전 계산된 경계값에 따라 수행하고, 임시 결과(interim data)는 DSMB 외 누구에게도 공개하지 않는다.


📘 2. SAP에 기술되는 보다 구체적인 예시

5.0 Interim Analyses and Alpha Spending Plan

A two-look interim monitoring procedure will be used (information fractions at 0.33 and 0.67), followed by a final analysis at 1.0 information fraction.
A Lan-DeMets O’Brien-Fleming type α-spending function will be applied to control the overall one-sided type I error at 0.025.

Planned Z-boundaries (two-sided):

 

Analysis # Information fraction Nominal α Z Boundary
Interim 1 0.33 0.00047 3.47
Interim 2 0.67 0.01413 2.45
Final 1.00 0.02295 2.00

If the test statistic crosses the upper boundary at any interim, early termination for efficacy will be recommended to the DSMB.
If not, the trial will continue without modification of the nominal α at subsequent looks.
All calculations were generated using the gsDesign package in R version 4.3.0 and will be reproduced in the locked statistical programming code.