Surrogate variable은 통계학, 데이터 과학, 그리고 연구 방법론에서 직접 측정하기 어려운 핵심 변수를 대신하여 사용하는 '대리 변수'를 의미합니다. 연구자가 관심 있는 변수를 직접 관찰하거나 측정하는 것이 불가능하거나 비용이 너무 많이 들 때, 그와 밀접한 상관관계를 가지는 다른 변수를 측정함으로써 간접적으로 정보를 얻는 방식입니다. 예를 들어, 학생의 '지능'을 직접 측정하기 어려울 때 '학업 성취도'나 '표준화 시험 점수'를 대리 변수로 사용하는 경우가 이에 해당합니다. 이 용어는 주로 학술적, 기술적 문맥에서 사용되며, 일반적인 대화보다는 데이터 분석 보고서나 논문 등 전문적인 환경에서 자주 접하게 됩니다. 유사한 개념인 proxy variable과 거의 혼용되어 사용되지만, surrogate는 특히 실험이나 모델링 과정에서 원래의 목적 변수를 대신하여 결과를 예측하거나 추론하는 도구적 성격이 강합니다. 따라서 이 용어를 사용할 때는 해당 변수가 원래의 변수를 얼마나 정확하게 대표할 수 있는지에 대한 타당성 검토가 항상 수반되어야 합니다.