Data provenance는 데이터의 기원, 생성 과정, 그리고 데이터가 현재 상태에 이르기까지 거쳐온 모든 변화와 이동 경로를 기록한 이력을 의미합니다. 주로 데이터 과학, 컴퓨팅, 정보 관리 분야에서 데이터의 신뢰성과 투명성을 보장하기 위해 사용되는 전문 용어입니다. Provenance라는 단어 자체가 예술품의 출처나 내력을 뜻하는 데서 유래했듯이, 데이터 분야에서도 해당 데이터가 어디서 왔고, 누가 수정했으며, 어떤 알고리즘을 거쳤는지를 추적하는 것이 핵심입니다. 이는 데이터의 오류를 수정하거나 결과의 재현성을 확보하고, 데이터 보안 및 규정 준수를 확인하는 데 필수적인 요소입니다. 단순히 데이터의 현재 상태뿐만 아니라 그 역사를 모두 포함하는 개념이므로, 데이터의 흐름을 뜻하는 Data lineage와 유사하게 쓰이지만, provenance는 좀 더 세밀한 수준의 실행 이력과 인과 관계에 초점을 맞추는 경향이 있습니다.