Mark van der Laan의 논문을 이해하려고합니다. 그는 Berkeley의 이론적 통계 학자로서 머신 러닝과 상당히 겹치는 문제를 연구하고 있습니다. 저에게있어 한 가지 문제는 (심층 수학 외에도) 완전히 다른 용어를 사용하여 익숙한 기계 학습 접근 방식을 설명하는 경우가 많습니다. 그의 주요 개념 중 하나는 "Targeted Maximum Likelihood Expectation"입니다.
TMLE는 혼란스럽지 않은 요인이 존재하는 경우에도 효과를 추정 할 수있는 방식으로 비 제어 실험에서 관측 된 관측 데이터를 분석하는 데 사용됩니다. 나는 같은 분야의 많은 개념들이 다른 분야의 다른 이름으로 존재하고 있다고 생각하지만, 그 개념을 다른 분야와 직접적으로 일치시킬만큼 충분히 이해하지 못하고 있습니다.
"전산 데이터 분석"과의 격차를 해소하려는 시도는 다음과 같습니다.
데이터 과학 시대로 진입 : 대상 학습 및 통계 및 전산 데이터 분석의 통합
통계 전문가를위한 소개는 다음과 같습니다.
두 번째부터 :
이 기사에서 우리는 여러 시점 개입의 인과 효과에 대한 특정 대상 최대 가능성 추정기를 개발합니다. 여기에는 손실 기반 수퍼 러닝을 사용하여 G- 계산 공식의 알려지지 않은 요인에 대한 초기 추정값을 구한 다음 대상 매개 변수 별 최적 변동 함수 (최소의 유리한 매개 변수 하위 모형)를 각 추정 된 요인에 적용하고, 최대 가능성 추정으로 변동 파라미터 (들)를 추정하고, 수렴까지 초기 인자의 이러한 업데이트 단계를 반복하는 단계. 이 반복 목표 최대 가능성 업데이트 단계는 인과 효과의 결과 추정값이 초기 추정값이 일정하다면 일관성이 있다는 의미에서 또는 최적 변동 함수의 추정값이 일치합니다. 인과 관계 그래프에서 노드의 조건부 분포가 올바르게 지정된 경우 최적 변동 함수가 올바르게 지정됩니다.
그의 용어에서, "슈퍼 러닝"은 이론적으로 건전한 음이 아닌 가중치 방식을 사용하는 앙상블 학습입니다. 그러나 "목표 매개 변수 별 최적 변동 함수 (최소의 유리한 매개 변수 하위 모델)를 각 추정 된 요인에 적용"한다는 의미입니다.
또는 TMLE가 기계 학습과 유사하고 "최소의 유리한 파라 메트릭 하위 모델"과 다른 분야의 "변동 기능"은 무엇입니까?