특정 이벤트가 일부 세로 데이터에 영향을 줄 가능성을 분석하는 데 사용할 수식, 방법 또는 모델을 찾으려고합니다. Google에서 무엇을 검색해야하는지 파악하기가 어렵습니다.
시나리오 예는 다음과 같습니다.
매일 평균 100 명의 고객을 보유한 업체를 소유하고 있습니다. 하루는 매일 매장에 도착하는 대형 고객 수를 늘리기로 결정하여 매장 밖에서 미친 스턴트를 끌어 당겨 주목을받습니다. 다음 주에 하루 평균 125 명의 고객이 방문합니다.
앞으로 몇 개월 동안 비즈니스를 더 많이하고 싶다고 결정하고 조금 더 오래 유지할 수 있으므로 다른 임의의 일을 시도하여 상점에서 더 많은 고객을 확보하십시오. 불행히도, 당신은 최고의 마케팅 담당자가 아니며, 일부 전략은 거의 또는 전혀 영향을 미치지 않으며, 다른 전략은 부정적인 영향을 미칩니다.
하나의 개별 이벤트가 워크 인 고객 수에 긍정적 또는 부정적인 영향을 줄 확률을 결정하기 위해 어떤 방법을 사용할 수 있습니까? 상관 관계가 반드시 인과 관계에 해당되는 것은 아니라는 것을 잘 알고 있지만 고객이 특정 이벤트를 수행하는 동안 일상적인 업무 수행 률의 증가 또는 감소를 결정하기 위해 어떤 방법을 사용할 수 있습니까?
워크 인 고객 수를 늘리려는 시도 사이에 상관 관계가 있는지 분석하는 데 관심이 없지만, 하나의 이벤트가 다른 이벤트와 상관없이 영향을 주는지 여부는 분석에 관심이 없습니다.
이 예제는 다소 복잡하고 단순하다는 것을 알고 있으므로 사용중인 실제 데이터에 대한 간단한 설명도 제공합니다.
특정 마케팅 대행사가 새 콘텐츠를 게시하거나 소셜 미디어 캠페인을 수행 할 때 고객의 웹 사이트에 미치는 영향을 확인하려고합니다. 특정 대행사 중 한 곳에서 1 ~ 500 명의 고객이있을 수 있습니다. 각 고객은 5 페이지에서 1 백만 이상의 웹 사이트를 보유하고 있습니다. 지난 5 년 동안 각 기관은 수행 한 작업 유형, 영향을받은 웹 사이트의 웹 페이지 수, 소요 시간 등을 포함하여 각 클라이언트에 대한 모든 작업에 주석을 달았습니다.
데이터웨어 하우스 (여러 스타 / 스노 플레이크 스키마에 배치)에 조립 한 위의 데이터를 사용하여 한 번의 작업 (한 번에 한 번의 이벤트)이 어느 정도 영향을 미쳤는지 확인해야합니다. 특정 작업에 의해 영향을받는 모든 페이지를 때리는 트래픽 웹 사이트에서 40 가지 유형의 콘텐츠에 대한 모델을 만들었습니다.이 콘텐츠 유형의 페이지는 출시일부터 현재까지 발생할 수있는 일반적인 트래픽 패턴을 설명합니다. 적절한 모델을 기준으로 정규화되어 특정 작업의 결과로 특정 페이지가 수신되는 최대 또는 최소 방문자 수를 결정해야합니다.
기본 데이터 분석 (선형 및 다중 회귀, 상관 관계 등)에 대한 경험이 있지만이 문제를 해결하는 방법에 대한 손실이 있습니다. 과거에는 일반적으로 주어진 축 (예 : 온도 대 갈증 대 동물에 대한 여러 측정으로 데이터를 분석하고 온대에 걸쳐 온대가 증가하는 갈증에 미치는 영향을 결정)과 비교했지만 위의 느낌을 분석하려고합니다. 비선형이지만 예측 가능하거나 (또는 최소한 모델 가능) 종 방향 데이터 집합에 대한 특정 시점의 단일 이벤트 나는 뒤죽박죽이다 :(
도움, 팁, 조언, 권장 사항 또는 지시 사항은 매우 도움이 될 것이며 영원히 감사하겠습니다!