실생활에서 독립적이고 상관없는 데이터의 예 및이를 측정 / 검출하는 방법


20

우리는 항상이 데이터의 벡터 대이 다른 벡터의 데이터가 서로 독립적이거나 상관되지 않은 것에 대해 듣고 있으며,이 두 가지 개념에 관한 수학을 쉽게 접할 수 있지만, 실제 데이터를 예로 들어 설명하고 싶습니다. 삶과이 관계를 측정하는 방법을 찾으십시오.

이 관점에서, 나는 다음 조합의 두 가지 신호의 예를 찾고 있습니다.

  • 독립적이며 필요하지 않은 두 가지 신호 :

    • 이야기 할 때 자동차 엔진 ( )과 음성 ( )의 입니다.V1[]V2[]
    • 매일 습도 ( ) 및 dow-jones 지수 ( )를 기록합니다.V1[]V2[]

Q1) 두 벡터와 독립적이라는 것을 어떻게 측정 / 증명 하시겠습니까? 우리는 독립성이 그들의 pdf의 곱이 공동 pdf와 같다는 것을 의미한다는 것을 알고 있습니다. 그러나 그 두 벡터가 함께 있다면, 어떻게 독립성을 증명할 수 있습니까?

  • 독립적이지 않지만 여전히 상관없는 두 신호 :

Q2) 여기서 예를 생각할 수 없습니다 ... 몇 가지 예는 무엇입니까? 두 벡터의 상호 상관을 통해 상호 연관성을 측정 할 수 있다는 것을 알고 있습니다.

  • 상관되는 두 신호 :
    • 메인 홀에서 오페라 가수의 목소리를 측정하는 벡터 , 누군가가 건물 내부 어딘가에서 리허설 실 ( ) 에서 자신의 목소리를 녹음 합니다.V1[]V2[]
    • 자동차의 심박수 ( ) 를 지속적으로 측정 하고 후면 유리창 ( ) 에 영향을주는 파란색 표시등의 강도를 측정 한 경우 이러한 가 서로 관련이있을 것으로 예상됩니다. :-)V1[]V2[]

Q3) q2와 관련되어 있지만,이 경험적 관점에서 교차 상관을 측정하는 경우, 이들 벡터의 내적을 보는 것만으로도 충분합니까 (그러한 상관 관계의 피크 값이므로)? 우리는 왜 cor-corr 함수의 다른 값들에 관심이 있습니까?

다시 한 번 감사 드리며, 더 많은 예가 직관을 세우기에 더 좋습니다!


@DilipSarwate 감사합니다. Dilip을 살펴 보겠습니다. 지금은 몇 가지 예가 좋을 것입니다.
Spacey

잘 구성된 여론 조사조차도 모든 사람이 어떻게 투표 할 것인지 같은 이유로 "증명"할 수없는 것과 같은 방식으로 독립적이라는 것을 "증명"할 수 없습니다.
Jim Clay

@JimClay 기준 '증명'을 편히 쉴 수 있습니다. 제가 받고자하는 것은 독립성을 측정 / 정량화하는 방법입니다. 우리는 종종 그것에 대해 듣고 독립한다는 것을 잘 알고 있습니다. 어떻게 알 수 있습니까? 어떤 측정 테이프를 사용하고 있습니까?
Spacey

cros corelation을 분석 목적으로 고해상도 및 저해상도의 두 가지 아날로그 신호에 사용할 수 있는지 알고 싶습니다.

임의의 변수 X가 있고 2 개의 신호 a ** = (x) 및 ** b ** = f 2 (x)를 구성하면 f 1f 2 는 직교하고 ** x = a + bf1f2f1f2 입니다. 이것이 그러한 신호가 독립적이라는 것을 의미합니까? 추가 조건이 필요합니까? 이 속성은 ab 의 공동 pdf 생성을 피하기 때문에 흥미로울 것 입니다.
Mladen

답변:


9

몇 가지 요소 ... (이것이 철저하지는 않다는 것을 알고 있습니다.

Q1

두 분포가 독립적인지 여부를 확인하려면 결합 분포 가 한계 분포 p ( x ) × p ( y ) 의 곱 과 얼마나 유사한 지 측정해야합니다 . 이를 위해 분포 사이의 거리를 사용할 수 있습니다. Kullback-Leibler 분기를 사용하여 이러한 분포를 비교하면 수량을 고려합니다.p(x,y)(엑스)×(와이)

엑스와이(엑스,와이)로그(엑스,와이)(엑스)(와이)엑스와이

그리고 당신은 ... 상호 정보를 인식했을 것입니다! 낮을수록 변수가 더 독립적입니다.

보다 실질적으로, 관측치에서이 수량을 계산하려면 커널 밀도 추정기를 사용하여 데이터에서 밀도 , p ( y ) , p ( x , y ) 를 추정하고 미세 그리드에서 수치 적분을 수행 할 수 있습니다 ; 또는 데이터를 N 빈 으로 수량화 하고 불연속 분포에 대한 상호 정보의 표현을 사용하십시오.(엑스)(와이)(엑스,와이)

2 분기

통계적 독립성과 상관 관계에 관한 Wikipedia 페이지에서 :

분포도

마지막 예를 제외하고,이 2D 분포 는 상관 관계가없고 (대각 공분산 행렬), 독립적이지는 않지만 한계 분포 p ( x )p ( y )가 있습니다.(엑스,와이)(엑스)(와이)

Q3

실제로 상호 상관 함수의 모든 값을 볼 수있는 상황이 있습니다. 예를 들어 오디오 신호 처리에서 발생합니다. 동일한 음원을 캡처하지만 몇 미터 떨어져있는 두 개의 마이크를 고려하십시오. 두 신호의 상호 상관은 마이크 사이의 거리를 사운드 속도로 나눈 지연에 강한 피크를 갖습니다. 지연 0에서 교차 상관을 살펴보면 한 신호가 다른 신호의 시간 이동 버전임을 알 수 없습니다!


고마워 주셔서 감사합니다 : 1) 첫 번째 요점을 자세히 설명해 주시겠습니까?-두 데이터 벡터 x [n] 및 y [n]에서 어떻게 JOINT PDF를 만들 수 있는지 이해하는 데 어려움을 겪고 있습니다. , . 어떻게 x [n]의 히스토그램을 찍어 X의 pdf ( p (x} )를 Y와 같은 방법으로 얻을 수 있는지 이해할 수 있지만, 지구상에서 두 벡터가 주어지면 어떻게 연결 되는가? 구체적으로 묻기-관찰 된 샘플로부터 PDF를 정확하게 구체적으로 매핑하는 것 이것이 가장 혼란스러운 부분입니다 (계속)(엑스,와이)p (x}
Spacey

(계속) 2) 요약하자면 : x와 y의 공분산 행렬이 대각선이면 상관 관계가 없지만 반드시 독립적 인 정확성은 아닌가? 독립성을 테스트하는 것은 후속 질문 (1)의 문제였습니다. 그러나 우리가 그것들이 깊이 있음을 보여 주면, 그들의 공분산 행렬은 대각선이되어야합니다. 내가 제대로 이해 했습니까? 실생활에서 측정 할 수 있지만 상관되지는 않는 2 개의 물리적 신호의 예는 무엇입니까? 다시 감사합니다.
Spacey

1
N 요소의 벡터로 표현되는 두 개의 신호 y n 이 있다고 가정 해 봅시다 . 예를 들어 커널 밀도 추정기를 사용하여 p ( x , y ) 의 추정값을 얻을 수 있습니다 . p ( x , y ) = i 1엑스와이(엑스,와이)여기서K는 커널 함수입니다. 또는 히스토그램을 만들 때와 같은 기술을 사용하지만 2D로 사용할 수 있습니다. 직사각형 그리드를 만들고 그리드의 각 셀에몇 쌍(xn,yn)이있는지 세고p*(x,y)=C(엑스,와이)=나는1케이(엑스엑스나는,와이와이나는)케이(엑스,와이) 여기서 N은 신호의 크기이고C는 점(x,y)과 관련된 셀의 요소 수입니다. (엑스,와이)=기음기음(엑스,와이)
pichenettes 2019

1
"의존적이지만 상관되지 않은 2 개의 물리적 신호": NY 택시의 GPS를 해킹하여 위치의 (위도, 경도) 기록을 기록한다고 가정 해 봅시다. 위도는 오래 지속될 가능성이 높습니다. 데이터는 서로 관련이 없습니다. 포인트 클라우드의 특권 "방향"이 없습니다. 그러나 택시의 위도를 추측하라는 요청을 받으면 경도를 알면 훨씬 더 나은 추측을 제공 할 수 있기 때문에 독립적이지 않을 것입니다 (지도를보고 [lat, long] 건물이 차지하는 쌍).
pichenettes 2019

다른 예 : 두 개의 사인파가 동일한 주파수의 정수 배로 파동합니다. 널 상관 (푸리 어 기준은 직 교정 상임); 그러나 당신이 하나의 가치를 안다면, 다른 하나가 취할 수있는 유한 한 값 세트 만 있습니다 (리사 주 플롯을 생각하십시오).
pichenettes 2019

5

두 신호가 독립적인지 여부를 추론하는 것은 사전 지식이나 가정 없이는 수행하기가 매우 어렵습니다 (유한 한 관찰).

두 확률 변수의 Y는 값 경우 독립적 인 X가 의 값에 대한 정보를 제공하지 않습니다 Y를 (즉, 우리의 사전 확률 분포에 영향을주지 않습니다 Y를 ). 이것은 임의의 비선형 변환에 해당 XY가 , 즉 상관되는 COV를 ( F 1 ( X ) , F (2) ( Y ) ) = E ( F 1 ( X ) , F (2) ( Y )엑스와이엑스와이와이엑스와이 비 - 선형을 위해 F 1 f를 2 두 변수가 제로 평균을 가정 wlog. 독립성과 비상 관성의 차이점은 위의 함수가 f 1 ( x ) = f 2 ( x ) = x 인 경우에만 X Y 가 서로관련이 없다는것입니다.

코브(에프1(엑스),에프2(와이))=이자형(에프1(엑스),에프2(와이))=0
에프1에프2엑스와이에프1(엑스)=에프2(엑스)=엑스

관절 가우스 성을 가정하면 차수 2보다 큰 모든 관절 모멘트는 0과 같으며이 경우 상관되지 않은 것은 독립적입니다. 사전 가정이 없다면 공동 모멘트 를 추정하면 이들이 서로 얼마나 '의존적'인지에 대한 정보를 얻을 수 있습니다.이자형(엑스나는와이j)

엑스()와이()

에스엑스,와이(에프),에스엑스2,와이(에프),에스엑스,와이2(에프)
에프

:

엑스()=(2π에프)
와이()=(2π에프케이)
케이케이1엑스()와이()(케이엑스)(엑스)
와이()=에프(엑스())
에프

엑스()와이()


엑스엑스2,와이(에프)

엑스2()와이()
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.