"균일하게 이격 된"샘플에서 시작하여 장치 디스크의 회귀


9

단위 디스크에 대한 복잡한 회귀 문제를 해결해야합니다. 원래의 질문 은 흥미로운 의견을 불러 일으켰지 만 불행히도 대답은 없습니다. 그 동안이 문제에 대해 더 많은 것을 배웠으므로 원래 문제를 하위 문제로 나누고 이번에는 더 나은 운이 있는지 알아볼 것입니다.

장치 디스크 내부의 좁은 고리에 40 개의 온도 센서가 정기적으로 배치되어 있습니다. 여기에 이미지 설명을 입력하십시오

이 센서는 시간에 따라 온도를 얻습니다. 그러나 시간 변동이 공간 변동보다 훨씬 작으므로 시간 변동을 무시하여 문제를 단순화하고 각 센서가 시간 평균 만 제공한다고 가정합니다. 즉, 40 개의 샘플 (각 센서 당 하나씩)이 있고 샘플을 반복하지 않습니다.

센서 데이터에서 회귀 표면 을 만들고 싶습니다 . 회귀에는 두 가지 목표가 있습니다.T=f(ρ,θ)+ϵ

  1. 평균 방사형 온도 프로파일 을 추정해야합니다 . 선형 회귀를 사용하면 이미 평균 온도 표면 인 표면을 추정하므로 대해 내 표면 만 통합하면됩니다 . 회귀에 다항식을 사용하는 경우이 단계는 케이크 조각이어야합니다.Tmean=g1(ρ)+ϵθ
  2. 방사형 온도 프로파일 을 추정하여 각 방사형 위치에서 합니다.T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

이 두 가지 목표가 주어지면 단위 ​​디스크의 회귀에 어떤 기술을 사용해야합니까? 물론 가우시안 프로세스는 일반적으로 공간 회귀에 사용됩니다. 그러나 단위 디스크에 대한 좋은 커널의 정의는 사소한 것이 아니므로 전략을 잃고 있다고 생각하지 않는 한 간단하게 유지하고 다항식을 사용하고 싶습니다. Zernike 다항식 에 대해 읽었습니다 . Zernike 다항식은 주기적이므로 단위 디스크에 대한 회귀에 적합한 것으로 보입니다 .θ

모델이 선택되면 추정 절차를 선택해야합니다. 이것은 공간 회귀 문제이므로 다른 위치의 오류는 서로 관련이 있어야합니다. 일반 최소 제곱은 상관되지 않은 오류를 가정하므로 일반 최소 제곱 이 더 적합 할 것입니다. GLS gls는 표준 R 분포에 함수 가 있다고 가정 할 때 비교적 일반적인 통계 기법으로 보입니다 . 그러나 GLS를 사용한 적이 없으며 의심의 여지가 있습니다. 예를 들어 공분산 행렬을 어떻게 추정합니까? 몇 개의 센서만으로도 해결 된 예가 좋습니다.

추신 : 나는 Zernike 다항식과 GLS를 사용하기로 결정했습니다. 그러나 나는 전문가가 아니며, 잘못된 방향으로 가고 있다고 생각하면 완전히 다른 접근법을 자유롭게 사용하십시오.


그림에서 엔진은 완벽한 방사형 대칭을 갖는 것으로 나타납니다. 그러나 축의 위치는 엔진의 물리적 특성과 관련이 있습니까? 아니면 실제로 임의입니까? 두 번째 경우, 변수 는 특정 엔진과 관련하여 의미를 갖습니다. θ
이브

답변:


2

Zernike 다항식 과 같은 것을 생각할 때 올바른 길을 가고 있다고 생각합니다 . jwimberly의 답변에서 언급했듯이 이것들은 디스크 의 직교 기반 기능 시스템의 예입니다 . 나는 Zernike 다항식에 익숙하지 않지만, 많은 다른 직교 함수 (Bessel 함수 포함)는 고전 수학 물리학 에서 특정 부분 미분 방정식의 고유 함수 로 자연스럽게 발생합니다 (이 글을 쓰는 시점에서 링크의 맨 위에있는 애니메이션조차도 진동 드럼 헤드의 예를 보여줍니다).

두 가지 질문이 떠 오릅니다. 먼저, 방사형 프로파일 ( 평균) 만 있으면 공간 패턴에 어느 정도의 제약이 필요합니까? 둘째, 시공간 데이터에서 어떤 유형의 변동이 발생합니까?θ

첫 번째 질문과 관련하여 두 가지 염려가 있습니다. 극좌표로 인해 각 센서의지지 영역의 추세는 입니다. 두 번째 관심사는 앨리어싱 (aliasing ) 가능성 , 즉 패턴의 위상과 관련하여 센서가 잘못 정렬 된 것입니다 (Fourier / Bessel 유추를 사용하기 위해). 앨리어싱은 피크 온도를 제한하는 데있어 주요 불확실성 일 것입니다 (예 : ).rT95

이 두 번째 질문과 관련하여 데이터 변동성은 실제로 앨리어싱 문제를 해결하는 데 도움이 될 수 있으며 본질적으로 다른 정렬에서 오정렬을 평균화 할 수 있습니다. (체계적인 편견이 없다고 가정하면 ... 물리적 모델이 없으면 더 많은 정보를 제공하는 등의 방법이 문제가 될 수 있습니다).

따라서 센서 위치에서 공간 직교 함수를 순전히 정의 할 수 있습니다. 이러한 "실증 직교 함수" 는 시공간 데이터 매트릭스에서 PCA 를 통해 계산 될 수 있습니다 . (가변 센서 지원 영역을 설명하기 위해 약간의 가중치를 사용할 수 있지만, 균일 한 극좌표와 방사형 평균 목표를 고려할 때 이것은 필요하지 않을 수 있습니다.)

조밀 한 시공간 계산 그리드에서 사용 가능한 온도의 "예상"변화에 사용할 수있는 물리적 모델링 데이터 있는 경우 동일한 PCA 절차를 해당 데이터에 적용하여 직교 함수를 도출 할 수 있습니다 . (이를 모델 축소에 사용하는 엔지니어링에서는 일반적으로 " 적절한 직교 분해 " 라고합니다 . 예를 들어 고가의 계산 유체 역학 모델을 추가 설계 활동에 사용하기 위해 증류 할 수 있습니다.)

마지막으로지지 영역 (즉, 극 셀 크기)을 기준으로 센서 데이터에 가중치를 부여 할 경우 GLS 프레임 워크에서 대각선 공분산 유형이 됩니다. (가중 PCA는 밀접한 관련이 있지만 예측 문제에 더 적용될 것입니다.)

이게 도움이 되길 바란다!

업데이트 : 새로운 센서 분배 다이어그램은 내 견해에 따라 크게 변화합니다. 디스크 내부의 온도를 추정하려면 단순히 "장치 디스크의 직교 함수 세트"보다 훨씬 유익한 정보 가 필요합니다 . 센서 데이터에 정보가 너무 적습니다.

실제로 디스크에 대한 공간 온도 변화를 추정하려는 경우, 제가 알 수있는 유일한 방법은 문제를 데이터 동화의 하나로 취급하는 것입니다 . 여기서 물리 기반 고려 사항을 바탕으로 공간 분포의 파라 메트릭 형태를 적어도 제한해야합니다 (이것은 시뮬레이션 또는 유사한 역학을 가진 시스템의 관련 데이터에서 비롯 될 수 있음).

난 당신의 특정 응용 프로그램을 모르겠지만, 뭔가 같은 경우 , 나는 당신이 적절한 사전 제약 조건을 선택할 때 그릴 수 있다는 광범위한 엔지니어링 문학이 상상하는 것입니다. (그런 종류의 상세한 도메인 지식을 위해, 이것은 아마도 가장 좋은 StackExchange 사이트가 아닐 것입니다.)


감동적인 답변! 소화 할 시간이 필요합니다. 두 가지 질문을합니다. 첫 번째 질문을 이해하고 있는지 잘 모르겠습니다 ( "공간 패턴에 대한 제약이 얼마나 필요한가?") 40 개의 센서에서 얻은 데이터를 모두 원주 방향을 따라 평균화하는 것보다 낫다고 생각했습니다. 그렇다면 피팅 ...이 사실이 아니라고 말하는가? 두 번째 엔진 ( "시공간 데이터에서 어떤 유형의 변동이 발생하는지")의 경우 다음 1 ~ 2 일 동안 첫 번째 엔진을 분석 할 것입니다 (실제로는 5 개가 있습니다!). 미래의 질문 ...) ctd ...
DeltaIV

... ctd, 데이터를 정규화하고 공개 사이트에 게시 할 수있는 내용을 볼 수 있습니다. 일부 공간 패턴과 시계열 ... 나는 그들이 당신이 요구하는 것에 관한 아이디어를 제공해야한다고 생각합니다.
DeltaIV

1
첫 번째 질문 : 최종 목표가 본질적으로 "새로운 엔진에 대한 센서 결과 예측"(다른 질문에서 추론)이라면 "센서 사이"의 정보가 정말로 필요합니까? 앨리어싱에 대한 나의 의견 은 센서에서 를 안정적으로 측정 할 수없는 경우와 같은 정보 필요한 이유의 예입니다 . T95
GeoMatt22

1
BTW 이것이 설계 문제이고 관련 CFD 유형 시뮬레이션이있는 경우, 현재 질문에서 암시하는 것보다 훨씬 더 많은 정보입니다. (예를 들어, 데이터 동화에 따라 문제에 접근하는
데는

당신의 대답은 생각합니다 : 회귀 대신에 수행 할 수있는 이산 푸리에 변환에 해당하는 2D가 있습니까? 예를 들어, 데이터 포인트의 적분에 n 번째 베셀 함수 (적절하게 수정 된)를 곱한 다음 직교 분해가 발생합니까? 여기서는 1) 답과 같은 선을 따라 적절한 이산화 된 함수를 찾는 것, 2) 적은 수의 샘플링 포인트에 너무 민감하고 분해가 더 복잡한 고 차항에 의존하는지 여부에 대한 우려가 있습니다. .
jwimberley

2

Zernlike 다항식은 이미 과 의존성과 직교성이 요리되어 있기 때문에 나쁜 선택처럼 들리지 않습니다 . 그러나 온도를 연구하고 있기 때문에 아마도 더 적절하고 잘 알려진 선택은 Bessel 함수 입니다. 이것들은 원통형 물체 / 좌표계의 열 흐름 연구에서 나타나므로 물리적으로 더 적절할 가능성이 있습니다. n 번째 베셀 함수는 극 의존성에 대한 대응 삼각 함수와 관련된 방사상 의존성을 제공 할 것이다; 많은 물리학 및 PDE 교과서에서 세부 사항을 찾을 수 있습니다.rθ


(+1) 극좌표 열 방정식 연결이 좋은 것입니다. 아마도 언급 할 가치가있는 또 다른 하나는 사각형 그리드에서 일반적으로 알고있는 가우시안 프로세스의 경우 공분산 행렬이 순환하고 실제로 FFT가 사용된다는 것입니다. 따라서 Bessel 함수는 극좌표에 대한 유사한 접근 방식의 후보가 될 수 있습니다.
GeoMatt22

흥미로운 제안! 그러나 엔진의 고체 부분이 아닌 작동 유체의 온도를 측정하고 있습니다. 따라서 전도 문제가 아니라 대류 문제에 관심이 있습니다. 베셀 함수는 반드시 열전도 (푸리에) 방정식의 해답이지만 대류가 유체 유동장에 의존하기 때문에 열 대류 방정식의 해답이라고 생각하지 않습니다. 어쨌든, 나는 적어도 Zernike에 대해 테스트 할 수있었습니다. GLS는 어떻습니까? 질문의 해당 부분에 무언가를 추가 할 수 있습니까?
DeltaIV

@DeltaIV 저는 GLS에 익숙하지 않지만 한 가지 질문입니다. 왜 서로 다른 공간 지점에서 오류가 상관 될 것으로 기대하십니까? 나는 실제 변동이 점들 사이에 상관 될 것이라는 데 동의하지만, 오차 (센서 판독 값의 불확실성)는 상관이 없을 것이라고 생각합니다. 아마도 회귀 변동에 대한 오류로 간주됩니까? 그러나 벌칙에 대해 추가하는 것을 고려하고 있습니다. 어떤 기준을 사용하든 한정된 수의 샘플링 지점 만 있고 매우 일치하는 Bessel 함수를 찾을 수 있으므로 가장 낮은 항이 선호됩니다.
jwimberley

@DeltaIV 다시 변동에 대해 공간 점 사이에 상관 관계가 생길 수 있습니다. 객체가 온도 맵을 얻는 것입니까? 당신은하지 마십시오 원하는 발생하는 어떤 변동보고? 유체 역학에 의해 변동되고 공간과 시간이 복잡하기 때문에 통계 모델이이를 설명 할 수 있을까요? (이것은 단순화를 위해 중단 한 분석의 시간 의존적 부분과 관련이 있습니까?)
jwimberley

갤러리 채팅이 생성되었습니다 .
DeltaIV
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.