신경망에 대한 인코딩 날짜 / 시간 (순환 데이터)


12

신경망의 이벤트 날짜와 시간을 어떻게 인코딩합니까?

연속 시계열이 없지만 날짜 및 시간이있는 일부 이벤트가 있으며 관심 분야를 분석합니다. 이 관심사는 아침과 저녁에 차이가 있으며 주중, 여름과 겨울, 크리스마스와 부활절 전과는 다릅니다. 그리고 이벤트 자체는 시간이 지남에 따라 강력한 불균일 한 분포를 가지고 있습니다 (주간에 더 많은 종류, 밤에 더 많은 종류, 주말에 더 많은 종류).

나는 그것을 요일 1-7과 요일로 Number of Week로 인코딩하려고 시도했다. 그러나 희소 한 자동 인코더로 놀아봤을 때 내 데이터가 신경망에 아무런 의미가 없다는 인상을주었습니다. 숨겨진 큰 레이어로도 입력 근처에 아무것도 재현 할 수 없었습니다. 범주 0-1 또는 정규화 된 값이 아닙니다.

그러나 신경망에 대한 시간 인코딩을 검색하면 대부분 시계열에 대한 정보가 제공되므로 숲에 의해 눈을 가린 채 나무를 찾고 있습니다.

물론 데이터를보고 대략적으로 비 확실한 분류 할 수 있습니다. 그러나 딥 러닝의 개념은 모든 수작업으로 만들어진 수동 기능 추출을 완전히 없애 버리는 것 같습니다. 그리고 분류는 자연스럽게 연속적인 입력 변수에 큰 점프를 삽입합니다.

내 두뇌의 "자연 인코딩"은 "밤", "아침", "평일"등과 같은 일부 범주의 퍼지 멤버쉽과 비슷합니다.

모든 것을 더 흥미롭게 만들기 위해 dependend 변수에는 날짜 / 시간 데이터가 포함되어 있지만 다른 질문입니다.

편집 : 어떻게 든 주기적 데이터 종류와 관련된 최근 질문은 다음과 같습니다.

이 시간 데이터 세트에 적합한 통계 테스트는 무엇입니까?

답변:


7

비슷한 문제에 대한 답을 찾고 있었고이 스레드에서 우연히 발견되었습니다. 정현파 인코딩 아이디어는이 블로그 게시물에서 살펴 봅니다.

주기적 연속 기능 인코딩-24 시간

Ian의 대답은 내 요구를 완전히 해결했기 때문에 나중에 기억하기 위해 여기에 게시하는 것에 대해 생각했습니다.


나는 이것이 시간이 특징 일 때 stackoverflow.com/questions/59653862/…를 어떻게 사용할 수 있는지 궁금합니다 .
user4581

1

시간을 큰 행렬 (예 : 365 x 24)로 표시하여 연중 일과 시간을 표현한 다음 1 x 8760 벡터로 "풀립니다". 그러면 시간은이 벡터 내의 위치에 해당하며이 위치의 값은 해당 시간의 값입니다.


2
그런 인코딩으로 시도하고 성공 했습니까? 신경망이이 인코딩에서 일요일 아침의 정확한 위치를 "학습"한다면 놀랄 것입니다. 그러나 놀랍게도 순진한 것은 신경망의 강점 중 하나이므로 스카치에 내기를 걸지 않을 것입니다. ;-)
flaschenpost

이것은 여러 해에 같은 시간마다 주기적으로 이벤트를 감지하려는 경우 유용 할 수 있지만 상관 관계가 매우 약한 것 같습니다. 대부분의 시계열 데이터에 대해 매주 같은 시간 또는 매일 같은 시간 사이에 상관 관계가 더 높을 수 있습니다.
thekingoftruth

1

데이터에 이미 존재한다는 것을 알고 있거나 믿는 관계를 사용하여 시계열에서 여러 입력 기능을 만드는 것이 좋습니다. 예를 들어, 대상 출력이 다를 것이라고 말합니다.

아침과 저녁 사이에 평일과 여름과 겨울에 따라 다릅니다.

따라서 이러한 각 '사이클'을 설명하는 기능 세트를 작성하십시오. 이렇게하면 모든 것을 설명하는 단일 기능이 아닌 미세한 변형과 ​​매크로 변형을 모두 제거 할 수 있습니다.

예를 들어 ...

1..241..16812,36,60...


네, 이것도 저의 첫 아이디어였습니다. 그러나 시간의 원형 개념 (23:59 뒤에 00:00)이 숨겨지고, 나를 괴롭히는 또 다른 것은 보이는 정수 사이의 점프입니다. 09:55의 이벤트는 10:05와 매우 유사합니다. 그러나 아침 06:10은 06:55와 매우 다릅니다. 나는 시간의 중심 (광학 등)을 검색 한 다음 그 중심까지의 거리를 측정하고 제공한다고 상상할 수 있습니다. 따라서 04:30은 가장 깊은 밤인 반면, 05:30은 더 "아침"이지만 저녁과는 완전히 다릅니다.
flaschenpost

1
이 경우 정현파 또는 코사인 또는 실제로는 둘 다로 인코딩을 시도 할 수 있습니다.
CatsLoveJazz
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.