벤치 마크 GPS 궤적 데이터 세트가 필요하십니까?


13

연구 목적으로 무료로 사용할 수있는 벤치 마크 GPS 데이터 세트를 찾고 있습니다. Microsoft Research에서 GeoLife GPS Trajectories 데이터 세트를 찾았 지만 약간 불완전합니다.

내가 필요한 것은 (위도, 경도, 날짜) 튜플에서와 같이 사람의 GPS 활동 데이터가 적어도 몇 개월 동안, 바람직하게는 지속적으로 추적되는 것입니다. 또한 녹음이 희소하지 않게하고 싶습니다. 각 레코드 사이에서 최대 1 분.

신뢰할 수있는 데이터 세트를 가리킬 수 있다면 정말 감사하겠습니다.


2
이 데이터 세트는 인간의 것이어야합니까? (여러분이 지금까지 모든 것을 표현한 방식은 그렇습니다. 그러나 그것이 명시 적으로 언급 된 것은 아닙니다.)
Dan S.

답변:


17

가장 좋은 기회는 자신을 추적하는 것입니다. 아이디어가 당신을 귀찮게한다면, 그런 데이터를 어디서나 공개하지 않는 이유입니다.


6

내가 생각할 수있는 가장 좋은 것은 OpenStreetMap에서 사용할 수있는 GPS 추적입니다. 연속적이지는 않지만 많은 수가 있습니다.

OSM 웹 사이트에서 "GPS 추적"을 선택하면 특정 영역에서 사용 가능한 항목을 볼 수 있습니다.


2
나는 이것이 당신이 대답에서 놓친 링크라고 생각합니다 : blog.openstreetmap.org/2012/04/01/bulk-gps-point-data
Dr. Atariah

4

나는 숨을 참지 않을 것입니다. 그러한 정확성을 가진 데이터는 대규모 사업이며 개인 정보에 영향을 미칩니다 (1 분당 43,200 개의 데이터 포인트 (1 분마다 기록 된 경우)를 포함하고 의심 할 여지없이 집 위치를 식별 할 수있는 개인에게도 30 일 동안 만 적용됨).

실질적인 질문에 관심이 있다면 그러한 정보가 도움이되지 않을 것입니다. 그러나 대량의 데이터를 처리하기 위해 특정 유형의 분석 전략에만 관심이 있다면 목적에 상관없이 해당 규모의 데이터를 시뮬레이션 할 수 있어야합니다. 데이터를 시뮬레이트하기 위해 R 통계 프로그램, 특히 spatstat트립 패키지 ( R의 모든 공간 모듈) 를 살펴볼 것을 제안합니다 .

동물 추적 데이터조차도 짧은 시간 간격으로 데이터 포인트에 대한 요구 사항을 충족시킬 것입니다. 휴대 전화 데이터를 사용하여 인간 활동 패턴을 추정하는 몇 가지 기사를 나열 할 수는 있지만, 오랫동안 읽지 않았거나 개인 활동을 자주 측정하는 기사는 없었습니다.


4

하나의 선택은 계약서를 작성하고 많은 사람들을 고용하는 것입니다. 필요한 데이터를 제공하는 판독 값, 계약을 지속하기에 충분한 배터리 및 지침 (이 케이블로 연결하여 야간 업로드,이 파일 이메일 보내기 등)을 제공하도록 GPS 장치를 제공하십시오.

계약서에 데이터 배포를 제한하고 데이터를 보호하기 위해 익명화하는 방법을 분명히 작성해야합니다 (아마도 개인이 나타내는 지점 주위에 대략 반 마일의 배제 반경을 제공 할 것입니다). 손실에 대비 한 보험 구매를 고려하십시오. 많은 사람들의 활동이 공개되면 "매일 아침 7시에 퇴근하고 매일 밤 19:00에 집에 돌아옵니다"와 같은 정보로 채워질 것입니다. 음모는 중심에 거대한 별표처럼 보입니다. "8시에서 18:00 사이에이 장소를 훔쳐라"고 개인 정보 보호 및 보안에 대해 걱정해야하는 이유를 확인할 수 있습니다.

당신이 그것에 대해 생각한다면, 당신은 매우 비싼 데이터를 요구하고 있습니다. 그리고 통계적으로 충분히 큰 설정이 없으면 모호한 가치가있을 것입니다. 건설 노동자 (완성 된 건물마다 새로운 반복 출퇴근), 우편 사업자 (매우 반복적이고 매우 뱀이 많은 경로), 회사원 (주로 반복적 인 직접 경로) 및 견인 트럭간에 어떻게 다른 흔적이 있을지 생각해보십시오. 운전자 (신규 노선 계속) 사회 경제적 지위가 미량에 영향을 미칠 수 있습니다. 소득이 낮을수록 대중 교통 노선을 더 많이 따라 가고 여행이 줄어 듭니다. 취학 연령 아동의 부모는 평균 퇴근 후 통근 거리가 높을 수 있습니다. Google 스트리트 뷰 자동차를 운전하는 사람은 말할 것도 없습니다.

그 흔적들 중 어느 것도 의미있는 방식으로 다른 것들과 교차하지 않을 것입니다.

고유 한 스타일의 수는 제한적일 수 있지만 많은 예산이 필요합니다. 그리고 그것은 단지 한 도시에있을 것입니다.

목표를 더 잘 정의하면 더 작은 (더 싼) 데이터 세트를 얻을 수 있습니다. 다양한 유형의 패턴을 수량화하려는 경우 다양한 도시의 광범위한 사람들을 샘플링 할 수 있습니다. 대중 교통의 혜택을 누리게 될 사람 또는 통근 열차 복도를 배치 할 장소를 파악하려는 경우, 봉사하려는 지역 주변의 다양한 도로에서 자동차를 세고 조사를 수행하는 것이 좋습니다.


2

나는 당신이 찾고있는 정확한 유형의 데이터 세트를 찾고 있습니다. 불행히도, 지금까지 아직 찾지 못했습니다. GeoLife 데이터에도 불구하고 내가 찾은 또 다른 소스는 CRAWDAD 입니다. 이 사이트에는 샌프란시스코 택시 및 뉴욕 보행자의 GPS 로그가 있습니다. 불행하게도 NYC 보행자의 경우 위도 / 경도가 아닌 상대 좌표 만 제공합니다.


2

질문에 대답하는 데 필요한 데이터를 도덕적 이유로 이용할 수없는 많은 연구 주제가 있으며, 이러한 한계를 넘어서는 실험Milgram 실험 의 경우와 같이 미래의 제한으로 이어질 수 있습니다 . 최근에 AOL은 개인 정보 보호 문제로 인해 검색 쿼리 모음 을 가져와야 했으며 전자 메일 습관에 대한 신뢰할 수있는 유일한 데이터 집합 은 Enron 시험에서 나왔습니다 .

따라서 전적으로 기술적으로 그러한 궤도 데이터 세트를 얻는 것이 가능하지만 개인 정보 보호의 영향으로 인해 결코 실용적이지 않을 수 있습니다. 다른 답변에서 언급했듯이 개인 정보 문제를 피하면서 상대 데이터 세트, 개인에 대한 집계 또는 시뮬레이션이 모두 귀하의 질문을 해결하는 더 나은 방법 일 수 있습니다.



2

오픈 PFLOW 프로젝트는 다음을 제공합니다.

도시 지역의 일반 대중 대중 운동을위한 개방형 데이터 세트

도쿄도 지역을 이용할 수 있으며 주쿄도 지역은 준비 중입니다.

자세한 내용은 최근 출판물에서 찾을 수 있습니다.

카시 야마 다케 히로, 얀보 팡, 요시히 데 세키 모토, 공개 PFLOW : 도시 지역의 전형적인 대중 대중 운동을위한 공개 데이터 세트의 생성 및 평가, 운송 연구 Part C : Emerging Technologies (2017) Volume 85, Page 249-267.


T-Drive 궤적 데이터 셋 이 최근 발견되었습니다. 다음을 제공합니다.

10,357 대의 택시가 운행되는 일주일 간의 궤도. 이 데이터 세트의 총 포인트 수는 약 1,500만이 며 궤적의 총 거리는 9 백만 킬로미터에 이릅니다.


사람의 움직임은 아니지만 Liquid Robotics 회사는 PacX 과제 에서 흥미로운 데이터 세트를 제공합니다 . 태평양을 통해 항해하는 4 대의 로봇 글라이더의 위치 및 환경 센서 판독 값에 대한 데이터를 다운로드 할 수 있습니다 . 유선이 대화 를 통해 블로그의 (정말 멋진) 프로젝트에 대한 자세한 정보 .


개인 정보 보호 문제를 해결하는 또 다른 옵션은 동물 추적 데이터를 사용하는 것입니다. 데이터 보호는 여기서 덜 문제가 될 것 같습니다. 이점으로, 실제 이동 데이터를 사용하여 소프트웨어 / 방법을 테스트 할 수 있습니다. 응용 프로그램에 '인간 특정'동작이 필요한 경우 목적에 맞지 않을 수 있다는 단점이 있습니다.

Movebank 또는 DRYAD 웹 사이트를 보고 일부 데이터가 프로젝트에 적합한 지 확인하십시오.


Matthew가 언급 한 iphone 데이터 에 대해서는 crowdflowopenpaths 프로젝트를 살펴볼 수 있습니다. 아마도 그것들을 통해 일부 데이터를 얻는 방법이 있습니까? 업데이트 : 두 링크가 모두 죽은 것 같습니다.


또 다른 옵션은 Chris Whong의 NYC 택시 데이터의 공간 부분입니다 . 픽업 및 드롭 오프 위치 만 제공하지만 볼륨 (11GB!)과 상황 정보 (운임, 승객 등)는 실제로 매력적입니다 (대체 다운로드 , 데이터로 인해 발생하는 개인 정보 보호 문제에 대한 자세한 정보 ).


Urška Demšar는 최근 '자원 봉사 운동 데이터 및 상황 정보를 통한 인간 이동성 분석'약속에 관한 논문에 대해 다음과 같이 말했습니다.

곧이 논문에 링크 된 자원 봉사 GPS 궤적의 무료 데이터 세트도 제공 될 것입니다. 계속 지켜봐 주시기 바랍니다.

( 더 많은 정보 )

업데이트 : 논문은 @ejel이 언급 한 CRAWDAD 에서 데이터를 사용할 수 있다고 언급 했지만 거기에서 찾지 못했습니다 .


또 다른 옵션은 합성 데이터 셋을 직접 만드는 것 입니다. 영감이 필요한 경우 van Dijk J (2018)의 최근 논문을 참조하십시오. 여러 움직이는 윈도우 컴퓨터, 환경 및 도시 시스템 ( link )을 사용 하여 GPS 데이터에서 활동 여행 지점 식별 . 자세한 내용은 논문의 부록에 나와 있으며 코드 및 예제 데이터 세트는 github에서 사용할 수 있습니다 .


1

Tahina Expedition (Google 어스 블로그) http://www.tahinaexpedition.com/map 은 지난해 대부분의 기간 동안 항해 중입니다.

KML 처리 할 수 http://maps.google.com/maps/ms?source=embed&hl=en&geocode=&ie=UTF8&t=k&msa=0&output=nl&msid=103005318482134016767.0004670ab348ba9fa7b1f [A GPS는 이제 KML 전환 추적해야했다]


@Mapperez-감사합니다. Mapperez, 필요한 것은 약간 다릅니다. 나는 지상에있는 사람의 매일, 분 단위로 기록 된 GPS 포인트를 원합니다. 매일 일어나고 (일상적으로 일상적인) 사람 – 일어나서, 일하러 가고, 거기에서 시간을 보내고, 쇼핑하러 가고, 집에 와서, 반복합니다.
Murat

1

사람들은 24 시간 내내 그 데이터를 Google에 무료로 제공합니다. 위도라고합니다. 사용자가 공유 한 것처럼 관대하게 공유 할 수 있습니다.


1
나는 그들이하지 않기를 바랍니다. @Murat의 응용 프로그램에서 요구하는 수준의 데이터를 공개 할 수 없다고 확신합니다.
underdark
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.