스마트 폰 데이터 세트 문제를 이용한 인간 활동 인식


9

저는이 커뮤니티를 처음 사용하므로 제 질문이 여기에 잘 맞기를 바랍니다. 학부 데이터 분석 과정의 일환으로 스마트 폰 데이터 세트를 사용하여 인간 활동 인식 프로젝트를 선택했습니다. 내가 우려하는 한이 주제는 기계 학습 및 지원 벡터 기계와 관련이 있습니다. 아직이 기술에 익숙하지 않으므로 도움이 필요합니다.

이 프로젝트 아이디어를 따르기로 결정했습니다 http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (위의 첫 번째 프로젝트) 프로젝트 목표는 사람이 어떤 활동인지 결정하는 것입니다 피험자의 허리에 스마트 폰 (Samsung Galaxy S II)으로 기록 된 데이터에서 (예 : WALKING, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, SITTING, STANDING, LAYING) 참여. 내장 된 가속도계 및 자이로 스코프를 사용하여 데이터에는 3 축 선형 가속도 및 3 축 각속도가 50Hz의 일정한 속도로 포함됩니다.

모든 데이터 세트는 설명과 기능 레이블이있는 하나의 폴더에 제공됩니다. 데이터는 다음 형식으로 표시되는 'test'및 'train'파일로 구분됩니다.

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

그리고 그것은 파일에 포함 된 아주 작은 샘플 일뿐입니다.

나는이 데이터가 무엇을 의미하고 어떻게 해석 될 수 있는지 잘 모른다. 또한 데이터의 분석, 분류 및 클러스터링을 위해 어떤 도구를 사용해야합니까? 레이블을 포함 하여이 데이터를 Excel에 넣을 수있는 방법이 있습니까? 예를 들어 R 또는 python을 사용하여 샘플 데이터를 추출 하고이 작업을 수행합니까?

모든 힌트 / 팁을 주시면 감사하겠습니다.

답변:


8

데이터 세트 정의는 다음 페이지에 있습니다.

하단의 속성 정보

또는 ZIP 폴더 내부에 activity_labels라는 파일이 있으며 그 안에 열 머리글이 있습니다. README를주의 깊게 읽으십시오. 여기에는 좋은 정보가 있습니다. 명령을 .csv사용하여 R 로 파일을 쉽게 가져올 수 있습니다 read.csv.

예를 들어 파일 이름을 지정 samsungdata하면 R을 열고 다음 명령을 실행할 수 있습니다.

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

또는 이미 R의 작업 디렉토리 안에 있다면 다음을 실행할 수 있습니다.

data <- read.csv("samsungdata.csv", header = TRUE)

data데이터 세트를 호출하려는 이름으로 이름 을 변경할 수있는 위치


내가 참조. README 파일을 연구했지만 여전히 자체 데이터를 읽는 방법을 알 수는 없습니다. 예를 들어 train / X_train.txt '파일은 훈련 세트를 나타냅니다 (내가 게시 한 샘플 데이터는이 파일에서 가져옵니다).
Jakubee

데이터 세트가 다소 넓고 features.txt 파일 내에 나열된 행 당 561 개의 변수가있는 것 같습니다. 나는 그것이 당신이 말하는 것이라고 믿습니다.
MCP_infiltrator 13:27에

따라서 'features'파일의 각 변수는 'x-test.txt'파일의 각 열에 해당합니까?
Jakubee

그것이 내가 취하는 방법입니다. README에서 수집 할 수있는 것은 파일에 들어있는 것입니다.
MCP_infiltrator 14

@ 자쿠 비 네. 파일에는 561 개의 행 / 변수 이름이 있고 features.txt파일에는 561 개의 열이 있으며 X_train.txt각 변수마다 하나씩 있습니다.
Marco13

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.