프로그램 작성 r

13

그래서 많은 세부 사항과 불완전한 행이있는 데이터 파일 (세미콜론으로 구분됨)이 있습니다 (Access 및 SQL이 질식하게 함). 40 년 동안 세그먼트, 하위 세그먼트 및 하위 하위 세그먼트 (총 ~ 200 개 요소)로 분류 된 카운티 수준 데이터 세트입니다. 요컨대, 그것은 거대하고 단순히 읽으려고하면 기억에 맞지 않을 것입니다. 그래서 내 질문은 이것이 …

87 r csv

4

R에 "붙여 넣기"로 변수 이름을 만드시겠습니까?

아래 참조 : paste("perf.a", "1", sep="") # [1] "perf.a1" 값을 할당하려면 perf.a1어떻게 해야 합니까? 나는 시도 as.name, as.symbol아무 소용와 등 : as.name(paste("perf.a", "1", sep="")) = 5 # Error in as.name(paste("perf.a", "1", sep = "")) = 5 : # target of assignment expands to non-language object as.symbol(paste("perf.a", "1", sep="")) = 5 …

87 r

3

dplyr 조건부 값으로 변경

4 개의 열이있는 큰 데이터 프레임 ( "myfile")에서 처음 4 개의 열을 기준으로 조건부 값이있는 다섯 번째 열을 추가해야합니다. 주로 큰 데이터 세트의 속도 때문에 dplyr및로 답변을 선호합니다 mutate. 내 데이터 프레임은 다음과 같습니다. V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 3 1 …

87 r dplyr mutate

9

ggplot2를 사용하여 축에 정수 값만 표시하는 방법

다음 플롯이 있습니다. library(reshape) library(ggplot2) library(gridExtra) require(ggplot2) data2<-structure(list(IR = structure(c(4L, 3L, 2L, 1L, 4L, 3L, 2L, 1L ), .Label = c("0.13-0.16", "0.17-0.23", "0.24-0.27", "0.28-1" ), class = "factor"), variable = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L), .Label = c("Real queens", "Simulated individuals" ), class = "factor"), value = …

87 r ggplot2

8

R의 데이터에 부드러운 곡선을 맞추는 방법은 무엇입니까?

에서 부드러운 곡선을 그리려고합니다 R. 다음과 같은 간단한 장난감 데이터가 있습니다. > x [1] 1 2 3 4 5 6 7 8 9 10 > y [1] 2 4 6 8 7 12 14 16 18 20 이제 표준 명령으로 플롯하면 당연히 울퉁불퉁하고 날카 로워 보입니다. > plot(x,y, type='l', lwd=2, …

87 r plot curve-fitting

6

문자열에서 문자의 위치 찾기

문자열에서 문자의 위치를 찾고 싶습니다. 말하다: string = "the2quickbrownfoxeswere2tired" 함수를 반환 4하고 -s 24의 문자 위치를 .2string

87 regex string r

17

data.frame의 두 열 사이에 열 추가 (삽입)

a, b 및 c 열이있는 데이터 프레임이 있습니다. b와 c 사이에 새 열 d를 추가하고 싶습니다. cbind 를 사용하여 끝에 d를 추가 할 수 있다는 것을 알고 있지만 두 열 사이에 어떻게 삽입 할 수 있습니까?

87 r dataframe insert

4

R에서 루프가 느린 이유는 무엇입니까?

루프가 느리고 R대신 벡터화 된 방식으로 작업을 수행해야 한다는 것을 알고 있습니다. 하지만 왜? 루프가 느리고 apply빠른 이유는 무엇 입니까? apply몇 가지 하위 기능을 호출합니다. 빠르지 않은 것 같습니다. 업데이트 : 죄송합니다. 질문이 잘못되었습니다. 벡터화와 apply. 내 질문은, "벡터화가 더 빠른 이유는 무엇입니까?"

87 performance r apply

17

더미 변수 생성

R에서 다음 더미 변수를 생성하는 데 문제가 있습니다. 연간 시계열 데이터를 분석하고 있습니다 (기간 1948-2009). 두 가지 질문이 있습니다. 관찰 # 10, 즉 1957 년에 대한 더미 변수를 어떻게 생성합니까 (1957 년에 값 = 1이고 그렇지 않으면 0)? 1957 년 이전에 0이고 1957 년부터 2009 년까지 값 1을 취하는 더미 …

87 r r-faq

5

명명 된 문자형 벡터를 data.frame으로 변환

다음과 같이 xmlAttrs에서 반환 된 명명 된 문자 벡터가 있습니다. testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) 다음과 같은 데이터 프레임으로 변환하고 싶습니다. testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

87 r dataframe vector type-conversion

5

data.table 열에서 텍스트 문자열 분할

CSV 파일의 데이터를 a로 읽은 data.table다음 한 열의 텍스트를 여러 새 열로 분할 하는 스크립트가 있습니다. 현재이 작업을 수행하기 위해 lapply및 strsplit함수를 사용 하고 있습니다. 예를 들면 다음과 같습니다. library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) # split PREFIX into new columns dt$PX = as.character(lapply(strsplit(as.character(dt$PREFIX), …

87 r data.table

5

R에서 상관 행렬을 어떻게 만들 수 있습니까?

동일한 유형의 데이터 세트가 92 개 있습니다. 가능한 두 조합에 대한 상관 행렬을 만들고 싶습니다. 즉, 92 x92의 행렬을 원합니다. 요소 (ci, cj)는 ci와 cj 사이의 상관이어야합니다. 어떻게하나요?

86 r matrix visualization correlation

2

밀리 초를 구문 분석하는 방법?

strptimeR에서 밀리 초로 타임 스탬프를 구문 분석하기 위해 또는 다른 함수를 어떻게 사용 합니까? time[1] # [1] "2010-01-15 13:55:23.975" strptime(time[1], format="%Y-%m-%d %H:%M:%S.%f") # [1] NA strptime(time[1], format="%Y-%m-%d %H:%M:%S") # [1] "2010-01-15 13:55:23"`

86 r datetime time-series strptime

13

Apple (Inc.)에 대한 트윗과 사과 (과일)에 대한 트윗을 구분하는 모델을 구축하려면 어떻게해야합니까?

"apple"에 대한 50 개의 트윗은 아래를 참조하십시오. Apple Inc.에 대한 긍정적 인 일치 항목을 손으로 표시했습니다. 아래 1 개로 표시되어 있습니다. 다음은 몇 줄입니다. 1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account! 0|“@Zach_Paull: When did green skittles change from lime to …

85 java python r machine-learning classification

6

R에서 데이터 프레임의 첫 번째 행을 삭제하는 방법은 무엇입니까?

각각 1000 개가 넘는 행이있는 11 개의 열이있는 데이터 세트가 있습니다. 열은 V1, V2, V11 등으로 레이블이 지정되었습니다. "c"명령을 사용하여 이름을 더 유용한 것으로 대체했습니다. 행 1에도 각 열에 대한 레이블이 포함되어 있고 실제 데이터가 행 2에서 시작된다는 사실을 몰랐습니다. 행 1을 삭제하고 감소시키는 방법이 있습니까?

85 r dataset

«r» 태그된 질문