«r» 태그된 질문

R은 통계 컴퓨팅, 생물 정보학, 시각화 및 일반 컴퓨팅을위한 무료 오픈 소스 프로그래밍 언어 및 소프트웨어 환경입니다. 원하는 출력과 함께 최소의 재현 가능한 예를 제공하십시오. 데이터에`dput ()`을 사용하고`library ()`호출로 기본이 아닌 모든 패키지를 지정하십시오. 데이터 또는 코드 용 그림을 포함하지 말고 들여 쓰기 된 코드 블록을 대신 사용하십시오. 통계 관련 질문은 https://stats.stackexchange.com을 사용하십시오.

13
대용량 (3.5GB) csv 파일을 트리밍하여 R로 읽어 오기
그래서 많은 세부 사항과 불완전한 행이있는 데이터 파일 (세미콜론으로 구분됨)이 있습니다 (Access 및 SQL이 질식하게 함). 40 년 동안 세그먼트, 하위 세그먼트 및 하위 하위 세그먼트 (총 ~ 200 개 요소)로 분류 된 카운티 수준 데이터 세트입니다. 요컨대, 그것은 거대하고 단순히 읽으려고하면 기억에 맞지 않을 것입니다. 그래서 내 질문은 이것이 …
87 r  csv 

4
R에 "붙여 넣기"로 변수 이름을 만드시겠습니까?
아래 참조 : paste("perf.a", "1", sep="") # [1] "perf.a1" 값을 할당하려면 perf.a1어떻게 해야 합니까? 나는 시도 as.name, as.symbol아무 소용와 등 : as.name(paste("perf.a", "1", sep="")) = 5 # Error in as.name(paste("perf.a", "1", sep = "")) = 5 : # target of assignment expands to non-language object as.symbol(paste("perf.a", "1", sep="")) = 5 …
87 r 

3
dplyr 조건부 값으로 변경
4 개의 열이있는 큰 데이터 프레임 ( "myfile")에서 처음 4 개의 열을 기준으로 조건부 값이있는 다섯 번째 열을 추가해야합니다. 주로 큰 데이터 세트의 속도 때문에 dplyr및로 답변을 선호합니다 mutate. 내 데이터 프레임은 다음과 같습니다. V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 3 1 …
87 r  dplyr  mutate 

9
ggplot2를 사용하여 축에 정수 값만 표시하는 방법
다음 플롯이 있습니다. library(reshape) library(ggplot2) library(gridExtra) require(ggplot2) data2<-structure(list(IR = structure(c(4L, 3L, 2L, 1L, 4L, 3L, 2L, 1L ), .Label = c("0.13-0.16", "0.17-0.23", "0.24-0.27", "0.28-1" ), class = "factor"), variable = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L), .Label = c("Real queens", "Simulated individuals" ), class = "factor"), value = …
87 r  ggplot2 



17
data.frame의 두 열 사이에 열 추가 (삽입)
a, b 및 c 열이있는 데이터 프레임이 있습니다. b와 c 사이에 새 열 d를 추가하고 싶습니다. cbind 를 사용하여 끝에 d를 추가 할 수 있다는 것을 알고 있지만 두 열 사이에 어떻게 삽입 할 수 있습니까?
87 r  dataframe  insert 

4
R에서 루프가 느린 이유는 무엇입니까?
루프가 느리고 R대신 벡터화 된 방식으로 작업을 수행해야 한다는 것을 알고 있습니다. 하지만 왜? 루프가 느리고 apply빠른 이유는 무엇 입니까? apply몇 가지 하위 기능을 호출합니다. 빠르지 않은 것 같습니다. 업데이트 : 죄송합니다. 질문이 잘못되었습니다. 벡터화와 apply. 내 질문은, "벡터화가 더 빠른 이유는 무엇입니까?"
87 performance  r  apply 

17
더미 변수 생성
R에서 다음 더미 변수를 생성하는 데 문제가 있습니다. 연간 시계열 데이터를 분석하고 있습니다 (기간 1948-2009). 두 가지 질문이 있습니다. 관찰 # 10, 즉 1957 년에 대한 더미 변수를 어떻게 생성합니까 (1957 년에 값 = 1이고 그렇지 않으면 0)? 1957 년 이전에 0이고 1957 년부터 2009 년까지 값 1을 취하는 더미 …
87 r  r-faq 

5
명명 된 문자형 벡터를 data.frame으로 변환
다음과 같이 xmlAttrs에서 반환 된 명명 된 문자 벡터가 있습니다. testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) 다음과 같은 데이터 프레임으로 변환하고 싶습니다. testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

5
data.table 열에서 텍스트 문자열 분할
CSV 파일의 데이터를 a로 읽은 data.table다음 한 열의 텍스트를 여러 새 열로 분할 하는 스크립트가 있습니다. 현재이 작업을 수행하기 위해 lapply및 strsplit함수를 사용 하고 있습니다. 예를 들면 다음과 같습니다. library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) # split PREFIX into new columns dt$PX = as.character(lapply(strsplit(as.character(dt$PREFIX), …
87 r  data.table 


2
밀리 초를 구문 분석하는 방법?
strptimeR에서 밀리 초로 타임 스탬프를 구문 분석하기 위해 또는 다른 함수를 어떻게 사용 합니까? time[1] # [1] "2010-01-15 13:55:23.975" strptime(time[1], format="%Y-%m-%d %H:%M:%S.%f") # [1] NA strptime(time[1], format="%Y-%m-%d %H:%M:%S") # [1] "2010-01-15 13:55:23"`

13
Apple (Inc.)에 대한 트윗과 사과 (과일)에 대한 트윗을 구분하는 모델을 구축하려면 어떻게해야합니까?
"apple"에 대한 50 개의 트윗은 아래를 참조하십시오. Apple Inc.에 대한 긍정적 인 일치 항목을 손으로 표시했습니다. 아래 1 개로 표시되어 있습니다. 다음은 몇 줄입니다. 1|“@chrisgilmer: Apple targets big business with new iOS 7 features http://bit.ly/15F9JeF ”. Finally.. A corp iTunes account! 0|“@Zach_Paull: When did green skittles change from lime to …

6
R에서 데이터 프레임의 첫 번째 행을 삭제하는 방법은 무엇입니까?
각각 1000 개가 넘는 행이있는 11 개의 열이있는 데이터 세트가 있습니다. 열은 V1, V2, V11 등으로 레이블이 지정되었습니다. "c"명령을 사용하여 이름을 더 유용한 것으로 대체했습니다. 행 1에도 각 열에 대한 레이블이 포함되어 있고 실제 데이터가 행 2에서 시작된다는 사실을 몰랐습니다. 행 1을 삭제하고 감소시키는 방법이 있습니까?
85 r  dataset 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.