«r» 태그된 질문

R은 통계 컴퓨팅, 생물 정보학 및 그래픽을위한 무료 오픈 소스 프로그래밍 언어 및 소프트웨어 환경입니다.

4
R : GPU의 기계 학습
훈련 속도를 향상시키기 위해 GPU를 사용할 수있는 R 용 머신 러닝 패키지가 있습니까? gputools라는 패키지가 gpu에서 코드를 실행할 수 있다는 것을 알지만 기계 학습을위한보다 완벽한 라이브러리를 찾고 있습니다.

1
주어진 텍스트에서 특정 문자 뒤의 문자열 제거
아래와 같은 데이터 세트가 있습니다. 문자 © 다음의 모든 문자를 제거하고 싶습니다. R에서 어떻게 할 수 있습니까? data_clean_phrase <- c("Copyright © The Society of Geomagnetism and Earth", "© 2013 Chinese National Committee ") data_clean_df <- as.data.frame(data_clean_phrase)
15 r  data-cleaning 

5
최신 R 및 / 또는 Python 라이브러리는 SQL을 더 이상 사용하지 않습니까?
데이터 처리에서 정리, 녹이는 것까지 SQL Server가 모든 작업의 ​​중추 인 사무실에서 근무하고 있습니다. 저의 동료는 들어오는 데이터를 표준화하여 보고서, 시각화 및 분석 프로젝트에서 사용할 수 있도록 복잡한 함수 및 저장 프로 시저를 작성하여 들어오는 데이터를 체계적으로 처리하는 데 전문적입니다. 여기서 시작하기 전에 가장 기본적인 쿼리를 작성하는 것 외에는 SQL에 …
14 python  r  data-cleaning  data  sql 

3
클레임 데이터의 과거 상태에서 다음 의학적 상태 예측
저는 현재 일부 실험실 및 약국 청구를 포함하는 대규모 건강 보험 청구 데이터를 사용하고 있습니다. 그러나 데이터 세트에서 가장 일관된 정보는 진단 (ICD-9CM)과 절차 코드 (CPT, HCSPCS, ICD-9CM)로 구성됩니다. 나의 목표는 : 만성 신장 질환과 같은 의학적 상태에 대해 가장 영향력있는 전구체 상태 (수용성)를 식별하십시오. 환자가 과거에 있었던 상태에 근거하여 …

1
몇 개의 LSTM 셀을 사용해야합니까?
사용해야하는 최소, 최대 및 "합리적인"양의 LSTM 셀과 관련된 경험 법칙 (또는 실제 규칙)이 있습니까? 특히 TensorFlow 및 속성의 BasicLSTMCell 과 관련이 num_units있습니다. 분류 문제가 다음과 같이 정의되었다고 가정하십시오. t - number of time steps n - length of input vector in each time step m - length of output vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

3
파이썬에 적합한 기본 언어 모델이 있습니까?
응용 프로그램을 프로토 타이핑하고 있으며 생성 된 일부 문장의 난이도를 계산하려면 언어 모델이 필요합니다. 파이썬에서 쉽게 사용할 수있는 훈련 된 언어 모델이 있습니까? 간단한 것 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 일부 프레임 워크를 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
표본 외 데이터 과적 합에 대해 100 % 모델 정확도가 있습니까?
cognitiveclass.ai에서 R 과정에 대한 기계 학습을 마쳤으며 randomforests를 실험하기 시작했습니다. R의 "randomForest"라이브러리를 사용하여 모델을 만들었습니다.이 모델은 좋거나 나쁜 두 클래스로 분류됩니다. 모델이 과적 합되면 자체 훈련 세트의 데이터에서는 잘 수행되지만 샘플에서 벗어난 데이터에서는 제대로 수행되지 않습니다. 내 모델을 훈련하고 테스트하기 위해 전체 데이터 세트를 섞어서 훈련 용 70 %와 테스트 …

1
Windows에서 R에 대한 GPU 가속 데이터 처리
현재 빅 데이터에 관한 논문을 작성 중이며 데이터 분석에 R을 많이 활용하고 있습니다. 게임상의 이유로 PC에 GTX1070이 있습니다. 따라서 강사가 수행하는 작업의 일부 처리 속도를 높이기 위해 사용할 수 있다면 정말 멋지다고 생각했지만 실제로는 쉽지 않습니다. gpuR, CUDA, Rtools 및 몇 가지 다른 비트와 밥을 설치했으며 예를 들어 게놈 표현식 …
11 r  gpu  parallel 

4
임의의 숲에서 과적 합을 피하는 방법?
임의의 포리스트에서 과적 합을 피하고 싶습니다. 이와 관련하여 mtry, nodesize 및 maxnodes 등을 사용하려고합니다. 이러한 매개 변수의 값을 선택하도록 도와 주시겠습니까? R을 사용하고 있습니다. 또한 가능한 경우 임의 포리스트 (R)에서 k- 폴드 크로스 유효성 검사를 사용하는 방법을 알려주십시오.

1
R의 MLE에 대한 피셔 득점 v / s 좌표 하강
R 기본 함수 glm()는 MLE에 Fishers Scoring glmnet을 사용하는 반면 좌표 하강 법을 사용하여 동일한 방정식을 해결하는 것으로 보입니다. Fisher Scoring이 다른 행렬 연산 외에도 2 차 미분 행렬을 계산하므로 좌표 강하는 Fisher Scoring보다 시간 효율적입니다. 좌표 하강은 O (np) 시간에 동일한 작업을 수행 할 수 있지만 수행 비용이 많이 …

3
다자간 시스템에서 선거 결과를 계산하기 위해 어떤 회귀를 사용합니까?
의회 선거 결과를 예측하고 싶습니다. 내 결과는 각 당사자가받는 %입니다. 둘 이상의 당사자가 있으므로 로지스틱 회귀는 실행 가능한 옵션이 아닙니다. 각 당사자에 대해 별도의 회귀를 만들 수 있지만 그 경우 결과는 서로 독립적입니다. 결과의 합이 100 %임을 보장하지는 않습니다. 어떤 회귀 (또는 다른 방법)를 사용해야합니까? 특정 라이브러리를 통해 R 또는 …

3
패턴 분석을위한 데이터 시각화 (언어 독립적이지만 R 선호)
패턴을 이해하기 위해 디스크 이미지에서 바이트를 플로팅하려고합니다. 디스크 테스트 프로그램에 의해이 패턴이 생성 된 것이 거의 확실하기 때문에 이것은 주로 학술적인 작업이지만 어쨌든 리버스 엔지니어링하고 싶습니다. 256 자 주기로 패턴이 정렬되어 있음을 이미 알고 있습니다. 이 정보를 시각화하는 두 가지 방법, 즉 각 픽셀의 색상이 문자의 ASCII 코드 인 16x16 …
11 r  visualization 

3
과학 컴퓨팅을위한 최고의 언어
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 대부분의 언어에는 몇 가지 과학 컴퓨팅 라이브러리가 있습니다. 파이썬은 Scipy Rust 있다 SciRust C++이 등 여러 가지 ViennaCL와Armadillo …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

4
자주 구매하는 품목 시각화
CSV 파일에 다음 구조의 데이터 세트가 삽입되어 있습니다. Banana Water Rice Rice Water Bread Banana Juice 각 행은 함께 구매 한 품목의 모음을 나타냅니다. 예를 들어, 첫 번째 행은 항목 것을 나타내고 Banana, Water와 Rice함께 구입 하였다. 다음과 같은 시각화를 만들고 싶습니다. 이것은 기본적으로 그리드 차트이지만 입력 구조를 읽고 위와 …

2
ggvis 대 ggplot2 + Shiny; 대화 형 시각화를 위해 어느 것을 선택해야합니까?
CrossValidated에도 비슷한 질문이 있으며 답변을 읽었습니다. 내 질문은 조금 다릅니다. 나는 단순히 내 데이터를 시각화하고 싶지 않으며 실제로 시각화하려는 것은 두 패키지로 시각화하기가 쉽지 않습니다. 플롯에 두 개의 점 세트 ( 좌표)가 있습니다. 가장자리를 추가하고 그래프와 비슷하게 만들고 싶습니다. n 점이 있으면 문제의 본질에 따라 플롯 에 ( n / …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.