«r» 태그된 질문

R은 통계 컴퓨팅, 생물 정보학 및 그래픽을위한 무료 오픈 소스 프로그래밍 언어 및 소프트웨어 환경입니다.

1
Hartigan-Wong k-means 방법 및 기타 알고리즘의 수렴
나는 주로 언어 stats패키지로 구현되는 다른 k- 평균 군집 알고리즘을 이해하려고 노력했다 R. Lloyd의 알고리즘과 MacQueen의 온라인 알고리즘을 이해합니다. 내가 이해하는 방법은 다음과 같습니다. 로이드의 알고리즘 : 처음에는 'k'군집의 중심으로 작용할 'k'임의 관측치가 선택됩니다. 그런 다음 중심이 수렴 할 때까지 다음 단계가 반복됩니다. 각 관측치와 선택된 중심 사이의 유클리드 거리가 …
10 r  clustering  k-means 

2
R의 데이터 과학을위한 소프트웨어 테스트
파이썬 코드를 테스트 할 때, 특히 다른 모듈이나 다른 코드와 통합해야 할 때 종종 코, 톡스 또는 단위 테스트를 사용합니다. 그러나 이제 ML 모델링 및 개발에 파이썬보다 R을 더 많이 사용했습니다. 나는 실제로 R 코드를 테스트하지 않는다는 것을 깨달았습니다 (더 중요한 것은 실제로 어떻게 잘하는지 모르겠습니다). 그래서 제 질문은 파이썬에서 …

5
R 용 LSTM 또는 기타 RNN 패키지
텍스트와 같은 셰익스피어를 생산하는 LSTM 모델에서 인상적인 결과를 보았습니다. R에 LSTM 패키지가 존재하는지 궁금합니다 .Google에서 검색했지만 Python 및 Julia에 대한 패키지 만 찾았습니다. (이러한 프로그램이 R보다 선호되는 이유를 설명하는 성능 문제가있을 수 있습니다.) R의 LSTM (또는 최소한 RNN) 패키지에 대해 알고 있습니까? 존재하는 경우 사용하기위한 자습서가 있습니까?
10 r  neural-network  rnn 

1
R의 그래프에 대한 라이브러리 (라벨 전파 알고리즘 / 자주 그래프 마이닝)
문제에 대한 일반적인 설명 일부 정점이 3 또는 4 개의 가능한 값이있는 유형으로 레이블이 지정된 그래프가 있습니다. 다른 정점의 경우 유형을 알 수 없습니다. 내 목표는 레이블이없는 정점의 유형을 예측하기 위해 그래프를 사용하는 것입니다. 가능한 프레임 워크 나는 문학의 내 독서에 따라 라벨 전파 문제의 일반적인 프레임 워크로이 맞는 의심 …

4
R에서 서수 회귀 학습?
프로젝트를 진행 중이며 속도를 높이려면 리소스가 필요합니다. 데이터 세트는 30여 가지 변수에 대한 약 35000 개의 관측치입니다. 변수의 약 절반은 여러 가지 가능한 값을 갖는 범주 형입니다. 예를 들어 범주 형 변수를 더미 변수로 분할하면 30 개가 넘는 변수가 있습니다. 그러나 아마도 아마도 최대 몇 백입니다. (n> p). 우리가 예측하고자하는 …

3
R의 메모리 제약은 무엇입니까?
리뷰어는 “ Applied Predictive Modeling ”을 검토하면서 다음 과 같이 말합니다 . 통계 학습 (SL) 교육학에 대한 한 가지 비판은 다른 모델링 기법의 평가에서 계산 성능 고려 사항이 없다는 것입니다. SL은 부트 스트랩과 모델의 튜닝 / 테스트를위한 교차 검증에 중점을 두어 계산 집약적입니다. 그에 더하여 bagging 및 boosting과 같은 기술에 …
10 apache-hadoop  r 

1
R을 사용하여 의사 결정 트리를 작성할 때 데이터를 정규화해야합니까?
따라서 이번 주 데이터 세트에는 14 개의 속성이 있으며 각 열의 값은 매우 다릅니다. 한 열의 값은 1 미만이고 다른 열의 값은 3 자리에서 4 자리 숫자입니다. 지난 주에 정규화를 배웠으며 값이 매우 다른 경우 데이터를 정규화해야하는 것으로 보입니다. 의사 결정 트리의 경우도 마찬가지입니까? 확실하지 않지만 정규화가 동일한 데이터 세트의 …
10 r  beginner 

3
Amazon EC2의 R 임의 포리스트 오류 : 5.4Gb 크기의 벡터를 할당 할 수 없습니다
randomForest()약 20 개의 예측 변수와 600K 행이있는 1000 개의 나무와 데이터 프레임을 사용하여 R의 임의 포리스트 모델을 훈련 하고 있습니다. 내 랩톱에서는 모든 것이 잘 작동하지만 amazon ec2로 이동하고 같은 것을 실행하면 오류가 발생합니다. Error: cannot allocate vector of size 5.4 Gb Execution halted c3.4xlarge인스턴스 유형을 사용하고 있기 때문에 꽤 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.