«dataset» 태그된 질문

이 사이트에서 데이터 세트 요청이 주제를 벗어났습니다. 데이터 세트 작성, 처리 또는 유지 보수와 관련된 질문에이 태그를 사용하십시오.

14
대규모 데이터 세트가 가설 ​​검정에 적합하지 않습니까?
A의 최근 기사 의 Amstat 뉴스 을 선언합니다 - 저자 (마크 반 데르 Laan와 세리 로즈) 우리는 충분히 큰 표본 크기에 대한, 아니 효과의 귀무 가설이 참하는 모든 연구를 포함하여 사람이 알고 "고 말했다 통계적으로 유의 한 효과. " 글쎄, 나는 그것을 알지 못했다. 이것이 사실입니까? 가설 검정이 대규모 데이터 …

25
자유롭게 사용 가능한 데이터 샘플 찾기
나는 하위 집합의 특성을 알지 못한 채 집단의 하위 집단을 식별하고 분리하기 위해 데이터 세트를 분석하고 파싱하는 새로운 방법을 연구하고있다. 이 방법은 인공 데이터 샘플 (예 : 모집단의 하위 집합을 식별하고 분리하기 위해 특별히 작성된 데이터 세트)에서 충분히 잘 작동하지만 실제 데이터로 테스트하려고합니다. 내가 찾고있는 것은 무료로 사용할 수있는 (즉, …

6
필수 데이터 검사 테스트
내 직무에서 나는 종종 다른 사람들의 데이터 세트와 함께 일하고 비전문가들은 임상 데이터를 가져 와서 요약하고 통계 테스트를 수행하도록 도와줍니다. 내가 가지고있는 문제는 가져온 데이터 세트가 거의 항상 오타, 불일치 및 기타 모든 종류의 문제로 가득 차 있다는 것입니다. 다른 사람들이 들어오는 데이터 세트를 확인하려고하는 표준 테스트가 있는지 알고 싶습니다. …

8
특정 평균 및 표준 편차와 같은 특정 제약 조건을 충족하는 데이터를 시뮬레이션하는 방법은 무엇입니까?
이 질문은 메타 분석에 대한 나의 질문에 의해 동기가 부여됩니다 . 그러나 기존 게시 된 데이터 집합을 정확하게 미러링하는 데이터 집합을 만들려는 컨텍스트를 가르치는데도 유용하다고 생각합니다. 주어진 분포에서 무작위 데이터를 생성하는 방법을 알고 있습니다. 예를 들어 다음과 같은 연구 결과에 대해 읽은 경우 : 평균 102, 표준 편차 5.2 72의 …

3
R에서 패키지로 제공되는 데이터 API / 피드
편집 : 웹 기술 및 서비스 CRAN 작업보기 에는 R에서 사용 가능한 훨씬 포괄적 인 데이터 소스 및 API 목록이 포함되어 있습니다. 작업보기에 패키지를 추가하려는 경우 github에서 풀 요청을 제출할 수 있습니다 . 이미 R에 연결되어 있거나 설정하기 쉬운 다양한 데이터 피드 목록을 작성 중입니다. 여기 패키지의 초기 목록이 있는데, …
53 r  references  dataset 

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

9
수업 시간에 예제를 제공하는 작은 (실제) 데이터 세트?
초급 수준의 수업을 가르 칠 때, 내가 아는 교사들은 그들이 가르치는 방법을 예시하기 위해 몇 가지 숫자와 이야기를 발명하는 경향이 있습니다. 내가 선호하는 것은 실제 숫자로 실제 이야기를하는 것입니다. 그러나 이러한 사례는 매우 작은 데이터 집합과 관련이 있어야하므로 수동 계산이 가능합니다. 이러한 데이터 세트에 대한 제안은 매우 환영합니다. 작은 데이터 …

8
사람들이 데이터를 더 잘 관리하도록하려면 어떻게해야합니까?
직장 에는 매우 다양한 분야의 직원이 있으므로 다양한 형태로 데이터를 생성합니다. 결과적으로 각 팀은 데이터 저장을위한 자체 시스템을 개발했습니다. 일부는 Access 또는 SQL 데이터베이스를 사용합니다. 일부 팀 (내 공포)은 거의 전적으로 Excel 스프레드 시트에 의존합니다. 종종 데이터 형식이 프로젝트마다 다릅니다. 어떤 경우에는 그것을 '시스템'이라고 부르는 것이 너무 친절합니다. 이것이 수반하는 …

2
"빅 데이터"에서 올바른 결론을 도출하는 방법은 무엇입니까?
"빅 데이터"는 미디어 어디에나 있습니다. KDNuggets는 2012 년의 뜨거운 주제에 대한 설문 조사와 같이 "빅 데이터"가 2012 년에 가장 중요한 것이라고 말합니다 . 그러나 나는 여기에 깊은 우려가 있습니다. 빅 데이터를 사용하면 모든 것이 무엇이든 기뻐하는 것 같습니다 . 그러나 우리는 가설 검정 및 대표 표본 추출과 같은 모든 고전적인 …


5
매우 높은 차원 분류를위한 무료 데이터 세트 [닫기]
1000 개 이상의 피쳐 (또는 커브가 포함 된 경우 샘플 포인트) 로 분류 할 수 있는 무료 데이터 세트 는 무엇입니까 ? 무료 데이터 세트에 대한 커뮤니티 위키가 이미 있습니다. 자유롭게 사용 가능한 데이터 샘플 찾기 그러나 여기서는 보다 편리하게 사용할 수 있는 보다 집중적 인 목록을 작성하는 것이 좋으며 …

5
선형 회귀 데이터에 여러 개의 혼합 선형 관계가 포함되어 있으면 어떻게됩니까?
수선화가 다양한 토양 조건에 어떻게 반응하는지 연구하고 있다고 가정 해 봅시다. 토양의 pH와 수선화의 성숙한 높이에 대한 데이터를 수집했습니다. 선형 관계를 기대하고 있으므로 선형 회귀 분석을 실행합니다. 그러나 연구를 시작했을 때 인구가 실제로 두 종류의 수선화를 포함하고 있다는 사실을 알지 못했습니다. 각 수종은 토양 pH에 매우 다르게 반응합니다. 따라서 그래프에는 …


2
데이터 시각화 후 통계 테스트 수행-데이터 준설?
예제를 통해이 질문을 제안하겠습니다. 보스턴 주택 가격 데이터 세트와 같은 데이터 세트가 있고 연속적이고 범주 형 변수가 있다고 가정합니다. 여기에는 1에서 10까지의 "품질"변수와 판매 가격이 있습니다. 품질에 대한 컷오프를 (임의로) 생성하여 데이터를 "낮음", "중간"및 "고품질"주택으로 분리 할 수 ​​있습니다. 그런 다음 이러한 그룹을 사용하여 판매 가격의 히스토그램을 서로 비교할 수 …

3
많은 세트의 교차점 시각화
여러 세트의 교차점 겹침을 표시하는 데 적합한 시각화 모델이 있습니까? 나는 Venn 다이어그램과 같은 것을 생각하고 있지만 어떻게 든 10 개 이상의 많은 세트에 더 잘 빌려 줄 수 있습니다. Wikipedia는 더 높은 세트의 벤 다이어그램을 보여 주지만 4 세트의 다이어그램조차도 많이 사용됩니다. 데이터의 최종 결과에 대한 나의 추측은 많은 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.