«reliability» 태그된 질문

측정 값이 일관된 조건에서 유사한 결과를 생성하는 경우 측정의 안정성이 높다고합니다. 신뢰성과 유효성을 혼동하지 마십시오 (태그 위키 참조). 자체 태그 인터 레이터가있는 인터 레이터 안정성을 위해 사용하지 마십시오

1
코헨의 카파 분산 (및 표준 오차) 계산
카파 ( κκ\kappa ) 통계는 Cohen [1]에 의해 1960 년에 도입되어 두 평가자 간의 합의를 측정합니다. 그러나 그 차이는 꽤 오랫동안 모순의 원천이었습니다. 내 질문은 큰 샘플과 함께 사용할 최상의 분산 계산에 대한 것입니다. 나는 Fleiss [2]에 의해 테스트되고 검증 된 것이 올바른 선택이 될 것이라고 생각하는 경향이 있지만, 이것이 …

3
내 데이터는 어떤 분포를 따르나요?
1000 개의 구성 요소가 있고 이러한 로그에 몇 번의 로그 기록이 실패했는지 기록하고 실패를 기록 할 때마다 팀에서 문제를 해결하는 데 걸린 시간도 추적합니다. 요컨대,이 1000 개의 구성 요소 각각에 대한 복구 시간 (초)을 기록했습니다. 이 질문의 끝에 데이터가 제공됩니다. 나는이 모든 값을 가져다가 사용 R에 컬린과 프레이 그래프를 그린 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
Joel Spolsky의“Snark 사냥”은 유효한 통계 컨텐츠 분석 이후입니까?
최근에 커뮤니티 게시판을 읽고 있다면 StackExchange 네트워크의 CEO Joel Spolsky의 공식 StackExchange 블로그 게시물 인 Snark의 사냥 (Hunting of the Snark)을 보셨을 것입니다. 그는 외부 사용자의 관점에서 "친숙성"을 평가하기 위해 SE 의견 샘플에 대해 수행 된 통계 분석에 대해 설명합니다. 의견은 StackOverflow에서 무작위로 추출되었으며 컨텐츠 분석가는 저렴한 비용으로 작고 짧은 …

2
서수 또는 구간 데이터에 대한 평가자 간 신뢰도
서수 또는 구간 데이터에 가장 적합한 평가자 간 신뢰도 방법은 무엇입니까? "공동 계약 가능성"또는 "카파"는 명목 데이터 용으로 설계되었다고 생각합니다. "Pearson"및 "Spearman"을 사용할 수 있지만 주로 두 개의 평가자에 사용됩니다 (두 개 이상의 평가자에 사용할 수 있음). 서수 또는 구간 데이터 (예 : 세 개 이상의 평가자)에 적합한 다른 측정 …

2
설문지의 신뢰성 평가 : 차원, 문제가있는 항목 및 알파, 람다 6 또는 기타 색인 사용 여부?
실험에 참석 한 참가자의 점수를 분석하고 있습니다. 제품에 대한 참가자의 태도를 추정하기위한 6 가지 항목으로 구성된 설문지의 신뢰성을 추정하고 싶습니다. 모든 항목을 단일 스케일 (알파는 약 0.6)로 처리하고 한 번에 한 항목을 삭제하는 경우 (최대 알파는 약 0.72) Cronbach의 알파를 계산했습니다. 항목의 수와 기본 구성의 차원에 따라 알파가 과소 평가되거나 …

2
ROC 곡선 아래의 정확도 대 면적
진단 시스템을위한 ROC 곡선을 구성했습니다. 곡선 아래 면적은 비모수 적으로 AUC = 0.89 인 것으로 추정되었다. 최적의 임계 값 설정 (점 (0, 1)에 가장 가까운 지점)에서 정확도를 계산하려고 할 때 진단 시스템의 정확도는 0.8로 AUC보다 작습니다! 최적의 임계 값과는 다른 다른 임계 값 설정에서 정확도를 확인했을 때 정확도는 0.92와 같습니다. …

3
Cronbach의 알파 값에 대한 설명자는 어디에서 왔습니까 (예 : 불량, 우수)?
Cronbach의 알파 값을 다음과 같이 설명하는 것이 일반적입니다. α ≥ 0.9 우수 0.7 ≤ α <0.9 양호 0.6 ≤ α <0.7 허용 가능 0.5 ≤ α <0.6 나쁨 α <0.5 허용되지 않음 이 가치는 어디에서 오는가? 이것들을 설명하는 원본 연구 기사를 찾을 수 없습니다. 편집 : 나는 단지 컨벤션을 기반으로 …

4
신뢰할 수 없거나 혼란 스럽거나 잘못된 연구 또는 모델이 잘못 사용 된 공중 보건 정책 연구의 사례 연구는 무엇입니까?
데이터가 혼동되는 현재 공중 보건 문제에 대한 문헌 검토를 작성 중입니다. 공중 보건 정책 및 법률에서 무효 또는 혼란스러운 관계 또는 추론이 의도적으로 또는 잘못 사용 된 공중 보건 / 역학 교육에 사용되는 일반적인 역사적 사례 연구는 무엇입니까? 1960 년대 자동차 사망자 급증과 법에 의해 안전 벨트와 결국 에어백이 필요하다는 …

1
캐럿 glmnet vs cv.glmnet
glmnetwithin caret을 사용하여 최적의 람다를 검색 cv.glmnet하고 동일한 작업을 수행하는 것을 비교하는 데 많은 혼란이있는 것 같습니다 . 다음과 같은 많은 질문이 제기되었습니다. 분류 모델 train.glmnet 대 cv.glmnet? 캐럿과 함께 glmnet을 사용하는 올바른 방법은 무엇입니까? `caret`를 사용한 교차 유효성 검사`glmnet` 그러나 질문의 ​​재현 가능성으로 인한 답변이 없습니다. 첫 번째 질문에 …

2
이벤트 시간에 대한 불확실성을 가진 시계열의 이벤트에 대한 인터 레이터 신뢰성
시계열에서 이벤트를 식별하려고하는 여러 독립 코더가 있습니다.이 경우 대면 대화 비디오를보고 특정 비언어적 행동 (예 : 헤드 노드)을 찾고 각 시간과 범주를 코딩합니다. 행사. 이 데이터는 샘플링 속도가 높은 (30 프레임 / 초) 이산 시계열 또는 연속 시계열로 처리하기에 적당 할 수 있습니다. 인터-래터 신뢰도의 일부 측정 값을 계산하고 싶지만 …

2
설문지에서 쓸모없는 질문 식별
설문지를 개발 중입니다. 신뢰성과 유효성을 향상시키기 위해 통계적 방법을 사용하고 싶습니다. 답이 항상 같은 질문을 제거하고 싶습니다. 이는 거의 모든 참가자가 해당 질문에 대해 동일한 답변을 하였음을 의미합니다. 이제 내 질문은 : 사용 맥락과 무관하게 답이 항상 같은 쓸모없는 질문에 대한 기술적 용어는 무엇입니까? 그러한 질문을 식별하는 방법은 무엇입니까?

2
요인 분석, 내부 일관성 및 항목 반응 이론을 함께 사용하여 항목 수를 줄이는 방법은 무엇입니까?
나는 경험적으로 설문지를 개발하는 과정에 있으며이 예에서는 임의의 숫자를 사용하여 설명 할 것입니다. 문맥 상, 나는 불안 장애가있는 개인들에게서 일반적으로 확인되는 사고 패턴을 평가하는 것을 목표로하는 심리적 설문지를 개발하고 있습니다. 항목이 " 오븐이 꺼져 있는지 확인할 수 없기 때문에 오븐을 반복해서 확인해야합니다 "처럼 보일 수 있습니다 . 하나 또는 두 …

3
적합 곡선의 신뢰성?
적합 곡선의 불확실성 또는 신뢰성을 추정하고 싶습니다. 나는 그것이 무엇인지 모르기 때문에 내가 찾고있는 정확한 수학적 양을 의도적으로 언급하지 않습니다. 여기서 (에너지)는 종속 변수 (응답)이고 (볼륨)는 독립 변수입니다. 일부 재료 의 에너지-볼륨 곡선 를 찾고 싶습니다 . 그래서 나는 양자 화학 컴퓨터 프로그램을 사용하여 일부 샘플 볼륨 (플롯의 녹색 원)의 …

2
특이 치를 탐지하기위한 IQR의 정확도
프로세스의 실행 시간을 분석하는 스크립트를 작성 중입니다. 배포가 확실하지 않지만 프로세스가 "너무 오래"실행되고 있는지 알고 싶습니다. 지금까지 마지막 실행 시간 (n> 30)의 3 표준 편차를 사용했지만 데이터가 정상이 아닌 경우 (그렇지 않은 것으로 보이는 경우) 유용한 것을 제공하지 않는다고 들었습니다. 나는 다른 이상치 테스트를 발견했다. 사 분위 간 범위 (IQR …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.