«computer-vision» 태그된 질문

일반적으로 이미지 표현, 세분화, 시각적 개체 분류 및 이미지 처리 알고리즘과 관련된 질문입니다.

7
초보자를위한 신경망 참조 (교재, 온라인 강좌)
신경망을 배우고 싶습니다. 저는 전산 언어 학자입니다. 통계 머신 러닝 접근법을 알고 있으며 파이썬으로 코딩 할 수 있습니다. 나는 개념부터 시작하여 계산 언어학 관점에서 유용 할 수있는 인기있는 모델을 알고 있습니다. 참고 용으로 웹을 탐색하고 몇 권의 책과 자료를 찾았습니다. Ripley, Brian D. (1996) 케임브리지 패턴 인식 및 신경망 비숍, …

4
컴퓨터 비전과 컨볼 루션 신경망에서 번역 불일치 란 무엇입니까?
컴퓨터 비전에 대한 배경 지식이 없지만 이미지 처리 및 회선 신경망 관련 기사 및 논문을 읽을 때 끊임없이 translation invariance, 또는 이라는 용어에 직면합니다 translation invariant. 또는 컨볼 루션 작업이 제공하는 많은 것을 읽었 translation invariance습니까? !! 이것은 무엇을 의미 하는가? 나는 우리가 어떤 모양으로 이미지를 바꾸더라도 이미지의 실제 개념은 …

5
머신 러닝에서 계층 적 / 중첩 된 데이터를 처리하는 방법
예를 들어 내 문제를 설명하겠습니다. {나이, 성별, 국가, 지역, 도시}와 같은 속성이 주어진 개인의 소득을 예측한다고 가정합니다. 당신은 이와 같은 훈련 데이터 세트를 가지고 있습니다 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
가변 크기의 이미지를 컨볼 루션 신경망에 대한 입력으로 제공 할 수 있습니까?
물체 감지를 위해 컨볼 루션 신경망에 입력으로 가변 크기의 이미지를 제공 할 수 있습니까? 가능하다면 어떻게 할 수 있습니까? 그러나 이미지를 자르려고하면 이미지의 일부를 잃어 버리고 크기를 조정하려고하면 이미지의 선명도가 사라집니다. 이미지 선명도가 주요 고려 사항 인 경우 고유 네트워크 속성을 사용하는 것이 가장 좋다는 것을 의미합니까?

2
머신 러닝에서 에너지 최소화 란 무엇입니까?
나는 컴퓨터 비전의 잘못된 문제에 대한 최적화에 대해 읽고 있었고 Wikipedia의 최적화에 대한 아래의 설명을 보았습니다. 내가 이해하지 못하는 것은 왜 Computer Vision 에서이 최적화를 " 에너지 최소화 "라고 부르는가? 최적화 문제는 다음과 같이 나타낼 수 있습니다. 을 감안할 때 : 함수 일부 세트에서 실제 숫자f:A→Rf:A→Rf: A \to RAAA 구함 …

3
힌지 손실 대 물류 손실의 장단점
힌지 손실을 이용하여 정의 될 수있는 및 로그 손실로 정의 될 수 로그 ( 1 + EXP ( - Y I w T는 X I를 ) )max(0,1−yiwTxi)max(0,1−yiwTxi)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)log(1+exp(−yiwTxi))log(1+exp⁡(−yiwTxi))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) 다음과 같은 질문이 있습니다. 힌지 손실의 단점이 있습니까 (예 : http://www.unc.edu/~yfliu/papers/rsvm.pdf에 언급 된 특이 치에 민감 함 )? 하나와 다른 …

1
오 탐지 횟수를 줄이는 방법은 무엇입니까?
보행자 감지 라는 작업을 해결하려고 노력하고 있으며 사람, 부정-배경이라는 두 가지 범주의 긍정적 인 이진 clasifer를 훈련시킵니다. 데이터 세트가 있습니다. 긍정 수 = 3752 음수 = 3800 train \ test split 80 \ 20 % 및 RandomForestClassifier 양식 scikit-learn 을 매개 변수와 함께 사용합니다. RandomForestClassifier(n_estimators=100, max_depth=50, n_jobs= -1) 점수를 얻습니다 …

1
PR에 대해 하나의 값만있을 때 Precision-Recall 곡선을 형성하는 방법은 무엇입니까?
콘텐츠 기반 이미지 검색 시스템을 만드는 데이터 마이닝 할당이 있습니다. 5 마리의 동물 이미지가 20 개 있습니다. 총 100 개의 이미지가 있습니다. 내 시스템은 가장 관련성이 높은 10 개의 이미지를 입력 이미지로 반환합니다. 이제 Precision-Recall 곡선으로 시스템 성능을 평가해야합니다. 그러나 Precision-Recall 곡선의 개념을 이해하지 못합니다. 내 시스템이 고릴라 이미지에 대해 …


3
컨볼 루션 뉴럴 네트워크 스케일 감도
예를 들어, 사람의 사진을 기반으로 연령 추정기를 구축한다고 가정 해 봅시다. 아래에는 정장을 입은 두 사람이 있지만 첫 번째 사람은 두 번째 사람보다 젊습니다. (출처 : tinytux.com ) 이것을 의미하는 많은 특징, 예를 들어면 구조가 있습니다. 그러나 가장 눈에 띄는 특징은 머리 크기와 신체 크기 의 비율입니다 . (출처 : …

1
컨볼 루션 신경망 교육
현재 컨볼 루션 신경망을 사용하여 얼굴을 인식하는 얼굴 인식 소프트웨어를 개발 중입니다. 나의 독서에 기초하여, 나는 컨볼 루션 신경망이 가중치를 공유하여 훈련하는 동안 시간을 ​​절약 할 수 있다는 것을 모았다. 그러나 어떻게 역 전파 (backpropagation)를 조정하여 컨볼 루션 신경망에서 사용될 수 있습니까? 역 전파에서, 이와 유사한 공식을 사용하여 가중치를 훈련시킵니다. …

2
컨볼 루션 신경망이 다른 크기의 입력 이미지로 사용할 수 있습니까?
이미지 인식을 위해 컨볼 루션 네트워크를 만들고 있는데 크기가 다른 이미지를 입력 할 수 있는지 궁금합니다. 이 프로젝트에서 : https://github.com/harvardnlp/im2markup 그들은 말합니다 : and group images of similar sizes to facilitate batching 따라서 전처리 후에도 이미지의 크기는 여전히 다르므로 수식의 일부를 잘라 내지 않기 때문에 의미가 있습니다. 다른 크기를 사용하는 …

1
CNN에서 컨볼 루션 연산자의 수를 결정하는 방법은 무엇입니까?
CNN (Convolutional Neural Networks)을 사용한 객체 분류와 같은 컴퓨터 비전 작업에서 네트워크는 매력적인 성능을 제공합니다. 그러나 컨볼 루션 레이어에서 매개 변수를 설정하는 방법을 잘 모르겠습니다. 예를 들어, 그레이 스케일 이미지 ( 480x480) 인 제 1 컨볼 루션 레이어는와 같은 컨벌루션 연산자를 사용할 수 있으며 11x11x10, 여기서 숫자 10 은 컨볼 …

2
더 빠른 RCNN 고정
앵커링에 관해 이야기 할 때의 더 빠른 RCNN 논문에서 "참조 상자 피라미드"를 사용한다는 것은 무슨 의미입니까? 이것은 각 W * H * k 앵커 포인트에서 경계 상자가 생성된다는 의미입니까? 여기서 W = 너비, H = 높이 및 k = 종횡비의 수 * 숫자 스케일 종이 링크 : https://arxiv.org/abs/1506.01497

3
CNN (Convolutional Neural Networks)을 통해 불균형 데이터 세트를 분류하는 방법은 무엇입니까?
이진 분류 작업에서 불균형 데이터 세트가 있습니다. 양수 양 대 음수 양은 0.3 % 대 99.7 %입니다. 긍정과 부정 사이의 격차가 큽니다. MNIST 문제에 사용 된 구조로 CNN을 훈련하면 테스트 결과에서 높은 음수 비율이 나타납니다. 또한 훈련 오류 곡선은 처음에 몇 개의 에포크에서 빠르게 내려가지만 다음 에포크에서 동일한 값을 유지합니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.