«computer-vision» 태그된 질문

컴퓨터 비전은 이미지를 분석하고 이해하는 컴퓨터 과학의 하위 분야입니다. 여기에는 이미지 또는 분할 이미지의 얼굴과 같은 물체 감지가 포함됩니다.

2
PASCAL VOC Challenge의 탐지 작업에 대한 MAP를 계산하는 방법은 무엇입니까?
Pascal VOC 리더 보드의 감지 작업에 대한 mAP (평균 평균 정밀도)를 계산하는 방법은 무엇입니까? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 11 페이지 에서 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf 평균 정밀도 (AP). VOC2007 챌린지의 경우, 보간 평균 정밀도 (Salton and Mcgill 1986)를 사용하여 분류 및 탐지를 평가했습니다. 주어진 작업과 클래스에 대해 정밀도 / 리콜 곡선은 메서드의 순위 출력에서 ​​계산됩니다. …


3
mAP @ [. 5 : .95] 표기법의 의미는 무엇입니까?
감지를 위해 하나의 오브젝트 제안이 올바른지 판별하는 일반적인 방법은 IoU, IU ( Intersection over Union )입니다. 제안 된 객체 픽셀 세트 와 실제 객체 픽셀 세트를 가져 와서 다음을 계산합니다.BAAABBB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup B} 일반적으로 IoU> 0.5는 적중했음을 의미하며, 그렇지 않으면 실패했습니다. 각 클래스에 대해 진 …

3
컨볼 루션이 항상 홀수를 filter_size로 사용하는 이유
CNN (ConvNet)을 사용하여 출판 된 논문의 90-99 %를 살펴 보는 경우. 대부분은 홀수의 필터 크기를 사용 합니다 . {1, 3, 5, 7}은 가장 많이 사용됩니다. 이러한 상황은 몇 가지 문제로 이어질 수 있습니다.이 필터 크기의 경우 일반적으로 2의 패딩 (공통 패딩)으로 컨볼 루션 연산이 완벽하지 않으며 프로세스에서 input_field의 일부 가장자리가 …

3
파이썬에 적합한 기본 언어 모델이 있습니까?
응용 프로그램을 프로토 타이핑하고 있으며 생성 된 일부 문장의 난이도를 계산하려면 언어 모델이 필요합니다. 파이썬에서 쉽게 사용할 수있는 훈련 된 언어 모델이 있습니까? 간단한 것 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 일부 프레임 워크를 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
Dilated Convolution과 Deconvolution의 차이점은 무엇입니까?
이 두 컨볼 루션 작업은 현재 딥 러닝에서 매우 일반적입니다. 이 논문에서 확장 된 컨볼 루션 레이어에 대해 읽었습니다. WAVENET : 원시 오디오를위한 일반적인 모델 그리고 De-convolution은이 논문에있다 : 시맨틱 세그먼테이션을위한 완전 컨볼 루션 네트워크 둘 다 이미지를 업 샘플링하는 것처럼 보이지만 차이점은 무엇입니까?

5
감독되지 않은 이미지 분할
평면 테이블에 여러 객체가있는 이미지가 주어진 경우 각 객체에 대한 세그먼트 화 마스크의 출력이 필요한 알고리즘을 구현하려고합니다. CNN과 달리, 여기서 목표는 익숙하지 않은 환경에서 객체를 감지하는 것입니다. 이 문제에 대한 최선의 접근 방법은 무엇입니까? 또한 온라인으로 사용할 수있는 구현 예제가 있습니까? 편집 : 죄송합니다. 질문이 약간 오도되었을 수 있습니다. "친숙하지 …

2
이미지가 포토샵인지 확인하려면 어떻게해야합니까?
컨텐츠를 변경하기 위해 조작 된 JPG 파일을 확인하고 싶습니다. 내가 포토샵으로 생각하지 않은 것 : 자르기 자전 (스케일링) 이미지 해상도 스마트 폰의 자동 변경 내가 고려하는 것 : 이전 이미지의 일부 위에 새 이미지 추가 이미지 일부의 텍스트 변경 어떻게 자동으로 확인할 수 있습니까? (그리고 : 바로 사용할 수있는 라이브러리가 …

1
컨벌루션 레이어의 매개 변수 수
에서 이 많이 인용 논문 , 저자는 체중 매개 변수의 수에 대한 다음의 설명을 제공합니다. 왜 그런지 잘 모르겠습니다49씨249C249C^2매개 변수. 나는 그것이 있어야한다고 생각49 C49C49C 각각의 이후 씨CC 입력 채널은 동일한 필터를 공유합니다. 494949 매개 변수.

2
탈락과 다른 정규화를 조사하는 연구가 있습니까?
신경망에 대한 정규화 방법의 차이, 바람직하게는 다른 도메인 (또는 적어도 다른 데이터 세트)에 대한 차이점을 보여주는 논문이 있습니까? 나는 현재 대부분의 사람들이 컴퓨터 비전에서 정규화를 위해 드롭 아웃만을 사용하는 것처럼 보이기 때문에 묻고 있습니다. 다른 정규화 방법을 사용해야하는 이유가 있는지 확인하고 싶습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.