데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

1
Keras 모델이 배경을 인식하는 방법을 배우는 이유는 무엇입니까?
사전 훈련 된 모델을 사용하여 Pascal VOC2012에서 Deeplabv3 + 의이 Keras 구현 을 훈련하려고합니다 (이 데이터 세트에서도 훈련 됨). 정확도가 1.0으로 빠르게 수렴되는 이상한 결과를 얻었습니다. 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch 2/3 5/5 [==============================] - 77s 15s/step …


2
주어진 단어를 이름, 휴대폰 번호, 주소, 이메일, 주, 카운티, 도시 등으로 분류하는 데 사용되는 기계 / 딥 러닝 / nlp 기술
단어 또는 문자열 집합을 스캔하고 기계 학습 또는 딥 러닝을 사용하여 이름, 휴대폰 번호, 주소, 도시, 주, 국가 및 기타 엔티티로 분류 할 수있는 지능형 모델을 생성하려고합니다. 나는 접근법을 찾았지만 불행히도 취할 접근법을 찾지 못했습니다. 나는 끈이 이름인지 도시인지를 예측하기 위해 bag of words 모델과 gloved word embedding을 사용해 보았습니다. …

1
옥타브에서 S 자형 함수를 어떻게 구현합니까? [닫은]
폐쇄되었습니다 . 이 질문에는 세부 사항이나 명확성 이 필요 합니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 세부 사항을 추가하고 문제점을 명확하게하십시오 . 휴일 2 년 전 . 따라서 시그 모이 드 함수가 hθ (x) = g (θ ^ (T) x)로 정의되어 있다면 g …

1
멀티 클래스 데이터 세트에서 분류가 잘못되는 불균형 데이터
39 개의 카테고리 / 클래스와 850 만 개의 레코드가있는 텍스트 분류 작업을하고 있습니다. (향후 데이터 및 카테고리가 증가 할 것입니다). 내 데이터의 구조 또는 형식은 다음과 같습니다. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary Camera:12 …

2
올바른 지점을 선택하기 위해 적용 할 알고리즘
아래 그림은 원점 주위의 7 점을 보여줍니다. 그 중 하나는 규칙과 경험에 따라 인간에 의해 선택되었으며 빨간색 (왼쪽 아래 사분면에있는 것)으로 표시됩니다. 이제 우리는이 포인트 세트 중 1000 개가 넘고 각 세트마다 인간이 단일 포인트를 선택했습니다. 이 조건은 모든 세트에 적용됩니다. 각 세트는 약 3-10 포인트 특이 치가 없습니다 점은 …

1
별도의 파이썬 프로세스를 통해 HDF5를 안정적으로 쓰고 동시에 읽을 수 있습니까?
시간이 지남에 따라 라이브 데이터를이 프로젝트의 전체 데이터 세트가 포함 된 단일 HDF5 파일로 기록하는 스크립트를 작성 중입니다. Python 3.6으로 작업 중이며 click데이터를 수집하는 데 사용하는 명령 줄 도구를 만들기로 결정했습니다 . 데이터 수집 스크립트가 HDF5 파일에 쓰고 있는데 아직 ML 응용 프로그램이 동일한 파일에서 데이터를 읽으려고하면 어떻게 될까요? HDF5 …
9 python  dataset 

1
클래스 중 하나가 다른 클래스 중 하나에 의해 정의되지 않은 분류 문제에 어떻게 접근합니까?
세 가지 수업에 관심이 있다고 가정 해 봅시다. 씨1c1c_1, 씨2c2c_2, 씨삼c3c_3. 그러나 내 데이터 세트에는 실제로 몇 가지 실제 클래스가 더 있습니다.(씨제이)엔j = 4(cj)j=4n(c_j)_{j=4}^n. 확실한 대답은 새로운 클래스를 정의하는 것입니다 씨^4c^4\hat c_4 그것은 모든 클래스를 참조 cjcjc_j, j>3j>3j>3 그러나 나는 샘플이 있기 때문에 이것이 좋은 생각이 아니라고 생각합니다. c^4c^4\hat c_4 …

2
“깊은 노드의 정리”: 대칭 제약 조건 구축
고유 한 대칭을 가져야하는 학습 문제가있는 경우 학습 문제를 대칭 제약 조건에 적용하여 학습을 향상시키는 방법이 있습니까? 예를 들어 이미지 인식을하는 경우 2D 회전 대칭을 원할 수 있습니다. 이미지의 회전 된 버전이 원본과 동일한 결과를 가져야 함을 의미합니다. 또는 틱택 토 게임을 배우는 경우 90도 회전하면 동일한 게임 플레이가 가능합니다. …

4
다변량 시계열 분류
약 40 차원의 시계열 (8 점)으로 구성된 일련의 데이터가 있습니다 (따라서 각 시계열은 8 x 40입니다). 해당 출력 (범주에 가능한 결과)은 0 또는 1입니다. 여러 차원의 시계열 분류기를 설계하는 가장 좋은 방법은 무엇입니까? 저의 초기 전략은 해당 시계열에서 각 차원의 평균, 표준, 최대 변동을 추출하는 것이 었습니다. RandomTreeForest를 훈련시키는 데 …

2
CNN을 자동 인코더로 훈련시키는 것이 합리적입니까?
EEG 데이터를 분석하는 작업을하며 결국 분류해야합니다. 그러나, 기록을위한 라벨을 얻는 것은 다소 비싸서, 상당히 많은 양의 라벨링되지 않은 데이터를 더 잘 활용하기 위해 감독되지 않은 접근법을 고려하게되었습니다. 이것은 자연스럽게 쌓인 자동 엔코더를 고려하게하는 좋은 아이디어입니다. 그러나 어떤 종류의 필터링은 일반적으로 EEG에 매우 유용한 접근법이며, 고려 된 에포크 (epoch)는 전체적으로가 아니라 …


3
하이퍼 파라미터 튜닝 기준 테스트 데이터 및 모델 선택 기반 검증 데이터를 수행 한 후 전체 데이터에 대해 최종 모델을 학습하지 않는 이유는 무엇입니까?
전체 데이터에서 나는 훈련 + 테스트 + 검증을 의미합니다. 유효성 검사 데이터를 사용하여 하이퍼 파라미터를 수정하고 테스트 데이터를 사용하여 모델을 선택하면 전체 데이터에 대해 모델을 학습하여 모델을 학습하는 것보다 매개 변수를 더 잘 학습하는 것이 좋습니다. 열차 데이터

1
컨벌루션 레이어의 매개 변수 수
에서 이 많이 인용 논문 , 저자는 체중 매개 변수의 수에 대한 다음의 설명을 제공합니다. 왜 그런지 잘 모르겠습니다49씨249C249C^2매개 변수. 나는 그것이 있어야한다고 생각49 C49C49C 각각의 이후 씨CC 입력 채널은 동일한 필터를 공유합니다. 494949 매개 변수.

3
클래식 CV 템플릿 일치에 대한 육안 검사 작업에 컨볼 루션 NN을 사용하는 이유는 무엇입니까?
우리가 작업하고있는 프로젝트를 바탕으로 흥미로운 토론을했습니다. 왜 템플릿 매칭 알고리즘보다 CNN 육안 검사 시스템을 사용합니까? 배경 : 특정 유형의 물체가 "깨지거나"결함이 있는지 여부를 감지하는 간단한 CNN 비전 시스템 (웹캠 + 랩톱)의 데모를 보여주었습니다.이 경우에는 PCB 회로 보드입니다. 내 CNN 모델에는 정적 배경에서 적절하고 파손 된 회로 기판 (각각 약 100 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.