데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A


2
이미지가 포토샵인지 확인하려면 어떻게해야합니까?
컨텐츠를 변경하기 위해 조작 된 JPG 파일을 확인하고 싶습니다. 내가 포토샵으로 생각하지 않은 것 : 자르기 자전 (스케일링) 이미지 해상도 스마트 폰의 자동 변경 내가 고려하는 것 : 이전 이미지의 일부 위에 새 이미지 추가 이미지 일부의 텍스트 변경 어떻게 자동으로 확인할 수 있습니까? (그리고 : 바로 사용할 수있는 라이브러리가 …

4
PCA는 기계 학습 알고리즘으로 간주됩니까
주요 구성 요소 분석은 차원 축소 기술입니다. 즉, 10 개의 입력 기능이 주어지면 원래 기능의 직교 및 선형 변환 인 더 적은 수의 독립적 인 기능이 생성됩니다. 가요 PCA자체 학습 알고리즘으로 간주하거나 데이터 전처리 단계에 의해.

3
GPS 좌표 (위도 및 경도)를 선형 모델의 피쳐로 사용할 수 있습니까?
많은 기능 중에서 GPS 좌표 (위도 및 경도)를 포함하는 데이터 세트가 있습니다. 이 데이터 세트를 사용하여 다음과 같은 문제를 탐색하고 싶습니다. (1) ETA를 계산하여 시작 지점과 끝 지점 사이를 이동합니다. 및 (2) 특정 지점에 대한 범죄의 양을 추정. 선형 회귀 모델을 사용하고 싶습니다. 그러나 이러한 GPS 좌표를 선형 모델에서 직접 …

2
L2보다 L1 정규화를 사용하는 이유는 무엇입니까?
손실 함수를 사용하여 선형 회귀 모델을 수행하는 이유는 무엇입니까? 엘1엘1L_1 대신에 엘2엘2L_2 정규화? 과적 합을 방지하는 것이 더 낫습니까? 결정적입니까 (그래서 항상 독특한 솔루션입니까)? 희소 모델을 생성하기 때문에 기능 선택이 더 낫습니까? 기능들 사이에 가중치가 분산됩니까?


2
숨겨진 레이어를 2 개만 사용하여 숫자 정렬
Ilya Sutskever와 Quoc Le의 신경망을 이용한 시퀀스 학습 의 초석 논문을 읽고 있습니다. 첫 페이지에는 다음과 같이 간단히 언급되어 있습니다. A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size 숨겨진 레이어를 2 개만 사용하여 숫자를 …

1
가장 가까운 이웃이 t-SNE와 관련이 있습니까?
여기에 대한 답변에 따르면 t-SNE의 치수는 의미가 없으며 점 사이 의 거리는 유사성의 척도가 아닙니다 . 그러나 t-SNE 공간에서 가장 가까운 이웃을 기반으로 한 점에 대해 말할 수 있습니까? 정확히 동일한 점이 군집화되지 않은 이유에 대한이 대답 은 점 간의 거리 비율이 낮은 차원 표현과 높은 차원 표현간에 유사하다는 것을 …
10 tsne 

2
많은 기능으로 로지스틱 회귀를 수행하는 방법은 무엇입니까?
로지스틱 회귀에 대한 이진 클래스 문제가있는 각 샘플에 대해 330 개의 샘플과 27 개의 기능이있는 데이터 세트가 있습니다. "10이면 규칙"에 따르면 각 기능을 포함하려면 최소한 10 개의 이벤트가 필요합니다. 그럼에도 불구하고 나는 긍정적 인 클래스 20 %와 부정적인 클래스 80 %의 불균형 데이터 세트를 가지고 있습니다. 이로 인해 70 개의 …

4
함수가 매끄럽다면 왜 그라데이션 하강 속도가 빨라 집니까?
이제 "Scikit-Learn 및 TensorFlow를 사용한 실습 머신 러닝" 이라는 책을 읽었으며 11 장에는 ELU (지수 적 ReLU)에 대한 설명이 있습니다. 셋째,이 기능은 z = 0을 포함하여 모든 곳에서 부드럽습니다. z = 0만큼 좌우로 튀지 않기 때문에 그라데이션 하강 속도를 높이는 데 도움이됩니다. z수단은 상기 그래프에서 X 축. z < 0선에 …

2
word2vec의 기능 매트릭스는 무엇입니까?
저는 신경망의 초보자이며 현재 word2vec 모델을 탐색하고 있습니다. 그러나 기능 매트릭스가 정확히 무엇인지 이해하기가 어렵습니다. 첫 번째 행렬은 주어진 단어에 대한 one-hot 인코딩 벡터라는 것을 이해할 수 있지만 두 번째 행렬은 무엇을 의미합니까? 보다 구체적으로, 이들 각각의 값 (즉, 17, 24, 1 등)은 무엇을 의미합니까?

1
영어 문장의 복잡성을 결정하는 방법?
사람들이 제 2 언어로 영어를 배우도록 돕기 위해 앱을 개발 중입니다. 추가 문맥을 제공함으로써 문장이 언어를 배우는 데 도움이된다는 것을 확인했습니다. 나는 60 명의 학생들로 구성된 작은 교실에서 작은 연구를 수행함으로써 그렇게했습니다. 다양한 영어 단어 (Barrons'800 단어 및 1000 개의 가장 일반적인 영어 단어 포함)에 대해 Wikipedia에서 수십만 문장을 채굴했습니다. …


1
다른 파이썬 커널간에 DataFrame을 다시로드하지 마십시오.
변수 (큰 테이블 / 데이터 프레임)를 메모리에 유지하고 여러 ipython 노트북에서 공유하는 방법이 있습니까? MATLAB의 지속적 변수와 개념적으로 유사한 것을 찾고 있습니다. 여러 개별 편집기 (노트북)에서 사용자 정의 함수 / 라이브러리를 호출하고 해당 외부 함수가 일부 결과 (또는 큰 테이블)를 캐시 할 수 있습니다. 주로 새로운 분석을 시작할 때마다 약 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.