데이터 과학

데이터 과학 전문가, 기계 학습 전문가 및 현장 학습에 관심이있는 전문가를위한 Q & A

3
복잡한 레이더 차트는 어떻게 만듭니 까?
따라서 다음과 같은 플레이어 프로파일 레이더 차트 를 만들고 싶습니다. 각 변수의 척도가 다를뿐만 아니라 'dispossessed'통계와 같은 일부 통계에 대해서는 반대로 척도를 원합니다. 각 통계량에 대한 변동 척도에 대한 한 가지 해결책은 벤치 마크를 설정 한 다음 100 척도에서 점수를 계산하는 것입니다. 그러나 차트에 실제 숫자를 어떻게 표시합니까? 또한 일부 …

4
단일 이벤트가 종단 데이터에 영향을 미칠 가능성을 분석하기 위해 어떤 통계 모델을 사용해야합니까
특정 이벤트가 일부 세로 데이터에 영향을 줄 가능성을 분석하는 데 사용할 수식, 방법 또는 모델을 찾으려고합니다. Google에서 무엇을 검색해야하는지 파악하기가 어렵습니다. 시나리오 예는 다음과 같습니다. 매일 평균 100 명의 고객을 보유한 업체를 소유하고 있습니다. 하루는 매일 매장에 도착하는 대형 고객 수를 늘리기로 결정하여 매장 밖에서 미친 스턴트를 끌어 당겨 주목을받습니다. …

2
ReLU가 활성화 기능으로 사용되는 이유는 무엇입니까?
활성화 함수는 w * x + b신경망 에서 유형의 선형 출력에 비선형 성을 도입하는 데 사용됩니다 . 나는 sigmoid와 같은 활성화 기능을 직관적으로 이해할 수 있습니다. 나는 역 전파 동안 죽은 뉴런을 피하는 ReLU의 장점을 이해합니다. 그러나 출력이 선형 인 경우 ReLU가 활성화 기능으로 사용되는 이유를 이해할 수 없습니다. 비선형 …

1
"경험 재생"이란 무엇이며 그 이점은 무엇입니까?
Google의 DeepMind Atari 논문을 읽었으며 "경험 재생"개념을 이해하려고합니다. 경험 재생은 다른 많은 강화 학습 논문 (특히 AlphaGo 논문)에서 나오므로 어떻게 작동하는지 이해하고 싶습니다. 다음은 일부 발췌문입니다. 먼저, 우리는 데이터를 무작위 화하는 경험 재생이라고 불리는 생물학적으로 영감을 얻은 메커니즘을 사용하여 관찰 순서의 상관 관계를 제거하고 데이터 분포의 변화를 부드럽게합니다. 그런 다음이 …

4
“LSTM 셀의 단위 수”의 의미는 무엇입니까?
Tensorflow 코드에서 : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. 이것이 무엇을 의미하는지 이해할 수 없습니다. LSTM 셀의 단위는 무엇입니까? 입력, 출력 및 게이트를 잊습니까? 이것은 "Deep LSTM에 대한 반복 투영 레이어의 단위 수"를 의미합니다. 그렇다면 왜 이것을 "LSTM 셀의 유닛 수"라고합니까? LSTM 셀이란 무엇이고 …


3
알고리즘 개발을 확장하는 방법?
탐색 적 데이터 분석 및 알고리즘 개발에서 대부분의 시간은 시각화, 코드 작성, 작은 데이터 세트에서 실행, 반복의주기에 소비됩니다. 내가 데이터는 컴퓨터 비전 / 센서 융합 유형 인 경향이 있고, 알고리즘은 시력이 무겁고 (예를 들어 객체 감지 및 추적 등), 기성 알고리즘은이 맥락에서 작동하지 않습니다. 나는 이것이 많은 반복 (예 : …
18 algorithms 

4
메타 데이터로 텍스트 문서에 주석을 달는 방법은 무엇입니까?
많은 텍스트 문서 (자연어, 구조화되지 않은)가있는 경우, 의미 론적 메타 데이터로 주석을 달 수있는 가능한 방법은 무엇입니까? 예를 들어 짧은 문서를 생각해보십시오. I saw the company's manager last day. 정보를 추출 할 수 있으려면 모호하지 않도록 추가 데이터로 주석을 달아야합니다. 이러한 메타 데이터를 찾는 프로세스는 문제가되지 않으므로 수동으로 수행한다고 가정하십시오. …

3
비공식 텍스트에서 명명 된 엔터티 인식을위한 데이터 집합
나는 비공식 텍스트 (트위트와 비슷한 것)에서 명명 된 엔티티를 추출하기 위해 모델을 훈련시키기 위해 레이블이 지정된 데이터 세트를 검색하고 있습니다. 대문자 및 문법이 종종 내 데이터 세트의 문서에서 부족하기 때문에 오늘날의 최신 엔티티 인식 시스템이라는 뉴스 기사 및 저널 항목보다 약간 "비공식적 인"도메인 데이터를 찾고 있습니다. 훈련. 어떤 추천? 지금까지 …
18 dataset  nlp 


3
로지스틱 회귀 분석에서 비용 함수의 파이썬 구현
로지스틱 회귀 설정에서 파이썬, numpy 및 행렬의 곱셈과 관련된 매우 기본적인 질문이 있습니다. 먼저, 수학 표기법을 사용하지 않은 것에 대해 사과드립니다. 매트릭스 도트 곱셈과 요소 별 곱셈의 사용에 대해 혼란 스럽습니다. 비용 함수는 다음과 같이 제공됩니다. 그리고 파이썬에서 나는 이것을 다음과 같이 썼다. cost = -1/m * np.sum(Y * np.log(A) …

4
유클리드 거리와 반대로 맨해튼 거리를 언제 사용합니까?
기계 학습에서 유클리드 거리 에서 맨해튼 거리 를 사용하는 이유에 대한 좋은 논쟁을 찾고 있습니다. 내가 지금까지 좋은 논증을 찾은 가장 가까운 것은 이 MIT 강의 입니다. 36시 15 분에 슬라이드에서 다음 내용을 볼 수 있습니다. "일반적으로 유클리드 메트릭을 사용 합니다. 다른 차원을 비교할 수없는 경우 Manhattan이 적합 할 수 …


1
t-sne 치수가 의미가 있습니까?
t-sne embedding의 치수에 대한 의미가 있습니까? PCA와 마찬가지로 우리는 선형 적으로 변형 된 분산 최대화에 대한 감각을 가지고 있지만 t-sne의 경우 KL 거리의 매핑 및 최소화를 위해 정의한 공간 외에 직관이 있습니까?

1
keras로 멀티 클래스 분류에서 문자열 레이블을 처리하는 방법은 무엇입니까?
나는 기계 학습과 keras에 초보자이며 이제 keras를 사용하여 멀티 클래스 이미지 분류 문제를 해결하고 있습니다. 입력은 태그 된 이미지입니다. 사전 처리 후 훈련 데이터는 Python 목록에 다음과 같이 표시됩니다. [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "dog", "cat"및 "bird"는 클래스 레이블입니다. 이 문제에는 one-hot 인코딩을 사용해야한다고 생각하지만이 문자열 레이블을 처리하는 방법은 명확하지 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.