과학 문헌에서 "one-hot"인코딩이란 무엇입니까?

10

범주 형 벡터를 가져와 원핫 인코딩을 사용하여 이진 표현으로 변환하는 연산자의 이름은 무엇입니까? 과학 논문을 작성하고 나서 적절한 이름이 필요한지 궁금합니다.

terminology categorical-encoding

— 깨지기 쉬운
소스

3

더미 인코딩은 다른 이름입니다. 기계 학습에서 모든 사람들은 하나의 간단한 유형을 사용하므로 이것이 무엇인지 분명하지만, 다른 역할을 수행하는 마이너스 개념과 다른 아이디어를 가진 다른 유형의 대비 코딩 (다른 이름)이 있으며 통계에 사용되는 유사한 역할을 수행합니다. 좀 더 구체적 일 수 있습니다.

— Gijs

7

기계 학습 이전의 통계 및 데이터 분석에서이 유형의 범주 형 인코딩은 더미 변수, 즉 지표 유형 대비 변수 로 알려져 있습니다.

— ttnphns

18

통계 학자들은 원 핫 인코딩을 더미 코딩 이라고 부릅니다 . 다른 사람들이 제안했듯이 ( 의견에 Scortchi 포함 ) 이것은 동의어가 아니지만 일반적으로 0-1로 인코딩 된 범주 형 변수에 사용되는 용어입니다.

명목 / 범주 데이터에 대해서는 "더미 변수"와 "표시기 변수"를 참조하십시오.

— 팀
소스

3

어이 !! 내가 잊었 다니 믿을 수 없어 또한 그것들을 지표라고도합니다.

— Tim Atreides

2

"더미 코딩"이 좋은 동의어라고 생각하지 않습니다. 일반적인 의미에서 숫자 변수 세트로 범주 형 변수를 나타내는 것을 의미하거나 "one-hot encoding"과 구별되는 "reference-level coding"을 의미합니다 (예 : one-hot encoding 문제와 더미 인코딩 문제). . "코딩 레벨 수단"(페이지는 ? 회귀 모델) 더미 코딩 및 효과가 코딩처럼 ( "코딩 의미"라고 뭔가가 ) 하나의 뜨거운 인코딩을 의미하지만 ... 아마도 너무 선형 모델 컨텍스트를 암시

— Scortchi을 - 분석 재개 모니카

2

... 일반적으로 사용하기에 강력합니다.

— Scortchi-Monica Monica 복원

3

필자는 정의 자체를 본 적이 없지만 통계의 더미 변수는 항상 (N-1) 변수를 사용하여 N 요소를 코딩하는 것을 의미하지만 원 핫 인코딩은 N 변수를 사용하여 N 요소를 코딩합니다. 이 차이는 실제로 매우 중요합니다. 회귀에 one-hot encoding을 사용하면 변수의 의존성 때문에 말도 안됩니다!

— meh

2

@aginensky 비록 사람들이 정확히 어떤 변수를 가지고 있는지주의를 기울여야하지만, 좋은 회귀 루틴은 그 상황에서 넌센스를 생성하지 않을 것입니다. 그것은 단지 하나의 예측자를 생략하고 그렇게 말할 것입니다.

— Nick Cox

8

대상 고객에 따라 다릅니다.

으로 팀이 말했다, 통계 코딩 더미를 호출하고 회귀 모델처럼 뭔가를 설명 할 때 내가 무엇을 기대의 볼 것을. "매장의 위치에 맞게 더미 코딩 된 변수가 포함되었습니다." 나는 그것을 원 핫 인코딩이라고 부르는 것이 약간 이상하게 보일 것이라고 생각합니다.

그러나 다른 Tim이 말했듯이, 원 핫 인코딩은 기계 학습 문헌에서 상당히 일반적입니다. 그것은 (신경망에서와 같이) 노드, 물리적 와이어 (장치에서) 또는 그와 같은 것을 적어도 나에게 희미하게 암시합니다.

공식적으로, 나는 당신이 인디케이터 함수 세트를 적용하고 있다고 생각 하지만, 그것은 증명 밖에서 너무 공식적인 방법 일 것입니다. $\mathbb{I}_X$

— 맷 크라우스
소스

6

이 용어는 전자 공학에서 비롯됩니다. 누가 1 "핫"이라고 부를까요? "핫"또는 "라이브" 가있는 전기를 사용하는 사람 만 전선에 전위가 있음을 의미 합니다 . "One hot"은 한 와이어의 개별 전기 신호 레벨이 와이어 세트에서 핫 / 콜드로 디코딩되는 회로 설계를 나타냅니다. 나는 EE 배경을 가진 일부 기계 학습 사람들이 유추가 강하다고 생각합니다.

계량 경제학 및 통계에서 발생할 수있는 변수 dummy또는 indicator변수는 고유 한 지표로 고유 한 범주를 나타내는 데 사용되므로 매우 유사합니다. 그래도 미묘한 차이가 있습니다. 예를 들어 기본 카테고리가 0으로 설정된 모든 인형에 해당하기 때문에 K 카테고리에 대해 K-1 인형을 만듭니다. 반대로, 하나의 핫 인코딩에는 K 전선이 있고 기본 카테고리에는 자체 전선이 있다고 생각합니다 ( 변하기 쉬운).

— 악사 칼
소스

5

저는 통계적으로 훈련을 받았으며 최근 머신 러닝 / 컴포지션에서 "일회성 인코딩"에 대해 들어 보았습니다. 나는 보통 방금 매트릭스를 디자인 매트릭스 / 데이터 매트릭스 / 디자인 프레임이라고 불렀습니다.

— 팀 아트 레이 데스
소스

내가 인용 할만한 참고 자료가 있습니까? 나는 과학 간행물을 쓰고 있는데이 논문은 ML 커뮤니티를위한 것이 아니라 더 광범위하기 때문에 모든 독자들에게이 방법에 대해 명확하게 설명하고 싶습니다.

— fractile

내가 동사로 "한 번 불렀다"고 들어 본 적이 없습니다. 그러나 나는 수학 / 통계적 방향에서 이와 비슷하게옵니다. ( "one-hotted"에 대한 Google 검색 결과는 흥미 롭습니다. 기계 학습의 의미와 "one hotted-up car"에 대해 이야기하는 사람들이 혼합되어 있습니다.)

— Michael Lugo

3

물리 과학 및 공학에서는이를 (일반화 된) 크로네 커 델타 라고합니다 .

가장 간단한 형태에서, Kroneker 델타로 정의되어 이는 사소 일반화 비록

\begin{aligned} δ_{나는, 제이} \equiv {\begin{cases} 1 & 만약 & 나는 = 제이 \\ 0 & 그밖에 \end{cases} \end{aligned},

$\begin{align*} {\delta}_{i,j} {\equiv} \begin{cases} 1 &\text{if} & i=j \\ 0 &\text{else} \end{cases} \end{align*},$

\begin{aligned} δ_{[질환]} \equiv {\begin{cases} 1 & 만약 & [질환] \\ 0 & 그밖에 \end{cases} \end{aligned} .

$\begin{align*} {\delta}_{\left[\text{condition}\right]} {\equiv} \begin{cases} 1 &\text{if} & \left[\text{condition}\right] \\ 0 &\text{else} \end{cases} \end{align*}.$

그래서, " "로 읽을 수 경향이 대부분의 저자들이 "을 잘라야하는 경향 범주는 문맥에서 명백한 경우,". ${\delta}_{i{\in}\text{category}}$

\begin{aligned} δ_{나는 \in 범주} \equiv {\begin{cases} 1 & 만약 & 나는 \in 범주 \\ 0 & 그밖에 \end{cases} \end{aligned},

$\begin{align*} {\delta}_{i{\in}\text{category}} {\equiv} \begin{cases} 1 &\text{if} & i{\in}\text{category} \\ 0 &\text{else} \end{cases} \end{align*},$

δ_{i}

${\delta}_{i}$

크로네 커 델타는 시그마 / 파이 / 아인슈타인 등에 유용합니다 . 용어를 조건부로 지정할 수 있으므로 표기법이 사용됩니다.

단지 일반적인 프로그래밍 구조이를 연관시키는 상기 크로네 커 델타는 condition?1:0여기서 ?:는 IS 조건 연산자 .

접선으로, 나는 저자들에게 구식 를 일반화 된 동등 물인 에 찬성 하도록 포기하도록 권장한다 . 구식 표기법에는 이점이 없지만 일반화 된 표기법은 더 명확하고 확장 가능합니다. ${\delta}_{i,j}$ ${\delta}_{i=j}$

— Nat
소스

여기 링크가 보이지 않습니다. 하나는 변수의 각 상태에 대해 하나의 변수를 하나의 세트로 핫 디코딩합니다. 이 응용 프로그램에서 크로네 커 델타는 어떻게 사용됩니까?

— Aksakal

{0, 1}

$\left\{0,1\right\}$

δ_{VW}

${\delta}_{\text{VW}}$

δ_{Acura}

${\delta}_{\text{Acura}}$

δ_{Honda}

${\delta}_{\text{Honda}}$

δ_{i, j}

${\delta}_{i,j}$

δ_{CompanyName, VW}

${\delta}_{\text{CompanyName},\text{VW}}$

V W

$VW$

A C U R A

$ACURA$

i = 1.. N

$i=1..N$

V W_{i}

$VW_i$

A C U R A_{i}

$ACURA_i$

i

$i$

C A R_{i}

$CAR_i$

V W_{i} = δ (C A R_{i}, V W)

$VW_i=\delta(CAR_i,VW)$

{V W}_{i}

${VW}_{i}$

{δ_{VW}}_{i}

${{\delta}_{\text{VW}}}_i$

δ_{i \in VW}

${\delta}_{i{\in}\text{VW}}$

i

$i$

1

$1$

0

$0$

2

$1$ $K$

여기 책에서 인용 한 것이 있습니다.

$K$ $1$ $K$ $K$ $\textbf{x}$ $x_k$ $1$ $0$ $K = 6$ $x_3 = 1$ $\textbf{x}$

$\textbf{x} = (0, 0, 1, 0, 0, 0)^{T}$

— 케 다프
소스