예, 텍스트에 GAN을 사용할 수 있습니다. 그러나 GAN의 작동 방식과 신경망에서 텍스트가 정상적으로 생성되는 방식의 조합에는 문제가 있습니다.
- GAN은 Generator 및 Discriminator의 구성을 통해 그라디언트를 전파하여 작동합니다.
- 텍스트는 일반적으로 토큰 공간에 최종 softmax 계층을 가짐으로써 생성됩니다. 즉, 네트워크의 출력은 일반적으로 각 토큰 (즉, 이산 확률 적 단위)을 생성 할 확률입니다.
이 두 가지 기능은 개별적으로 확률 적 단위를 통해 그라디언트를 전파 할 수 없기 때문에 자체적으로 잘 작동하지 않습니다. 이를 처리하기위한 REINFORCE 알고리즘 과 Gumbel-Softmax 재 모수화 ( 콘크리트 분포 라고도 함)의 두 가지 주요 접근 방식이 있습니다. REINFORCE는 분산이 높은 것으로 알려져 있으므로 좋은 경사도 추정을 위해서는 많은 양의 데이터가 필요합니다.
텍스트 GAN에 대한 REINFORCE의 예로 SeqGAN 기사를 확인할 수 있습니다. . Gumbel-Softmax의 예는 이 기사를 확인할 수 있습니다 .
완전히 다른 또 다른 옵션은 생성기의 출력으로 별도의 확률 적 단위를 갖지 않는 것입니다 (예 : 임베디드 공간에서 결정적으로 토큰 생성).