불쾌감을주는 콘텐츠를 GitHub에 업로드 할 수 있습니까? [닫은]


12

내 웹 사이트에 대한 불쾌감을주는 콘텐츠 검사기를 개발하여 GitHub 에 게시하려고합니다 . 그러나 소스 코드에는 공격적이고 인종 차별적이며 불쾌한 콘텐츠가 많이 포함되어 있습니다.

소스는 완전히 문서화되어 있지만 GitHub에 그러한 작업을 게시 할 수 있는지 또는 독자의 상상력에 따라 문자열 배열을 남겨 둘지 여부에 대한 귀하의 의견을 원했습니다!


11
중요한 질문은 "실제 모욕적입니까? 아니면 단지 '치열 적"입니까? "입니다. 그것은 github TOS에 들어갑니다 -§7은 그것들을 제거 할 수는 있지만 제안 할 의무는 없습니다. 문자열을 다른 파일로 추출한 다음 인과적인 브라우저를 손상시키지 않기 위해 rot13으로 암호화하거나 그와 유사한 특성을 원할 수 있습니다.

1
나는 그것이 괜찮을 것 같아, Readme의 가능한 독자들에게 경고하고, 다른 GitHub Repos에는 많은 공격적인 단어가 있습니다. 또한, 귀하의 경우는 선의입니다.
jacktrades

5
모든 단어를 텍스트 파일이나 데이터베이스에 넣고 런타임에로드하십시오. 그런 다음 아래 텍스트가 희미한 마음이 아니라는 것을 파일의 머리 부분에 멋진 작은 면책 조항을 넣으십시오. 코드가 깨끗하고 상황에 따라 다른 텍스트 파일을 사용할 수 있습니까?
Ampt

귀하의 의견에 감사드립니다. 나는 그것이 아마도 나에게 가장 좋은 접근법이라고 동의하고 생각한다.
SimonGoldstone.com

5
그 자체로 단어는 불쾌하지 않습니다. 배후의 의도는 공격적입니다.
kaptan

답변:


45

ROT-13 솔루션에 동의하지 않습니다. 금지 된 단어를 보는 것이 난처 해 보이는 것은 누군가를 화나게 할 수 있기 때문에 시간 낭비입니다.

나쁜 단어 / 나쁜 단어 규칙의 사전은 어쨌든 별도의 파일에서 가져와야합니다 (런타임에로드되거나 리소스로 포함될 수 있음) . 이 파일을 난독 처리하면 사용자 / 다른 개발자 / 사용자가 파일을 변경하거나 문제를 해결하기가 더 어려워집니다. 또한 하드 드라이브에서 "banned_words.txt"라는 파일을 보면 불쾌감을주는 단어 목록이 포함될 것으로 예상 됩니다.


동의한다. 나는 단어를 난독 화하고 싶지 않습니다.
SimonGoldstone.com

5
+1 @simon 다음 목록이 이미 나타납니다 : github.com/snipe/banbuilder
dcaswell

2
@simon 나는 당신의 프로젝트가 가치가 없다는 것을 의미하지는 않았다. 단지 github은 사람들이 당신이 원하는 것처럼 목록을 저장할 수 있도록 허용한다. 다른 대답에는 예 또는 아니오가 없으며 대답이 실제로 예라는 것을 확인하고 싶었습니다.
dcaswell

1
"바퀴 발명"은 학습의 일부입니다. 그것은 대학에서 가르치는 대부분의 것입니다.
WernerCD

2
때로는 프로그램 배포가 유지되는지 여부에 영향을 줄 수있는 섬세한 감수성을 가진 사람들을 ... 어떻게 말할 것인가? 파일을 rot13하면 파일이 그대로 유지된다는 것은 OP가 코드를 켜고 GitHub에 머 무르려는 목표를 달성하는 데 도움이됩니다. 그것은 내 책에서 시간 낭비가 아닙니다.
Blrfl

16

"컴퓨터 과학의 모든 문제는 다른 수준의 간접 지시로 해결할 수 있습니다." ( David Wheeler에 의해 ).

독자를 방해하지 않도록 컨텐츠 를 인코딩 할 수있는 옵션을 고려할 경우 선택 사항은 업로드 여부에 국한 되지 않습니다.

  • 예를 들어, 단순히로 이동 다음 글자 유명한 네 편지 설정할 수 있습니다 (완전 인코딩 A를 이동 Z와 등 B, C에 B에 A) 단어를 완전히 무해한로 Gvdl . 응용 프로그램에서 사용해야 할 것은 A를 Z로 이동 하고 반대 방향으로 이전 문자로 다시 이동하는 것입니다.

코멘트에서 지적했듯이 , 위와 같은 접근 방식은 ROT13 문자 대체 암호 에 사용되며, " 캐주얼 한 시각에서 공격적인 재료 를 숨기는 수단으로 ..."

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


완전한 인코딩 을 위해 선택한 인코딩이 실수로 한 단어를 다른 단어로 바꾸지 않도록 인코딩 된 사전 에 대해 검사기를 추가로 실행 하는 것이 좋습니다.

그런 것들을 인코딩 할 때, 확실하게 예측할 수 없기 때문에 이중 확인하는 것이 좋습니다. 지난 프로젝트 중 하나에서 잘못 구성된 체커가 임의의 문자 순서로 불쾌한 내용을 발견하기 시작했을 때 ( ZIP 아카이브 의 uuencoded 내용 에서) 메일이 상당히 중단되었습니다 .


일반 텍스트, Gvdl 을 전달하는 것과 비교하여 인코딩은 법적 문제와 관련된 모든 위험과 종속성 을 완전히 피할 수있는 실질적인 이점이 있습니다.

그냥 생각 해봐 특정 리포지토리의 특정 서비스 약관에 따라 내 콘텐츠를 사용할 수 있습니다.

그러나 TOS 를 변경하기로 결정하면 어떻게됩니까? 또는 용어가 호환되지 않는 다른 저장소로 변경하기로 결정한 경우 어떻게해야합니까? 내가 뭘 할까?

그런데 지금도 "친숙한"저장소에 있어도 여전히 안전하지는 않습니다.

이상한 웹 필터로 인해 누군가 내 콘텐츠를 다운로드 할 수 없으면 어떻게합니까? 사용자 불만에 응답하고 필터를 수정하는 방법을 설명해 드리겠습니다. 그들의 필터 ...

... 인코딩에 대해 결정하기 전에 두 번 생각하는 것이 좋습니다. 그리고 내가 결정하더라도, 나는 그것에 대해 아주, 아주 좋은 이유 가 있는지 확인 합니다.


6
Rot13은 사실상의 표준입니다. 이중 rot13이 더 좋습니다. :-)
Blrfl

5
트리플 DES가 DES보다 낫 듯이 @Blrfl은 트리플 rot13이가는 길입니다.

1
나는 더 세게 전문 형식의 다른 파일 편집에 비해 ROT13 파일을 편집하지 않습니다 많은 편집자 플러그인 있다고 생각
JoelFan

2
@Simon은 rot13이 방해가 될 정도로 많은 것이 아니라 텍스트를 사소하게 숨기는 표준 방법입니다. 일부 방화벽은 특정 문자 패턴을 차단하도록 구성되어 프로그램 기능에 대한 텍스트를 얻기가 어려울 수 있습니다. 문제가되는 것은 공격성이 아니라 "다운로드하려는 무언가"와 "차단하고 싶은 것"의 차이를 인식하지 못하는 다른 기술적 장애물입니다. 그렇습니다. 지퍼를 얻을 수는 있지만 복제하거나 포크하거나 밀 수는 없습니다.

2
한 글자 씩 @ThomasEding 시저 이동 암호 . 첫 번째 문자는 원래 'F'입니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.