아동 웹 사이트를위한 웹 안전


12

나는 딸의 운동, 학업 및 개인적 업적을 기념하기 위해 무언가를 원했던 11 세의 부모를 위해 Wordpress 사이트를 만들고 있습니다. 이 사이트에는 친구와 친구의 사진 및 비디오, 전기 정보 및 블로그 게시물이 포함되어 있습니다. 도메인은 회사 이름으로 비공개 등록되어 있으며 Google 콘솔에 추가하지 않고 다른 SEO를 최소화하고 있습니다. 성이나 실제 주소가 없습니다. 스크레이퍼가 사진 등을 움켜 쥐거나 눈을 훔치지 않도록 가능한 한 많은 웹 안전성을 염두에두고 싶습니다. 조사 할 가치가 있고 내 점을 찍을 가치가 있습니다. 자녀의 웹 사이트는 맛이 뛰어나고 부모는 매우 사실적이고

이 11 살짜리와 그녀의 사이트에 대한 웹 안전을 향상시키기 위해 취할 수있는 신뢰할만한 방법이 있습니까?


3
이것은 시작입니다 : webmasters.stackexchange.com/questions/77031/… 나는이 사이트에 대한 다른 아이디어에 대해 일반적으로 생각할 것입니다. BTW-이 작업을 수행하는 데 좋습니다. 조금 힘든 것입니다. 그러나 노력할만한 가치가 있습니다!! 나는 유료 호스팅과 함께 무료 자선 호스팅을 해왔으며 고귀한 원인은 항상 내가 가장 좋아하는 곳이었습니다. 이것들은 내가 기억하는 것입니다!
closetnoc

3
당신은 아무것도 당신이 그것을 100 % 보이지 않게 만들지 않을 것이라는 것을 알고 있습니다 ... 페이스 북이나 텀블러에 링크를 올리는 사람 만 있으면됩니다. 학부모는 아동이 게시하는 모든 콘텐츠를 감독 / 승인하고주의해야 할 사항에 대해 교육합니다
HorusKol

4
robots.txt올바른 내용 의 파일은 모든 합법적 인 봇을 차단할 수 있습니다. 어려운 부분은 나머지입니다. 사이트의 주소를 찾기가 어려운 경우 많은 정보를 보관할 수 있습니다.
kasperd

5
이미 언급 된 모든 것 외에도, Wordpress는 이미지 EXIF ​​데이터를 그대로 둡니다.
user1103

3
웹 사이트 여야합니까? 많은 것을 퍼 뜨리고 잘못된 손에 들어가기를 원하지 않는다면 왜 인터넷에 넣습니까? 그녀의 기억 속에 다른 것을 만들어서 부모 / 가족 / 사람들에게 줄 수 없습니까?
Tom.Bowen89

답변:


20

아마 편집증적일거야

어쩌면 내가 편집증 일지 모르지만 이것은 완전히 개인 블로그 / 웹 사이트 여야하는 것처럼 들립니다. 즉. 비밀번호로 보호됩니다. 대상 독자는 누구입니까?

보안 측면과는 별도로 (콘텐츠를 찾아서 사용하는 데 악의가없는 것을 방지) 이러한 종류의 콘텐츠는 다른 학교 "친구"로부터 괴롭힘을당하는 것처럼 들립니다. 처음부터 11 세까지는 괜찮을 수있는 내용이 몇 년 안에 부끄러워 질 수 있습니다.

Google 콘솔에 추가하지 않습니다

이것은 뒤로 보이는 것 같습니까? Google에서 콘텐츠를 숨기는 방법 (예 : "좋은"봇)은 robots메타 태그 (또는 X-Robots-Tag헤더) 를 사용하는 것 robots.txt입니다. Google 검색 콘솔에서이를 생략해도 도움이되지 않습니다.

적어도 Google Search Console에 추가하면 뒤로 링크, robots.txt 확인 등을 모니터링 할 수 있습니다. 실제로 공개하는 경우.


1
이것은 실제로 유일한 제정신 솔루션입니다. +1
MonkeyZeus

4
간략한 설명-Google Search Console에 사이트를 추가하지 않으면 사이트에 대해 Google에 직접 알리지 않습니다. 즉, Google이 귀하에게 알리려고하지 않을 것입니다. 그러나 이것이 구글이 당신을 알아 차릴 수 없다는 것을 의미하지는 않습니다. w3d가 제안한 것처럼 로봇 파일을 사용할 것입니다. 또한 사이트를 비밀번호로 보호한다는 것은 Google이 색인을 생성 할 수있는 가장 많은 것이 로그인 페이지임을 의미합니다.
Jake

11
"Google에서 콘텐츠를 숨기는 방법"인터넷에 콘텐츠올리지 않는 것 입니다.
궤도에서 가벼움 경주

2
나는 디렉토리를 보호하는 비밀번호가 엄마가 사이트를 원하는 이유를 무너 뜨릴 것이라고 생각한다.이 경우에 우리는 워드 뉴스 레터를 만들어 이메일로 보낼 수 있었다. 딸이 블로그를 시작하려고합니다. 엄마는 바보가 아니라 그녀가 콘텐츠를 상영하고 편집하고 있습니다. 나는 그들이 여기서 무책임한 일을하고 있다고 생각하지 않습니다. 이것은이 질문에 대한 훌륭한 피드백입니다.
rhill45

WP에서 사이트를 암호로 보호하는 것은 미디어 보안과 관련이 없습니다.
blankip

6

유일하게 적절한 답변은 모든 것을 암호로 보호하는 것입니다. HTTP BASIC_AUTH는 WordPress와 상호 작용하지 않으므로 설정하기가 가장 간단합니다. 이것만으로도 모든 스크레이퍼를 차단할 수 있지만 적절한 보안을 원할 경우 HTTPS도 사용해야합니다.

(Sidenote : 많은 시스템에서 HTTP 페이지는 HTTPS로 리디렉션되지만, HTTP BASIC_AUTH에서는 해당 리디렉션이 비밀번호를 묻는 프롬프트 이후 에 있을 수 있습니다 . 그러면 HTTPS 페이지에서 비밀번호를 다시 입력하라는 메시지가 나타납니다. 이는 비밀번호를 입력했음을 의미합니다. 일반적으로 HTTP 및 HTTPS 버전에 대해 다른 비밀번호를 사용하거나 HTTP 버전에 대해 비밀번호를 사용하지 않는 것이 가능합니다. HTTPS 버전으로 리디렉션하면됩니다. 웹 사이트 호스팅 환경 설정을 관리하는 데 사용하는 도구에 따라 쉽게 설정할 수 있으며, 항상 직접 탐색해야 합니다.안전하지 않은 버전을 무시하고 HTTPS 페이지로 HTTP BASIC_AUTH 이외의 비밀번호 시스템을 사용하는 경우이 참고 사항 중 어느 것도 적용되지 않습니다.)


4
암호로 보호 된 경로로 이동하려면이 사이트가 WordPress 사이트 인 경우 WordPress를 사용하여 모든 사이트를 처리하는 것이 훨씬 쉬운 방법입니다. codex.wordpress.org/Content_Visibility#Private_Content
Doyle Lewis

1
@DoyleLewis. 업로드 된 이미지와 같은 정적 자산을 보호합니까? 물론 크롤러는 (있는 한 Options -Indexes) 찾을 수 없습니다 .
TRiG

나는 https를 고려했지만 문제는 비용입니다. 나는 내 회사 SSL 아래에서 그녀의 사이트를 실행하는 방법을 찾을 수 있었지만 물론 불가능합니다
rhill45

2
letsencrypt.org @ rhill45.
TRiG

1
@TRiG 누군가가 정적 미디어 파일에 대한 URL을 가지고 있다면 그렇지 않습니다. 그러나 크롤러는 파일에 연결되는 컨텐츠에 액세스 할 수 없으므로 크롤러에 도달하지 않습니다.
Doyle Lewis

3

먼저 모든 전문 웹 마스터에게 큰 사과를 드리겠습니다.하지만 이번 OP에는 한 가지 중요한 제안이 있습니다.

검색 엔진 가이드 라인 위반

그리고 중요한 콘텐츠가 복잡한 자바 스크립트에 있고 크롤링 할 수있는 콘텐츠 로봇이 적절한 HTML이 아닌 지점까지 수행해야합니다. 여기에는 잘못된 설명 태그, 잘못된 제목 태그 등이 포함됩니다. 전체 컨텐츠를 플래시로 만든 비디오로 바꾸거나 전체 컨텐츠를 하나의 이미지로 표시 할 수 있습니다. 그것은 실제로 검색 엔진 크롤러를 위험하게 할 것입니다.

코드로 예제를 보여 드리겠습니다.

색인을 생성하는 방법은 다음과 같습니다.

<!DOCTYPE html>
<html>
<head>
<title>Web page</title>
<meta name="description" content="This is a wonderful web page">
</head>
<body>
<h1>A wonderful web page</h1>
<h2>By John Smith</h2>
<p>This is a wonderful page. ya de ya de ya de ya de ya de ya de</p>
<p>This is wonderful. ya de ya de ya de ya de ya de ya de</p>
</body>
</html>

좋아, 나는 텍스트가 완벽하지 않다는 것을 인정하지만, 당신은 내 말의 의미를 이해한다.

이제 크롤러에서 숨기고 간단한 방법으로 수행하려면 다음을 시도하십시오.

<!DOCTYPE html>
<html>
<head>
<title>Private</title>
</head>
<body>
<img src="mywebsite.jpg" width=1024 height=768>
</body>
</html>

그런 다음 mywebsite.jpg라는 이미지를 만들고 위에 표시된 html이 아닌 모든 텍스트를 포함시킵니다. 그런 다음 실제 내용을 볼 수있는 권한이없는 사용자에게 워터 마크 버전을 만들어 mywebsite.jpg를 보호해야합니다. 사용자 에이전트 문자열 또는 IP 주소를 이미지에 대해 허용 / 금지하는 것과 비교하십시오. 이 유형의 작업은 .htaccess에서 일부 다시 쓰기 규칙으로 수행 할 수 있습니다.

예를 들어 googlebot이 실제 이미지 대신 워터 마크 이미지를 보게하려면 다음 규칙을 사용하십시오.

RewriteCond %{HTTP_USER_AGENT} ^googlebot$ [NC]
RewriteRule ^mywebsite.jpg$ specialrobotimage.jpg [L]

여기서 mywebsite.jpg는 이미지로 실제 웹 사이트이고 specialrobotimage.jpg는 실제 사용자 만 정보를 볼 수 있다는 메시지로 워터 마크 또는 이미지라고 가정합니다. 또한 규칙은 모든 것이 동일한 폴더에 있다고 가정합니다.


실제로 JS는 많은 것을 위해 갈 수있는 방법 일 수 있습니다. 일부 봇은 JS, 스크레이퍼 및 종종 그렇지 않은 것을 실행합니다. 이것은 JS가 실행될 때 다양한 HTML DOM 객체가 실제 컨텐츠로 설정 될 수 있음을 의미합니다. 나는 종종 스크레이퍼에 의해 위조되기 때문에 사용자 에이전트에 의존하지 않는 것이 좋습니다. ModSecurity 설치를 고려하여 대부분의 작업을 수행하십시오.
closetnoc

11
이것은 정말 나쁜 조언입니다. 실질적인 이점이없는 많은 작업입니다. 요즘 수많은 봇이 JavaScript를 실행합니다. 비디오 또는 이미지의 내용은 쉽게 유지 관리 할 수 ​​없습니다 (둘 다 여전히 정기적으로 색인이 생성됨). Flash의 내용조차도 수년간 색인되었습니다.
Brad

Ok 이미지와 비디오에 인덱싱 없음을 적용해야한다는 것을 잊었습니다. 나는 그것들을 쉽게 유지할 수는 없지만 최소한 텍스트를 쉽게 수정할 수는 없다는 것을 알고 있습니다. 반면에 원시 텍스트 만 페이지에있는 경우 크롤러는 텍스트 덩어리를 가져 와서 수정하고 템플릿을 추가 한 다음 다른 웹 사이트를 구축 할 수 있습니다. 크롤러가 이미지 또는 비디오에서 텍스트를 추출하는 기능이 있는지 의심합니다.
Mike

3

먼저 이것은 실제로 WP 질문입니다. 나는 당신이 필요로하는 것을하는 20 개 이상의 사이트를 작성 했으므로 이것은 매우 쉽습니다.

1 모든 사람이 로그인하여 모든 페이지를 봅니다.

2 스크립트와 .htaccess를 통해 업로드 폴더를 잠급니다. 미디어를 보도록 허용하기 전에 사용자 로그인을 확인하는 스크립트가 있습니다.

이 사이에 무언가를하고 싶다면 사이트를 넓게 열어야합니다-많은 작업입니다. 가장 쉬운 방법은 두 개의 업로드 폴더를 사용하는 것입니다. 하나는 보안이 있고 다른 하나는 공개적으로 열려 있고 일부는 공개하지 않으려는 경우 다른 모든 것입니다.

다른 사람들이 콘텐츠에 대해 말한 내용-페이지가 잠겨 있으면 찾을 수 없습니다 ... 실제로 사실이 아닙니다. 폴더에서 쓰레기를 검색하여 파일 이름을 검색하는 로봇 스크립트가 있습니다.

모든 구글과 로봇 이야기는 말도 안됩니다. 그 물건은 반 암살하려는 경우에만 중요합니다. 그렇다면 위의 몇 가지 질문에 대해 조언을 구하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.