자바 스크립트 트릭? scribd를 사용하면 텍스트를 복사하여 붙여 넣기가 어려워집니다.


19

최근에 scribd를 사용하면 사용자 (무료 사용자)가 자신의 사이트에 호스팅 된 문서를 탐색하기가 매우 어려워졌습니다. 문서 내에서 검색 할 수는 없지만 문서 내에서 검색 할 수는 없습니다.

자바 스크립트를 사용하면 브라우저에서 요청시 페이지를로드하므로 브라우저의 "다른 이름으로 저장"기능은 큰 도움이되지 않습니다.

놀랍게도 텍스트 복사 / 붙여 넣기조차 클립 보드에 횡설수설하는 것을 보았습니다! 무엇이 잘못되었는지 확인하기 위해 브라우저에서 javascript를 끈 다음 동일한 문서를 다시로드했습니다. Voila, 나는 횡설수설을 보았다. 그래서 그것은 scribd의 자바 스크립트가 어떻게 든 횡설수설 텍스트를 해독 한 다음 브라우저에 표시하는 것처럼 보입니다.

이제 내 질문은 자바 스크립트가 활성화 된 후에도 브라우저에서 텍스트가 올바르게 렌더링되는 것입니다. 내가 선택한 텍스트에 해당하는 DOM 객체를 보면 여전히 횡설수설 텍스트가 표시됩니다.

이제 혼란 스럽습니다. 텍스트는 사용자에게 알맞게 표시되지만 DOM 객체에는 여전히 횡설수설이 있습니다. 문제는 DOM 객체에서 횡설수설을 유지하고 여전히 디코딩 된 텍스트를 렌더링 할 수 있도록 사이트에서 어떤 종류의 자바 스크립트 후크 / 코드를 사용하고 있습니까?

디코딩 된 텍스트에 액세스 할 수있는 방법이 있습니까? 내 의도는 디코딩하도록 알고리즘을 리버스 엔지니어링하지 않고 디코딩 된 텍스트가 저장되는 위치를 찾는 것입니까?

예제 문서는 다음과 같습니다.

http://www.scribd.com/doc/143886351/OCP-Upgrade-to-Oracle-Database-12c-Student-Guide-vol-1-Exam-1Z0-060

자바 스크립트를 켜거나 끄면 어떻게되는지 확인하세요!


간단합니다. 그들은 자바 스크립트 pdf 뷰어를 만들었습니다. Mozilla는 Firefox로 무언가를했습니다. PDF 뷰어는 실제로 내용을 표시하는 데 사용되지 않기 때문에 시청 경험의 거의 모든 측면을 제어 할 수 있습니다.
Ramhound

답변:


15

상기 봐 font-family에 대한 span. 사용자 지정 글꼴 (이 경우 ff6)을 사용합니다.

더 많은 PDF 문서가 올바르게 표시되도록해야합니다. PDF 문서에서와 같이 문서의 텍스트가 표준 문자 집합을 사용해야하는 것은 아닙니다. 포함 된 글꼴의 글리프에 매핑되는 코드가있는 코드 만 사용하면됩니다.


10

표시된 텍스트와 "기괴한"텍스트를 보면 일부 문자가 동일하고 일부 문자가 대체 된 것을 볼 수 있습니다. 예를 들어 "Mltmrprfsm Jblbemr"은 "Enterprise Manager"입니다. 텍스트가 충분하면 빠른 번역 테이블을 작성할 수 있어야합니다. 이미 ME , L- > N , T , R , P 는 명확하고 F- > R 등으로 번역되어 있음을 알고 있습니다 . 시간, 탐정 작업 및 겸손한 프로그래밍 기술이 제공되면 전체 문서를 번역 할 수 있습니다.

물론, 다음 문서가 Dan D.가 언급 한 것과 동일한 ff6글꼴을 사용할 것이라는 보장은 없으므로 나중에 텍스트를 저장하려면 로컬에서 사용하기 위해 해당 글꼴을 잡는 것이 다음 단계가되어야합니다.


0

브라우저의 자르기 도구를 사용하여 스크린 샷을 캡처 한 다음 쉽게 사용할 수있는 온라인 ocr 사이트를 사용하여 텍스트로 변환 할 수 있습니다. 당신을 정리해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.