HTML (예 : http://www.brpreiss.com/books/opus6/ ) 을 다운로드 하여 전자 책 리더에서 사용할 수있는 하나의 HTML 또는 다른 형식으로 가입 하고 싶습니다 . 무료 도서가있는 사이트에는 표준 페이징이 없으며 블로그 나 포럼이 아니므로 자동 크롤링 및 병합을 수행하는 방법을 모릅니다.
HTML (예 : http://www.brpreiss.com/books/opus6/ ) 을 다운로드 하여 전자 책 리더에서 사용할 수있는 하나의 HTML 또는 다른 형식으로 가입 하고 싶습니다 . 무료 도서가있는 사이트에는 표준 페이징이 없으며 블로그 나 포럼이 아니므로 자동 크롤링 및 병합을 수행하는 방법을 모릅니다.
답변:
Calibre 를 사용하여 전자 책 변환 요구를 충족시킬 수 있습니다. 이와 같은 목차로 설정 한 단일 HTML 파일에서 여러 HTML 파일을 하나의 전자 책으로 만들 수 있습니다 .
내가 이렇게하는 방법은 Calibre였습니다.
그래도 너무 고통스러워서 쉽게 사용할 수 있도록 Chrome 확장 프로그램을 만들었습니다.
EpubPress ( http://epub.press ) 라고 합니다.
Chrome 탭에서 전자 책을 만들 수 있습니다.
희망이 도움이됩니다!
Pandoc 은 페이지 (또는 html 파일)에 대한 링크를 가져 와서 pdf / epub로 변환 할 수 있습니다 ...
크롤링되는지 확실하지 않습니다. 그렇지 않은 경우 먼저 wget 또는 무언가로 페이지를 크롤링 하거나 링크를 수집하여 pandoc에 제공 할 수 있습니다.
"뉴스 가져 오기"메뉴를 통해 액세스 할 수있는 칼리버의 https://getpocket.com 및 포켓 레시피를 사용할 수 있습니다 .
HTTrack은 좋은 옵션입니다. 웹 사이트에서 전자 책을 만들 것입니다 : 여기에서 다운로드 할 수 있습니다 : https://www.httrack.com/ HTTrack "인터넷에서 로컬로 월드 와이드 웹 사이트를 다운로드 할 수 있습니다 HTTrack은 원래 사이트의 상대 링크 구조를 정렬합니다. "
그런 다음 Calibre를 사용하거나 HTML을 epub 변환 소프트웨어로 사용하여 HTML을 EPUB, AZW3 또는 PDF로 변환 할 수 있습니다.
EPUB로 직접 변환하는 두 번째 옵션은 EpubPress입니다. Firefox (v44.0 이상) 또는 Chrome에서 사용할 수 있도록 확장 기능이 있습니다. 이 소프트웨어를 사용하려면 브라우저 창을 열어야합니다. 각 탭은 기본적으로 전자 책의 '장'입니다. 원하는 모양 순서로 탭을 배열 한 다음 epubpress를 활성화하십시오. 탭을 모양 순서대로 .epub 형식으로 다운로드하여 정렬합니다. 이것이 도움이되기를 바랍니다!
그러나 EpubPress는 HTTrack에서 '웹 사이트'가 아닌 개별 웹 페이지를 다운로드합니다. EpubPress를 사용하여 웹 사이트를 다운로드하려면 웹 사이트의 각 링크를 별도의 탭으로 연 다음 Epubpress를 사용하여 이러한 링크를 .epub 형식으로 수집해야합니다.