나는 지난 주말에 조부모님의 집으로 끝났습니다. 할머니는 가족 역사에 관한이 거대한 (~ 1400 페이지) 책을 꺼내서 1630 년 정도 거슬러 올라갑니다. 내가 거대 대단하다, 나는 모든 정보를 데이터베이스에 저장하고 웹에서 사용할 수 있다고 생각했다. 나는 모든 웹 프로그래밍과 정규 표현식을 다룰 수 있지만 모르는 것은 책에서 컴퓨터로 텍스트를 얻는 가장 좋은 방법입니다.
내가 한 작은 연구에서 일종의 OCR이 필요할 것입니다. 내 옵션은 다음과 같습니다.
- 카메라로 모든 페이지의 사진을 촬영 한 다음 OCR 소프트웨어로 사진을 처리
- 스캐너를 사용하여 각 페이지를 스캔 한 다음 OCR 소프트웨어로 처리
- 이런 종류의 핸드 헬드 장치를 사용 하십시오 .
누구 든지이 문제를 해결하는 가장 좋은 방법에 대한 아이디어가 있습니까? 내가 아는 한, 그것을 대체 할 수 없기 때문에 나는 책을 파괴하고 싶지 않습니다. 아마 큰 책을 스캔하려고하는 유일한 시간 일 것이므로 어떤 종류의 기기에도 250 달러 이상을 쓰고 싶지 않다고 생각합니다. 나는 여기에 수동 노력을 신경 쓰지 않지만 (이것은 아마도 몇 달이 걸릴 것이라는 것을 알고 있습니다), 가능한 가장 효율적인 방법을 찾고 싶습니다.
책에 대한 참고 사항 : 그것은 단지 20 세 정도 였으므로 아주 좋은 모양입니다. 단색이며 페이지가 노란색으로 시작되지 않았습니다. 그래도 너무 커서 텍스트가 바인딩에 가까워지면 그림자가 걱정됩니다.