Evernote에서 OCR 텍스트 추출


13

Evernote 는 저장 한 이미지에 대해 OCR을 수행합니다. Evernote의 이미지와 동일한 텍스트를 얻을 수있는 방법이 있습니까, 아니면 OCR 만 검색 할 수 있습니까?

답변:


15

Evernote API에는이 텍스트가 이미지 안에있는 텍스트와 사각형을 가져 오는 기능이 있습니다. http://evernote.com/about/developer/api/evernote-api.htm을 참조 하고 "Evernote Recognition Index XML 형식"및이를 검색하는 기능을 확인하십시오. 문제는 그들이 전통적인 OCR을하지 않는다는 것입니다. 그들의 OCR 알고리즘은 이미지에서 하나의 "단어"에 대해 다른 단어를 생성 할 수 있습니다. 그들이 사용하는 것은 검색뿐이므로 인식 엔진으로 사용하기에는 적합하지 않습니다. (각 단어에 대해 가중치를 부여하더라도 사용할 수 있습니다)


11

또한 Evernote는 특정 이미지가 정확히 한 단어에 해당한다고 결정하지 않습니다. 예를 들어, Evernote는 특정 이미지가 "단서"이고 "적절하지 않다"고 판단하지 않습니다. 오히려 둘 다 추적하며 둘 중 하나를 검색하면 동일한 이미지가 반환됩니다. 따라서 Evernote는 전체 텍스트가 실제로 무엇인지 결정할 수 없기 때문에 전체 텍스트를 얻을 수있는 방법이 없습니다.


5

evernote는 ocr-stuff의 제작자에게 알맞은 금액을 지불하거나 무언가를 합치기 위해 알맞은 금액을 지불했습니다. 따라서 추출 된 텍스트 (+ 이미지의 위치)를 얻을 수 있는지 의심 스럽습니다.

(다른 사람들의 이미지를 스캔하고 좋은 ocr을 제공하는 비즈니스 모델 일 수 있음)

대답은 '아니요'입니다.


3
사실이 아닙니다. 이 정보를 정확하게 얻기위한 API가 있습니다. 내 대답을 참조하십시오.
피터 Štibraný

2

정교함이 얼마나 필요한지 잘 모르겠지만 Adobe Acrobat도 사용하고 있기 때문에 Evernote 첨부 파일을 마우스 오른쪽 버튼으로 클릭하면 Acrobat으로 열립니다.

그런 다음 Acrobat에서 "문서 | OCR 텍스트 인식"을 선택한 다음 문서를 일반 텍스트로 저장합니다.

가끔 OCR 변환이 필요하기 때문에 이것은 잘 작동합니다.


1

Evernote에서 모든 이미지를 가져올 수 있다면 Google 문서 도구로 OCR을 수행 할 수 있습니다.

이미지 폴더를 Google 문서 도구에 업로드하고 이미지로 변환하여 이미지와 OCR 텍스트를 모두 포함 할 수 있습니다.

그런 다음이 모든 문서를 일반 텍스트로 일괄 다운로드하면 이미지가 제거됩니다.

모든 Evernote 이미지의 이름을 해시 (예 md5:)로 지정하면 Google 문서에서 다운로드 한 일반 텍스트 파일을 원본 이미지와 쉽게 연결할 수 있습니다.


0

저는 Windows를 사용하고 있으며 Adobe Acrobat Pro 및 Word를 사용하므로 다음을 수행합니다.

  1. 파일이 JPG로 저장되지 않은 경우 Evernote에서 이미지의 왼쪽 상단에있는 안구 아이콘을 클릭하여 사진 뷰어에서 파일을 열고 파일> "사본 만들기"를 클릭하여 JPG로 저장하십시오.
  2. 탐색기에서 이미지 파일을 찾습니다
  3. 마우스 오른쪽 버튼으로 클릭하고 Adobe PDF로 변환을 선택하십시오 (파일은 Acrobat에서 열립니다)
  4. 파일> 다른 이름으로 저장을 클릭하고 "유형으로 저장"드롭 다운에서 리치 텍스트 형식을 선택하여 리치 텍스트 파일로 저장하십시오 (파일 처리에 1 분 소요).
  5. 탐색기에서 RTF 파일을 찾아 두 번 클릭하여 Word에서 엽니 다.
  6. 필요에 따라 편집

이것은 Evernote의 이미지가 아니라 주어진 이미지 파일에서 텍스트를 추출하는 방법에 대한 조언으로 보입니다. 이것이 원래의 질문에 어떻게 대답하는지 명확하게 설명 할 수 있습니까?
music2myear
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.