16.04에서 Tesseract 용 새 언어 팩을 설치하는 방법


19

Tesseract뿐만 아니라 gscan2pdf v1.3.9를 설치했습니다. 후자는 먼저 설치된 소프트웨어 목록의 맨 아래에 표시되었지만 여전히 작동하지만 사라지는 것 같습니다.

어쨌든 스캔 한 문서의 PDF를 편집 가능한 텍스트로 바꾸려고하지만 문서가 영어가 아니므로 gscan이 엉망이됩니다.

내가 갈 때 옵션 만 내가 얻을 수 Tools > OCR > Language to recognize있다 English, equ그리고 osd. 특정 언어 팩을 설치하는 방법에 대한 아이디어가 있습니까?

나는 경험이 많은 Linux 사용자가 아니므로 단계별 지침을 높이 평가할 것입니다.

답변:


33

다음을 사용하여 필요한 ocr 언어를 설치하십시오.

sudo apt-get install tesseract-ocr-[lang]

여기서 [랭] 일 수있다

all

또는

afr
amh
ara
asm
aze
aze-cyrl
bel
ben
bod
bos
bul
cat
ceb
ces
chi-sim
chi-tra
chr
cym
dan
dan-frak
deu
deu-frak
dev
dzo
ell
enm
epo
est
eus
fas
fin
fra
frk
frm
gle
gle-uncial
glg
grc
guj
hat
heb
hin
hrv
hun
iku
ind
isl
ita
ita-old
jav
jpn
kan
kat
kat-old
kaz
khm
kir
kor
kur
lao
lat
lav
lit
mal
mar
mkd
mlt
msa
mya
nep
nld
nor
ori
pan
pol
por
pus
ron
rus
san
sin
slk
slk-frak
slv
spa
spa-old
sqi
srp
srp-latn
swa
swe
syr
tam
tel
tgk
tgl
tha
tir
tur
uig
ukr
urd
uzb
uzb-cyrl
vie
yid

1
'eng'도 목록에 있어야합니다.
Will
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.