텍스트 사진을위한 최고의 카메라 설정?


11

SCR을 사용하여 OCR 용 텍스트 문서 (종이 및 마이크로 필름)를 사진으로 찍고 있습니다. 이미 마이크로 필름 용 컴퓨터 화면을 가장 잘 찍는 방법에 대한 문제에 대해 질문 했지만 텍스트를 선명하고 또렷하게 표현할 수있는 가장 좋은 방법은 텍스트를 찍는 방법에 대한 생각입니다. 여기 내 현재 생각이 있지만, 나보다 사진 경험이 더 많은 사람이하는 말을 듣고 싶습니다 :

  1. 더 작은 메가 픽셀 수 (S95의 최대 값이 아닌 6 ~ 7MP, 즉 10MP)를 사용하고 있으므로 실제로 PDF 파일을 스크롤 할 때 결과 PDF 파일이 컴퓨터를 죽이지 않습니다.

  2. 조리개-낮게 (예 : f / 6.3) 카메라가 페이지와 정확히 평행하지 않은 경우 텍스트의 초점이 유지됩니다.

  3. 셔터 속도-라이브러리가 일반적으로 조명이 낮기 때문에 여기에 트레이드 오프가 있습니다. 따라서 셔터 속도를 높이면 노출을 낮추고 싶지만 삼각대가 없으면 카메라 흔들림의 가능성이 있습니다

  4. ISO-이것이 어떻게 영향을 미치는지 잘 모르겠습니다.

  5. 화이트 밸런스-다시 한 번, 확실하지 않습니다.

카메라에서 여러 가지 설정을 실험 해 보았지만 사진에 대해서만 배우고 있으며 책이나 문서에서 텍스트를 가장 잘 읽을 수있는 방법에 대한 제안이있는 사람이 있는지 알고 싶습니다.


3
왜 작업에 적합한 도구를 사용하고 스캐너를 사용하지 않습니까?
ahockley

7
"작업에 적합한 도구를 사용하고 스캐너를 사용하는 이유는 무엇입니까?" -작업하는 많은 문서를 스캔 할 수 없기 때문입니다. 매우 취약하거나 라이브러리에서 스캔 할 수 없거나 라이브러리에서 페이지 당 $ 0.50 이상의 스캔 비용이 발생합니다.
Jason

2
본인의 의견이 적절한 경우 저작권을 적절하게 존중하기를 바랍니다. :) 그렇게 생각하면 답을 찾을 수 있기를 바랍니다!
lindes

3
"저는 귀하의 사용이 저작권을 적절하게 존중하기를 바랍니다"-예, 제 작품은 저작권 제한을 벗어난 문서를 사용하고 있습니다 (저는 19 세기 후반 유럽에서 주로 공부하는 역사가입니다)
Jason

2
@ahockley : 스캔하지 않는 또 다른 이유는 시간이 오래 걸리기 때문입니다. DSLR을 사용하면 탁상에서 분당 약 20 페이지를 인쇄 할 수 있지만 문서 공급기를 빠르게 사용하고 비용이 많이 드는 스캐너입니다.

답변:


7

카메라에 흑백 모드가 있으면 후 처리 시간을 줄이려고 노력합니다. 또한, 함께 작업 한 많은 OCR 프로그램이 흑백에서 훨씬 더 잘 수행됩니다.

손으로 잡을 때 카메라 흔들림을 줄이려면 셔터 속도를 최대화하기 위해 가장 넓은 조리개가 필요할 수 있기 때문에 가능한 한 페이지와 평행을 이루고 싶을 것입니다. s95의 작은 센서는 DOF를 늘려서 조리개를 최대한 넓게 열 수 있습니다.

OCR을 통해이 기능을 실행한다는 점을 고려하면 흔들림을 최소화하면서 적절한 노출을 제공 할 수있는 수준으로 ISO를 조절하십시오. OCR은 흐릿한 글자보다 추가 노이즈에 대해 불평 할 가능성이 훨씬 낮습니다.

텍스트에 대해서만 이야기한다면 화이트 밸런스는 카메라의 "실내"설정이 무엇이든 상관 없습니다.하지만 솔직히 걱정하지 마십시오.

문서 텍스트가 엄청나게 작고 세부 수준을 명확하게 해결 해야하는 경우에만 메가 픽셀이 중요 할 수 있지만 6-7이 대부분의 경우 잘 될 것이라고 생각합니다.


1
아마도 "페이지에 수직"을 의미 할 것입니다. 평행하다면 텍스트를 읽기가 어렵습니다. ;-)
Craig Walker

@Craig Walker-그는 페이지에 "병렬"이라는 용어를 사용했고 그가 무엇을 의미하는지 이해했기 때문에 혼동하지 않았습니다. 뷰 파인더와 마찬가지로 센서 자체는 말할 것도 없습니다. 카메라의 어느 부분이 참조하는지에 따라 다릅니다. 이 용어는 의도적이었습니다.
rfusca

당신이 할 수있는 가장 큰 화소를 사용하십시오. OCR의 문서는 중요한 것이며, 소스가 모든 텍스트 인 한, 어쨌든 카메라 해상도에 영향을받지 않는 한 비교적 작습니다. Abbyy FineReader를 사용하며 고해상도 이미지 (예 : 10MP 대신 21MP)에서 더 잘 작동합니다. 따라서 10MP로 촬영하십시오.

그럴 수 있지.
Craig Walker

흑백 모드의 경우 +1 텍스트 처리를위한 RGB가 픽셀을 낭비하고 있습니다.
그렉

2

이미 설정을 잘 파악한 것 같습니다. 카메라 흔들림은 다른 무엇보다 텍스트의 가독성을 떨어 뜨릴 것이므로 먼저 최적화하겠습니다. 삼각대를 사용할 수없는 경우 셔터 속도가 초점 거리에서 1 이상 (35mm 환산)인지 확인하십시오. 축소하면이 작업이 쉬워집니다. 손떨림 보정이 있으면 사용하십시오.

조리개는 상당히 넓게 설정할 수 있습니다. 페이지와 평행을 이루십시오. 조리개가 넓 으면 셔터 속도에 도움이되며 조리개가 넓어지면 다시 흐림이 카메라 동작으로 인한 흐림과 비교할 수 없습니다!

ISO, 좋은 노출을 얻기 위해 필요한 모든 것. 소음은 실제로 나빠질 때까지 가독성에 영향을 미치지 않아야합니다.

용지 자체를 기반으로 사용자 정의 화이트 밸런스를 촬영하는 것이 바람직하지만 OCR 소프트웨어는 흰색 배경을 처리 할 수 ​​있어야합니다.


1
  1. JPEG를 PDF로 변환한다고 가정합니다. 최대 크기를 캡처하고 축소 후 및 PDF로 변환하기 전에 선명하게 적용한 상태에서 프로그램을 사용하여 6-7 MP로 축소하는 것이 좋습니다.

  2. 명확히하기 위해 더 넓은 피사계 심도를 위해 더 작은 조리개를 원합니다. 이는 더 높은 f- 스톱 수입니다. (예 : f / 2 대신 f / 8을 원합니다). 가독성을 위해 텍스트를 사용하면 카메라를 최대한 수직으로 향하게하여 피사계 심도에 대해 걱정할 필요가 없습니다. 흰색 텍스트에 검은 색으로 표시되는 CA와 같은 수차를 줄이려면 크게 열지 말고 조금 멈추는 것이 좋습니다. 용지에 가까울수록 피사계 심도가 얕아집니다.

  3. 핸드 홀드 인 경우 가독성에 가장 큰 영향을 줄 수 있습니다. 핸드 홀드 인 경우 셔터 속도가 1 / (35mm 초점 거리)보다 빠르거나 더 빨라지도록 셔터 속도를 선택하려고합니다. 이는 P & S에서 사용중인 줌 설정에 따라 다릅니다. 광폭을 사용하면 셔터 속도가 길어 지지만 배럴 왜곡이 발생할 수 있습니다. 컴퓨터 화면이 아닌 텍스트 문서를 촬영하는 경우 플래시를 사용하는 것이 좋습니다.

    가능하면 문서를 위로 올리거나 (누르거나 평평한 상태로) 카메라를 무언가 위에 놓고 원하는만큼 셔터 속도를 유지할 수 있습니다. 빈백이나 작은 물체를 사용하여 카메라를 놓을 때 각도를 조절할 수도 있습니다. 또한 P & S를위한 수통 삼각대 어댑터를 얻을 수 있습니다.

  4. 조리개, 셔터 속도 및 ISO는 노출 삼각형을 형성합니다. 그것에 대해 읽고 여기 . ISO가 높을수록 조리개가 좁아지고 셔터 속도가 짧아 지지만 이미지에 노이즈가 생깁니다. 텍스트가있는 P & S에 대해서는 낮은 ISO (400 이하)를 권장합니다.

  5. 조명 상황에 맞는 화이트 밸런스를 선택하십시오. 형광등이 있다면 그것을 사용하십시오. 플래시를 사용하는 경우 플래시 화이트 밸런스를 사용하십시오.


나는 f / 8이 실내에서 핸드 헬드 촬영에 현실적인 것이라고 생각하지 않습니다 (플래시를 사용하지 않으면 라이브러리에 먼저 허가를 요청하지 않는 한) f / 8은 작은 센서로 산만하게 할 것입니다. 셔터 시간 / ISO 증가에 비해.
매트 그럼

@Matt f / 8은 피사계 심도를 높이기 위해 더 높은 숫자를 원한다는 것을 보여주는 예입니다 (CA와 같은 다른 수차를 줄일 수 있음). 나는 그가 얼마나 많은 빛을 가지고 있는지 잘 모르기 때문에 그에게 지침을주지 않았습니다. 기분 전환? 회절을 의미합니까?
Eruditass

그래, 나는 회절을 의미했다-나는 그것을 정확하게 철자해도 단어를 자동으로 수정하는 성가신 습관을 가지고 전화로 이것을 쓰고있다. CA는 카메라 흔들림과 비교할 때 큰 문제가되지 않을 것입니다. 빛이 큰 문제라면 광폭에서 멈추는 것이 가장 좋을 것 같습니다 ...
Matt Grum

당신은 기술을 사랑하지 않습니까? 네, 와이드 오픈에서 한 번에 멈추는 것이 좋은 지침이며 카메라 흔들림이 핵심이라고 동의합니다.
Eruditass

최대 MP로 촬영 한 다음 컴퓨터에서 다운 샘플링하는 것이 좋습니다. 선명하게하기 + 대비를 크게하면 텍스트가 더 선명 해지고 읽기가 더 쉽다는 것을 상상할 수 있습니다.
Jason

1

컴퓨터에서 사용 가능한 최고 해상도로 축소하기위한 제안에 동의합니다. 또한 카메라에서 얻을 수있는 최고 품질의 jpeg를 선택하거나 카메라가 허용하는 경우 생식을 촬영하고 뻣뻣한 또는 png로 변환하십시오. jpeg의 손실 압축은 잉크 / 용지 경계 주위에 인공물을 생성하여 ocr 소프트웨어를 혼동시킬 수 있습니다.

일반적으로 원하는 것은 가장 선명한 이미지를 얻을 수있는 설정을 사용하는 것입니다. 컴퓨터에서 대비, 화이트 밸런스 등을 모두 변경할 수 있습니다. 사실, 포토샵이나 김프에서 레벨 도구 또는 대비 / 밝기 도구를 사용하여 대비를 높이면 많은 도움이 될 수 있습니다.

또한 그레이 스케일 형식으로 변환하면 파일 크기가 크게 줄어 듭니다. 그렇게하고 대비를 높이면 화이트 밸런스에 대해 걱정할 필요가 없습니다. 화이트 밸런스를 시험해 볼 수도 있지만 일부 설정은 다른 설정보다 대비가 더 좋을 수 있습니다 (조명에 따라 다름).

컴퓨터에서 처리 할 수 ​​있으면 크기를 조정하기 전과 크기를 조정 한 후에 이미지에 선명하게 필터를 적용하십시오.


1

다른 곳에서는 보지 못했던 몇 가지 생각이 믹스에 추가됩니다.

  • 당신이 경우 촬영 (자세한 "확대" 망원 , 당신이 다음 가까이에있을 것이다 구석에 크기의 텍스트 (단어에 대해 당신에게 더 일관된 이미지를 줄 것이다 페이지에서 추가 촬영을하게됩니다) 중간에있는 단어와 같은 크기입니다. 광각을 사용하면 이와 관련하여 왜곡이 발생할 수 있습니다. 여기에 "이상적인"설정이 무엇인지 잘 모르겠으며, 필요한 셔터 속도, 아마도 생각해야 할 것에 대한 절충입니다.

  • " 과다 노출 "을 원한다면 카메라가 생각하는 것과 기본적으로 맞을 것입니다. , 기본 톤 (용지 자체)이 카메라가 노출하려고하는 주요한 것이기 때문에 용지를 중간 노출로 과다 노출하면됩니다. 더 복잡한 출발점. 스톱 및 1/2에서 2 스톱으로 "과다 노출"하는 경우 (클리핑 하이라이트 지점으로 이동하지 마십시오) 텍스트는 여전히 밝고 어두워 야하지만 용지는 밝고 밝아 져 대비가 구분됩니다 ( 따라서 OCR)이 더 쉽습니다.

  • 이 시도 도 조명 - 페이지 한쪽 모서리가 다른 것보다 훨씬 더 밝거나 어두운 경우, 이것은 당신이 가장 가능성이 OCR 목적으로하고자하는 순수한 검은 색과 순수한 흰색에에서 별도의 것들에 어렵게 만들 것입니다.

  • "복사 스탠드"는 이와 같은 프로젝트에 이상적입니다. 라이브러리에서 쉽게 가질 수있는 것 이상으로 가정하지만 라이브러리 구성 방식에 따라 어딘가에있을 수 있습니다 (아마도 선반이있을 수 있음) 볼 헤드가있는 수퍼 클램프를 배치 할 수있는 책상 (또는 조명 또는 이와 유사한 것을 보유하고있는 막대) ( 여기서는 하나 이지만 적절한 크기 (헤드에 따라 다름) "스터드"및 일종의 삼각대가있는 수퍼 클램프 그러면 카메라가 책상 (또는 기타) 표면에 장착되어 노출이 더 길어야하는 경우 일관된 위치와 안정성을 유지할 수 있습니다. 기본적으로 이것은 "가난한 사람의"카피 스탠드에 해당합니다.

    버튼을 눌러 카메라 흔들림을 피하기 위해 짧은 셀프 타이머 또는 리모컨 을 사용하고 싶을 수도 있습니다 (카메라에는 2 초 셀프 타이머 모드가 있고 아마도 더 짧은 사용자 정의 모드가 있다고 생각합니다).

그게 내가 생각하는 전부 야 잘하면 도움이 될 것입니다.


1

나는 당신이 landman 사진과 같은 일을하고 몇 년 동안 그것을 해왔다. 대부분의 사람들은 그들이 무슨 말을하는지 몰라 나를 믿어 라 !!!

  1. M 또는 수동의 카메라

  2. ISO 100-200이 높을수록 밝아 지지만 그림에서 더 많은 입자 또는 노이즈가 발생합니다.

  3. 셔터 스피드 1/100 ~ 1/160

  4. 조리개 또는 f2.7 (평면 페이지 인 심층 시야가 필요한 이유)

  5. 6 ~ 10 메가 픽셀의 컬러로 촬영하고, 화이트 밸런스 설정 (보통 1 또는 2 형광등)을 살펴본 후 대부분의 벨을 끄고 Ur가 확실하게 끄지 않으면 휘슬

  6. acdc를 사용하여 comp에 사진 노출


0

몇 가지 작은 제안이지만 설정이 좋아 보인다고 생각합니다.

  1. 삼각대를 사용하십시오. 이렇게하면 카메라 흔들림과 관련된 모든 문제가 해결되며 필요한만큼 노출을 사용할 수 있습니다.

  2. 렌즈에 똑바로 반사되어 원하지 않는 부분이 강조 될 수있는 각도로 용지에 빛이 직접 닿지 않도록하십시오. 이것은 일반적으로 측면에서 빛이 들어오는 것을 의미합니다.

  3. ISO : 경험상, 더 낮은 값을 향해 실수해야하지만, 물질적 차이가 빨리 분명해질 것입니다.

그 외에도 설정을 향상시킬 수있는 방법을 생각할 수 없습니다. 솔직히 말해서, 나는 당신이 그것을 가지고 있다고 생각합니다.


유용하고 좋은 저렴한 삼각대를 제안 할 수 있고 카메라를 뒤집어 사진 페이지와 평행을 이룰 수 있습니까? 나는 Joby 삼각대를 보았고 유망한 것처럼 보였지만 셔터를 누를 때 종종 이동한다고 들었습니다.
Jason

@ 제이슨, 페어 포인트. 나는 Joby를 좋아하지만 셔터를 누를 때 움직임을 멈추려면 원격 셔터를 사용하거나 셀프 타이머를 사용하십시오. 느린 셔터 속도를 사용하는 경우 항상 유용한 팁입니다. 나쁜 소식은 매우 안정적 일 정도로 무거운 삼각대는 싸지 않다는 것입니다. 미안합니다! (당신이 다르게 발견하면 알려주세요!);)
AJ Finch

0

그것은 당신이 이미 대부분의 답변을 가지고있는 것처럼 들립니다.

  1. 해상도 : 맞습니다. 특히 화면의 이미지를보고자하는 경우에는 여기에 많은 해상도가 필요하지 않습니다. 아마 최대 일반 화면 해상도의 두 배로 모자를 썼을 것입니다.

  2. 조리개 : 약간의 피사계 심도 흔들림 공간을 얻기 위해 더 작은 조리개를 선택하는 것이 맞습니다. 그러나, 당신은 아마 많이 필요하지 않을 것입니다. 와 함께 플레이 필드 계산기의 깊이 합리적인 DOF 밖으로 당신의 초점 거리, 그림에 대한 다음 당신이 할 수있는 가장 큰 구경과 함께 할 것입니다. (그러나 최상의 선명도를 위해 최대 조리개 아래에서 2 ~ 2 정도 위치에 있어야합니다.) 셔터와 ISO로 더 많은 공간을 확보 할 수 있도록 가장 큰 조리개를 원합니다. 아래를 참조하십시오.

  3. 셔터 : 분명히 충분한 빛을 얻으면서 흔들림을 줄이려면 가능한 한 빠른 속도를 원합니다. 나는 다양한 소스들이 흔들림을 피하기 위해 "초점 거리와 같은 셔터 속도"를 요구한다고 들었습니다. 일부는 두 배로 청구합니다. 따라서 50mm 렌즈를 사용하는 경우 셔터 속도를 1/50과 1/100 사이로 유지하십시오. 그런 후에는 빛을 최대화하기 위해 가장 느린 속도를 시도하십시오.

  4. ISO :이를 상당히 높일 수 있어야합니다. 노이즈로 인해 그림 모양이 줄어들 수 있지만 가독성이 크게 저하되지는 않습니다. "높은 ISO"와 "너무 시끄러운"은 카메라에 따라 다릅니다. 실험. 조리개와 셔터에 비해 저조도에서 올바른 노출을 얻는 가장 좋은 방법 일 것입니다.

  5. 화이트 밸런스 : 너무 중요하지는 않습니다. 사진 용지가 흰색으로 보이면 문제가됩니까? (물론 풀 컬러 사진으로 책을 촬영하는 경우 다른 이야기). 우편으로 수정하려면 중성 색 용지가 많기 때문에 상대적으로 쉬운 시간이 있습니다. 카메라를 자동 화이트 밸런스에두고 잊어 버렸을 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.