PDF에서 복사 할 때 줄 형식

PDF 파일에서 단어로 텍스트를 복사하려고하는데 단어 파일에 텍스트를 붙여 넣을 때 PDF 파일의 줄이 "짧아"서 전체 줄을 단어로 표시하지 않으므로 수동으로해야합니다. 문장을 합쳐서 평소처럼 보이게합니다 (백 스페이스 사용).

PDF 복사 붙여 넣기를 시도했지만 다소 작동하지만 모든 줄 바꿈을 제거하여 단락이 유지되지 않지만 복사하려고하는 파일이 상당히 커서 실제 단락을 유지해야합니다. 가능한 한 줄에 맞게 단어를 만들고 실제 단락을 존중하는 방법이 있습니까?

microsoft-word pdf formatting microsoft-word-2013 format

— 멕시코 바니
소스

PDF의 텍스트는 절대적으로 배치 된 텍스트 조각으로 구성되며 일반적인 경우 줄과 단락 나누기가 구체적으로 표시되지 않습니다. 따라서 올바르게 결정하는 작업은 복잡한 작업 인 OCR보다 더 많아지며 만족스러운 결과를 얻으려면 복잡한 소프트웨어가 필요할 것입니다.

예를 들어 MS Word 자체에는 PDF 문서를 가져 오는 기능이 있지만 나누기를 완벽하게 인식하지는 못합니다 (예 : 텍스트 조각이 약간 '기울어 진'경우 (예 : 스캔 및 OCR) 서류).

— 보리 슬라 프 이바노프
소스