유용정보

pdf 글자 인식 방법

★§§§§§§★ 2016. 10. 12. 00:25

pdf 글자 인식 하는 방법에 대해서 알아보도록 하겠습니다. 피디에프 문서는 뷰어 전용으로 제작되었기 때문에 글자를 복사해서 사용할 수 없습니다. 물론, 오픈되어 있는 경우도 있지만 대부분 금지되어 있습니다.


참고 자료 중에 pdf 문서가 있다면 곤란한 상황이 발생하는데요. 오늘 알려드리는 방법을 사용하면 pdf 글자 복사를 쉽게 할 수 있습니다. 일일이 타자를 하지 않고 사용할 수 있어서 좋습니다.


pdf 글자 인식


프로그램을 설치해서 사용하는 방법과 인터넷 사이트에서 이용하는 2가지 방법을 통해서 pdf 글자 인식을 해보도록 하겠습니다. 


pdf 파일에서 텍스트 추출


먼저, nPDF 프로그램을 통해서 텍스트를 복사해보도록 하겠습니다. 설치 파일은 인터넷에서 무료로 받을 수 있어요. 포털 사이트에서 검색하면 됩니다.


처음 실행하면 위와 같은 기능 목록을 볼 수 있는데요. 밑에서 두 번째 항목에 PDF 파일에서 텍스트 추출이 있습니다. 이것을 선택하시고, 다음 버튼을 클릭하세요.


파일 선택과 저장 버튼


다음으로 파일 선택 버튼을 눌러주세요. pdf 문서를 선택할 수 있는 창이 나타납니다. 글자를 인식하고 싶은 파일을 열어주세요. 페이지 범위를 선택하시고, 아래에 있는 저장 버튼을 누르면 됩니다.


메모장으로 파일 열기


위의 화면에서 볼 수 있는 것처럼 피디에프 문서 속에 들어 있는 텍스트가 추출되어서 *.txt 형식으로 저장됩니다. 메모장 프로그램으로 열어서 사용하시면 됩니다.


레티아 이미지 선택


이번에는 레티아 사이트를 활용하는 방법입니다. 이미지 속에 있는 글자를 추출해주는  OCR 기능을 사용하는 것인데요. 하루에 10번까지 무료로 사용할 수 있습니다.


이미지 선택 버튼을 누르고, pdf 글자 인식을 원하는 문서를 열어주시기 바랍니다. 언어는 한국어를 선택하시고, 다음 버튼을 클릭하도록 합니다.


이메일 주소 입력


변환된 파일은 사용자의 이메일로 전송이 됩니다. 파일을 받을 수 있는 자신의 이메일 주소를 입력하시기 바랍니다. 문서 형식은 MS 워드(doc)로 저장됩니다. 다음 버튼을 누르면 자동으로 변환 과정이 진행됩니다. 입력한 이메일에서 파일을 받으셔서 사용하시기 바랍니다.