홈페이지 » 어떻게 » Linux에서 명령 줄을 사용하여 PDF 파일을 편집 가능한 텍스트로 변환하는 방법

    Linux에서 명령 줄을 사용하여 PDF 파일을 편집 가능한 텍스트로 변환하는 방법

    PDF 파일을 편집 가능한 텍스트로 변환하려는 여러 가지 이유가 있습니다. 어쩌면 이전 문서를 수정해야하며 PDF 버전 만 있으면됩니다. Windows에서 PDF 파일을 변환하는 것은 쉽지만 Linux를 사용하는 경우에는 무엇이 있습니까??

    걱정 마. "poppler-utils"패키지의 일부인 pdftotext라는 명령 줄 도구를 사용하여 PDF 파일을 편집 가능한 텍스트로 쉽게 변환하는 방법을 알려 드리겠습니다. 이 도구는 이미 설치되었을 수 있습니다. pdftotext가 시스템에 설치되어 있는지 확인하려면 "Ctrl + Alt + T"를 눌러 터미널 창을 엽니 다. 프롬프트에서 다음 명령을 입력하고 "Enter"키를 누릅니다..

    dpkg -s poppler-utils

    참고 :이 글에서 뭔가를 말하고 텍스트 주위에 따옴표가 있다고 말하면 따로 지정하지 않으면 따옴표를 사용하지 마십시오..

    pdftotext가 설치되어 있지 않으면 프롬프트에서 다음 명령을 입력하고 "Enter"키를 누릅니다..

    sudo apt-get install poppler-utils

    메시지가 나타나면 암호를 입력하고 "Enter"키를 누릅니다..

    poppler-utils 패키지에는 PDF를 다른 형식으로 변환하고, PDF 파일을 조작하고, 파일에서 정보를 추출하는 데 사용할 수있는 몇 가지 도구가 있습니다.

    다음은 PDF 파일을 편집 가능한 텍스트 파일로 변환하는 기본 명령입니다. "Ctrl + Alt + T"키를 눌러 터미널 창을 열고 프롬프트에서 명령을 입력 한 다음 "Enter"키를 누릅니다..

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    원래 PDF 파일의 위치와 이름 및 결과 텍스트 파일을 저장할 위치에 해당하는 각 파일의 경로를 변경합니다. 또한 파일 이름을 파일 이름과 일치하도록 변경하십시오.

    텍스트 파일은 Linux에서 다른 텍스트 파일을 열 때와 마찬가지로 만들어지며 열 수 있습니다.

    변환 된 텍스트는 원하지 않는 곳에 줄 바꿈 문자를 가질 수 있습니다. 줄 바꿈은 PDF 파일의 모든 텍스트 줄 뒤에 삽입됩니다..

    "-layout"플래그를 사용하여 변환 된 텍스트 파일의 원본 PDF 파일에서 문서 (헤더, 바닥 글, 페이징 등)의 레이아웃을 유지할 수 있습니다.

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    PDF 파일의 페이지 범위 만 변환하려면 "-f"및 "-l"(소문자 "L") 플래그를 사용하여 변환하려는 범위의 첫 페이지와 마지막 페이지를 지정하십시오.

    pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    보호되고 소유자 암호로 암호화 된 PDF 파일을 변환하려면 "-opw"플래그를 사용하십시오 (플래그의 첫 문자는 0이 아닌 소문자 "O"입니다).

    pdftotext -opw 'password'/home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    "암호"는 변환중인 원본 PDF 파일을 보호하는 데 사용되는 암호로 변경하십시오. "암호"주위에 이중 따옴표가 아닌 작은 따옴표가 있는지 확인하십시오..

    PDF 파일이 보호되고 사용자 암호로 암호화 된 경우 "-opw"플래그 대신 "-upw"플래그를 사용하십시오. 명령의 나머지 부분은 동일합니다..

    변환 된 텍스트에 적용되는 행의 끝 문자 유형을 지정할 수도 있습니다. 이 기능은 Windows 또는 Mac과 같은 다른 운영 체제의 파일에 액세스하려는 경우에 특히 유용합니다. 이렇게하려면 "-eol"플래그를 사용하십시오 (플래그의 가운데 문자는 0이 아닌 소문자 "O"입니다) 뒤에 공백과 사용하려는 줄 끝 문자 유형이옵니다 ( " unix ","dos "또는"mac ").

    참고 : 텍스트 파일의 파일 이름을 지정하지 않으면 pdftotext는 자동으로 PDF 파일 이름의 기본 파일을 사용하고 ".txt"확장자를 추가합니다. 예를 들어, "file.pdf"는 "file.txt"로 변환됩니다. 텍스트 파일이 "-"로 지정되면 변환 된 텍스트가 stdout으로 보내집니다. 이는 텍스트가 터미널 창에 표시되고 파일에 저장되지 않음을 의미합니다..

    터미널 창을 닫으려면 왼쪽 상단의 "X"버튼을 클릭하십시오..

    pdftotext 명령에 대한 자세한 내용을 보려면 터미널 창에서 프롬프트에 "man page pdftotext"를 입력하십시오..