홈페이지 » 어떻게 » Linux에서 PDF 파일의 이미지를 추출하고 저장하는 방법

    Linux에서 PDF 파일의 이미지를 추출하고 저장하는 방법

    "pdftotext"명령 줄 도구를 사용하여 Linux에서 PDF 파일을 편집 가능한 텍스트로 쉽게 변환 할 수 있습니다. 그러나 원본 PDF 파일에 이미지가 있으면 추출되지 않습니다. PDF 파일에서 이미지를 추출하려면 "pdfimages"라는 다른 명령 줄 도구를 사용할 수 있습니다..

    참고 :이 글에서 뭔가를 말하고 텍스트 주위에 따옴표가 있다고 말하면 따로 지정하지 않으면 따옴표를 사용하지 마십시오..

    "pdfimages"도구는 poppler-utils 패키지의 일부입니다. 이 문서에서 설명하는 단계를 사용하여 시스템에 설치되어 있는지 확인하고 필요한 경우 설치하십시오..

    pdfimages를 사용하여 PDF 파일에서 이미지를 추출하려면 "Ctrl + Alt + T"를 눌러 터미널 창을 엽니 다. 프롬프트에서 다음 명령을 입력하십시오..

    pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    참고 :이 문서에 나와있는 모든 명령에 대해 명령의 첫 번째 경로와 PDF 파일 이름을 원래 PDF 파일의 경로와 파일 이름으로 바꿉니다. 두 번째 경로는 추출 된 이미지를 저장할 루트 폴더의 경로 여야합니다. 두 번째 경로의 끝에있는 "이미지"라는 단어는 파일 이름을 앞에두고 싶은 것을 나타냅니다. 이미지의 파일 이름은 자동으로 번호가 매겨집니다 (000, 001, 002, 003 등). 각 이미지의 시작 부분에 텍스트를 추가하려면 두 번째 경로 끝에 해당 텍스트를 입력하십시오. 이 예에서 각 이미지 파일 이름은 image-001.ppm, image-002.ppm 등과 같이 "image"로 시작합니다. 지정한 텍스트와 숫자 사이에 대시가 추가됩니다.

    기본 이미지 형식은 단색이 아닌 이미지의 경우 PPM (휴대용 픽스맵), 단색 이미지의 경우 PBM (휴대용 비트 맵)입니다. 이러한 형식은 플랫폼간에 쉽게 교환되도록 설계되었습니다..

    참고 : PDF 파일의 각 이미지에 대해 두 개의 이미지 파일을 가져올 수 있습니다. 각 이미지의 두 번째 이미지는 비어 있으므로 파일 관리자의 파일에있는 축소판을 통해 파일의 이미지가 포함 된 이미지를 알 수 있습니다..

    .jpg 이미지 파일을 만들려면 아래 그림과 같이 "-j"옵션을 명령에 추가하십시오.

    pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    참고 : "-png"옵션 또는 "-tiff"옵션을 사용하는 TIFF를 사용하여 기본 출력을 PNG로 변경할 수도 있습니다.

    각 이미지의 주 이미지 파일은 .jpg 파일로 저장됩니다. 두 번째 빈 이미지는 여전히 .ppm 또는 .pbm 파일입니다..

    특정 페이지에서 또는 이후에만 이미지를 변환하려면 아래 예제 명령에서와 같이 숫자가있는 "-f"옵션을 사용하여 변환 할 첫 번째 페이지를 지정하십시오.

    pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    참고 : "-j"옵션을 "-f"옵션과 결합하여 .jpg 이미지를 얻고 아래에서 언급 한 "-l"옵션과 동일하게 수행했습니다..

    특정 페이지 앞뒤에있는 모든 이미지를 변환하려면 아래 그림과 같이 변환 할 마지막 페이지를 나타내는 숫자가있는 "-l"(숫자 "1"이 아닌 소문자 "L") 옵션을 사용하십시오.

    pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    참고 : "-f"및 "-l"옵션을 함께 사용하면 문서의 중간에있는 특정 페이지 범위의 이미지를 변환 할 수 있습니다.

    PDF 파일에 소유자 암호가있는 경우 "- opw"옵션과 암호를 작은 따옴표로 묶어 사용하십시오 (아래 그림 참조). PDF 파일의 암호가 사용자 암호 인 경우 암호 대신 "-upw"옵션을 사용하십시오.

    참고 : 명령에 암호 주위에 작은 따옴표가 있는지 확인하십시오.

    pdfimages -opw 'password'-j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    pdfimages 명령 사용에 대한 자세한 내용을 보려면 터미널 창에서 "pdfimages"를 입력하고 "Enter"키를 누릅니다. 명령 사용법은 명령에 사용할 수있는 옵션 목록과 함께 표시됩니다.