MS Office 파일에서 텍스트 및 이미지 추출 방법
MS Word 또는 MS Powerpoint 파일에서 이미지 나 텍스트를 추출해야 할 필요성이 제기 될 수 있습니다. 일반적으로 이것은 수동 복사 및 붙여 넣기를 포함 할 수 있습니다. 한 번에 한 페이지 씩, 대용량 파일의 경우에는 시간이 많이 걸릴 것입니다..
글쎄, 우리는 당신을 도울 수있는 간단한 속임수가있다. 새로운 형식의 파일에서 이미지와 텍스트를 추출한다. 즉, DOCX, PPTX, XLSX와 같은 반면 이전 형식 인 DOC, PPT, XLS 파일은 자유 소프트웨어 이미지를 쉽고 빠르게 추출 할 수 있도록 도와줍니다..
노트 : 이 게시물을 시연하기 위해 MS Word 파일 만 사용합니다. 이 프로세스는 MS Powerpoint 및 MS Excel 파일에 대해 동일합니다..
이 기사에서 다루는 내용은 다음과 같습니다.
- DOCX, PPTX, XLXS 파일에서 이미지와 텍스트를 추출하는 방법
- 단일 DOC, PPT 또는 XLS 파일에서 이미지를 추출하는 방법
- 여러 DOC, PPT 또는 XLS 파일에서 이미지를 추출하는 방법
- 어떻게 이미지를 추출 할 것인가? “웹 페이지로 저장” 방법
- XML 대신 일반 텍스트를 추출하는 방법
DOCX, PPTX, XLXS 파일에서 이미지 및 텍스트를 추출하는 방법
단계를 수행하기 전에 파일이 들어있는 폴더를여십시오. 딸깍 하는 소리 구성> 폴더 및 검색 옵션>보기 과 선택을 취소하다 알려진 파일 형식의 확장명 숨기기. 이제 각 파일 이름과 함께 파일 확장명을 볼 수 있습니다..
-
찾아서 선택하십시오. 이미지 및 텍스트를 추출하려는 파일 (참고 : 해당 파일의 복사본을 만드는 것이 좋습니다). 이 예에서는 대상 파일 이름이 샘플 File.docx.
-
프레스 F2 파일의 이름을 바꾸고 확장자 이름을 다음과 같이 바꿉니다. .지퍼.
-
파일 확장자의 변경을 확인하는 경고가 표시됩니다. 딸깍 하는 소리 예.
-
마우스 오른쪽 버튼으로 클릭 ZIP 파일에 다음을 클릭하십시오. 파일의 압축을 풉니 다.
-
압축을 푼 데이터가 들어있는 폴더를 찾아서 연 다음 워드.
-
여기에 몇 개의 폴더와 XML 파일이 표시됩니다. 에서 미디어 폴더에서 추출한 이미지를 찾을 수 있습니다. 추출 된 텍스트의 경우 document.xml 메모장 또는 XML 메모장 파일.
다음에서 찾을 수 있습니다. 미디어 폴더.
![](http://savtec.org/img/images_1/how-to-extract-text-images-easily-from-ms-office-files_7.jpg)
단일 DOC, PPT 또는 XLS 파일에서 이미지를 추출하는 방법
MS office 파일에서 이미지를 추출하려면 이전 형식, 위의 방법은 이미지와 함께 작동하지 않습니다. 이를 위해 Office Image Extraction Wizard라는 무료 도구가 필요합니다. 이 도구는 2012 년까지 MS Office 파일과 함께 작동하며 한 번에 하나 또는 여러 개의 MS Office 파일과 함께 작동합니다..
-
다운로드 및 설치하다 Office 이미지 추출 마법사.
-
이미지를 추출 할 문서를 선택하십시오.이 예제에서는 이름이 지정된 폴더로 이동합니다. Ch1.doc)를 선택하고 출력 폴더를 선택하십시오. 옵션을 선택하여 모든 출력 이미지를 저장할 폴더를 만들도록 선택할 수 있습니다. 여기에 폴더 만들기. 완료되면을 클릭하십시오. 다음 것.
-
딸깍 하는 소리 스타트 과정을 시작하기 위해.
-
이미지 추출 프로세스가 완료되면을 클릭하십시오. 대상 폴더를 열려면 여기를 클릭하십시오. 출력 폴더가 열립니다..
-
아래에서 볼 수 있듯이 프로그램에서 Ch1 폴더.
-
추출 된 이미지는 폴더 안에 있습니다..
여러 DOC, PPT 또는 XLS 파일에서 이미지를 추출하는 방법
-
DOC, PPT 또는 XLS 형식의 여러 파일에서 이미지를 추출하려면 배치 모드 왼쪽 하단에 옵션이 있습니다..
-
클릭 파일 추가 그리고 고르다 이미지를 추출 할 파일 기다려라. Ctrl 버튼을 사용하여 한 번에 여러 파일을 선택할 수 있습니다. 파일을 선택한 후 다음을 클릭하십시오. 다음 것.
-
딸깍 하는 소리 스타트.
-
프로세스가 완료되면 출력 폴더. 여기에서 볼 수 있습니다. 두 개의 폴더 원본 파일 이름. 열다 이 폴더는 원본 MS Office 파일에서 압축 해제 된 이미지를 볼 수 있습니다..
"웹 페이지로 저장"방법으로 이미지를 추출하는 방법
두 가지 방법 모두 사용할 수있는 또 다른 방법이 있습니다. 더 새로운 과 더 오래된 MS 오피스 파일.
-
DOCX 또는 XLSX 파일을 열고를 클릭하십시오. 파일> 다른 이름으로 저장> 컴퓨터> 브라우저 파일을 다른 이름으로 저장 웹 페이지.
-
위치하고 있다 웹 페이지를 저장 한 파일 이름이있는 폴더. 여기에서 파일에서 추출한 모든 이미지를 볼 수 있습니다.
XML 대신 일반 텍스트를 추출하는 방법
-
DOCX 파일을 열고 클릭하십시오. 파일> 다른 이름으로 저장> 컴퓨터> 브라우저. 파일을 다음 형식으로 저장하도록 선택하십시오. 일반 텍스트 (XLSX 파일의 경우 텍스트 (탭 구분)).
-
위치하고 있다 과 열다 이름을 저장 한 텍스트 파일. 이 텍스트 파일에는 서식없이 원본 파일의 텍스트 만 포함됩니다..
MS Office 파일에서 이미지를 추출하는 다른 방법이나 도구를 알고 있다면 코멘트 섹션.