우분투 리눅스에서 텍스트 파일을 절반 (또는 어떤 백분율)로 나눕니다.
다루기 힘든 텍스트 파일을 처리하려는 경우 섹션으로 분할하면 처리 시간이 단축 될 수 있습니다. 특히 파일을 스프레드 시트로 가져 오는 경우에는 더욱 그렇습니다. 또는 파일에서 특정 행 세트를 검색 할 수 있습니다..
split, wc, tail, cat 및 grep을 입력하십시오. (sed와 awk를 잊지 마라). Linux에는 명령 줄에서 텍스트 파일을 사용하기위한 다양한 유틸리티 세트가 포함되어 있습니다. 우리의 업무를 위해 우리는 split과 wc를 사용할 것입니다..
먼저 로그 파일을 살펴 보겠습니다 ... .
> ls -l
-rw-r-r-1 thegeek ggroup 42046520 2006-09-19 11:42 access.log
파일 크기는 42MB입니다. 그건 좀 크지 만 우리는 몇 줄을 다루고 있습니까? 이것을 Excel로 가져 오려면 65k 줄 미만으로 유지해야합니다..
"단어 수"를 나타내는 wc 유틸리티를 사용하여 파일의 행 수를 확인해 봅시다..
> wc -l access.log
146330 access.log
우리는 한계를 넘었습니다. 이것을 3 개의 세그먼트로 분할해야합니다. 분할 유틸리티를 사용하여이 작업을 수행합니다..
> split -l 60000 access.log
> ls -l총 79124
-rw-rw-r-1 thegeek ggroup 40465200 2006-09-19 12:00 access.log
-rw-rw-r-1 thegeek ggroup 16598163 2006-09-19 12:05 xaa
-rw-rw-r-1 thegeek ggroup 16596545 2006-09-19 12:05 xab
-rw-rw-r-1 thegeek ggroup 7270492 2006-09-19 12:05 xac
우리는 이제 텍스트 파일을 3 개의 개별 파일로 분할했습니다. 각각의 파일은 60000 개 미만의 행을 포함하고있어 선택하기 좋은 것으로 보입니다. 마지막 파일에는 남아있는 양이 들어 있습니다. 이 특정 파일을 절반으로 자르려면 다음과 같이하십시오.
> split -l 73165 access.log
그리고 그게 전부입니다..