홈페이지 » 어떻게 » 적은 프로그래밍 기술로 다운로드 스케줄러 구축

    적은 프로그래밍 기술로 다운로드 스케줄러 구축

    우리 모두는 인터넷에서 물건을 다운로드하는 것을 좋아하며 다운로드를 예약하는 데 사용할 수있는 훌륭한 다운로드 관리자 도구가 있습니다. 다운로드 관리자를 사용하는 것이 더 쉬울 수도 있지만 이미 우분투와 함께 제공되는 도구를 탐색하고 그것을 최대한 활용하는 데 아무런 해가 없습니다.

    이 기사에서는 우분투 소프트웨어를 사용하여 인터넷에서 물건을 다운로드하는 데 사용할 수있는 소프트웨어를 보여줍니다. wget. 그 위에 Cron을 사용하여 다운로드를 예약하는 방법을 보여줍니다..

    Wget을 사용하여 다운로드

    Wget은 가장 널리 사용되는 인터넷 프로토콜 인 HTTP, HTTPS 및 FTP를 사용하여 파일을 검색하기위한 무료 소프트웨어 패키지입니다. 이것은 비대화 형 명령 행 도구이므로 스크립트, cron 작업, X-Windows 지원이없는 터미널 등에서 쉽게 호출 할 수 있습니다..

    터미널을 열고 wget을 사용하여 인터넷에서 물건을 다운로드하는 방법을 탐색 해 봅시다. wget을 사용하여 다운로드하는 기본 구문은 다음과 같습니다.

    wget [option] ... [URL] ...

    이 명령은 wget 매뉴얼을 로컬 드라이브에 다운로드합니다.

    wget http://www.gnu.org/software/wget/manual/wget.pdf

    리눅스 크론

    우분투에는 특정 시간에 실행될 작업을 예약하는 데 사용되는 cron 데몬이 있습니다. Crontab을 사용하면 실행해야하는 작업과 시간을 지정할 수 있습니다. 이것은 일반적으로 명령 줄 도구를 사용하여 작업을 예약하는 방법입니다.

    터미널 창을 열고 crontab -e를 입력하십시오..

    crontab의 각 섹션은 공백으로 구분되며 마지막 섹션에는 하나 이상의 공백이 있습니다. cron 항목은 분 (0-59), 시간 (0-23, 0 = 자정), 일 (1-31), 달 (1-12), 평일 (0-6, 0 = 일요일) 명령으로 구성됩니다. 위 crontab의 세 번째 항목은 오전 2시에 wget.pdf를 다운로드합니다. 첫 번째 항목 (0)과 두 번째 항목 (2)은 2:00을 의미합니다. 세 번째에서 다섯 번째 항목 (*)은 일, 월 또는 주 중 언제든지를 의미합니다. 마지막 항목은 지정된 URL에서 wget.pdf를 다운로드하는 wget 명령입니다..

    그것이 wget의 기본이며 Cron의 작동 방식입니다. 다운로드 일정을 잡는 방법에 대한 실생활 예에서 약점을 살펴 보겠습니다..

    예약 다운로드

    우리는 오전 2시에 Firefox 3.6을 다운로드 할 것입니다. 우리 ISP는 제한된 양의 데이터 만 제공하기 때문에 오전 8시에 다운로드를 중지해야합니다. 이것이 설치 과정입니다..

    위의 crontab에서 처음 2 개의 항목을 무시하십시오. 세 번째와 네 번째 명령은 필요한 명령 두 개뿐입니다. 세 번째 명령은 오전 2시에 Firefox를 다운로드 할 작업을 설정합니다.

    [암호]
    0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
    [/암호]

    -c 옵션은 wget이 완료되지 않은 경우 기존 다운로드를 재개해야 함을 나타냅니다..

    네 번째 명령은 오전 8시에 wget을 중지합니다. 'Killall'은 이름으로 프로세스를 죽이는 유닉스 명령이다..

    [암호]
    0 8 * * * killall wget
    [/암호]

    killall wget은 Ubuntu에게 wget이 오전 8시에 파일을 다운로드하는 것을 중단하도록 알려줍니다..

    기타 유용한 wget 명령

    1. 파일을 다운로드 할 디렉토리 지정

    [암호]
    wget -output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
    [/암호]

    -output-document 옵션을 사용하여 다운로드하는 디렉토리 및 파일 이름을 지정할 수 있습니다

    2. 웹 사이트 다운로드

    wget은 웹 사이트를 다운로드 할 수도 있습니다..

    [암호]
    wget -m http://www.google.com/profiles/zainul.franciscus
    [/암호]

    위의 명령은 내 전체 Google 프로필 웹 페이지를 다운로드합니다. '-m'옵션은 wget에게 지정된 URL의 '미러'이미지를 다운로드하도록 지시합니다..

    또 다른 중요한 옵션은 wget에게 웹 사이트를 다운로드 할 때 링크 수를 알려주는 것입니다.

    [암호]
    wget -r -l1 http://www.google.com/profiles/zainul.franciscus
    [/암호]

    위의 wget 명령은 두 가지 옵션을 사용합니다. 첫 번째 옵션 '-r'은 wget에게 지정된 웹 사이트를 재귀 적으로 다운로드하도록 지시합니다. 두 번째 옵션 '-l1'은 wget이 지정된 웹 사이트에서 첫 번째 레벨의 링크 만 가져 오도록합니다. '-l2'와 '-l3'레벨을 세 가지로 설정할 수 있습니다..

    3. 로봇 입력 무시

    웹 마스터는 Robot.txt라는 텍스트 파일을 유지 관리합니다. 'Robot.txt'는 wget과 같은 웹 페이지 크롤러가 크롤링하지 않아야하는 URL 목록을 유지 관리합니다. wget이 '-erobots = off'옵션을 사용하여 'Robot.txt'를 무시하도록 지정할 수 있습니다. 다음 명령은 wget이 내 Google 프로필의 첫 번째 페이지를 다운로드하고 'Robot.txt'.

    [암호]
    wget -erobots = off http://www.google.com/profiles/zainul.franciscus
    [/암호]

    또 다른 유용한 옵션은 -U입니다. 이 옵션은 wget을 브라우저로 숨 깁니다. 응용 프로그램을 다른 응용 프로그램으로 마스킹하면 웹 서비스 공급자의 용어와 서비스가 침해 될 수 있습니다.

    [암호]
    wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
    [/암호]

    결론

    Wget은 아주 오래된 학교이지만 아직 파일을 다운로드 할 때 사용할 수있는 해킹 가능한 GNU 소프트웨어 패키지입니다. Wget은 응용 프로그램을 시작하지 않고 백그라운드에서 컴퓨터에서 실행할 수 있도록하는 대화 형 명령 줄 도구입니다. wget man 페이지를 확인하십시오.

    [암호]
    $ man wget
    [/암호]

    우리가 wget과 사용할 수있는 다른 옵션을 이해하고있다..

    모래밭

    Wget 매뉴얼
    wget이 중간에 실패 할 때 두 개의 다운로드 된 파일을 결합하는 방법
    Linux QuickTip : 한 단계로 다운로드 및 제거