Tesseract.js, 이미지 OCR 번역을 브라우저에 적용

OCR 번역은 여전히 완벽하지는 않지만 지난 몇 년 동안 극적으로 개선되었습니다. Tesseract는 길을 선도합니다. 번역 엔진 현재 오픈 소스 기음++.

이것은 믿을 수없는 라이브러리이지만, 소프트웨어에 국한됩니다. 고맙게도 누군가 Tesseract.js라고하는 JavaScript에 Tesseract 포트를 만들었습니다. 그것 최대 60 개 언어 지원 그리고 확실히 완벽하지는 않지만, 잘 작동합니다..

설치 및 설정이 간편합니다. 어떤 이미지 요소를 목표로 삼는다. 페이지에서 Tesseract.recognize () 기능. 이것은 모든 유형의 이미지를 취할 수 있으며 자동으로 압축하여 번역하다 브라우저에서 바로.

당신은 훨씬 더 복잡해질 수 있지만 아름다움은 한 줄의 코드로 OCR을 실행하는 방법.

라이브 데모를 보려면 Tesseract.js 방문 페이지를 확인하십시오. 이 기능은 브라우저에서 올바르게 작동합니다. 텍스트의 스캔 이미지를 드래그 앤 드롭하여 자동 OCR 번역.

GitHub 페이지를 통해이 예제를 로컬로 다운로드하거나 CDN에서 Tesseract.js 스크립트를 직접 포함하여 자신의 앱을 만들 수 있습니다.

가장 간단한 코드 예제는 다음과 같습니다. myImage HTML 이미지 요소에 대한 직접적인 참조입니다.

 Tesseract.recognize (myImage) .then (function (result) console.log (result));

어느 쪽이든이 라이브러리는 웹에서 OCR을 사용하여 움직이는 데 매우 유용합니다. 완벽하지는 않지만, 동적 인 페이지 내 OCR 기능을 원하는 웹 개발자를위한 최고의 리소스.

자세한 내용을 보려면 Tesseract.js GitHub 페이지를 방문하십시오. 여기서 라이브 데모를 확인하고 온라인 설명서를 검색 할 수 있습니다.