
Сервис
Сокращение OCR (Optical Character Recognition) означает "оптическое распознавание символов". А "OCR онлайн" означает возможность конвертировать любое изображение (будь то фотография или отсканированный документ) в редактируемый текстовый файл.
Возьмем для примера распространенную задачу - "как перевести DJVU в TXT". Допустим, у вас есть файл в формате DJVU, и он не содержит текстового слоя. Другими словами, текст в нем - это просто картинка, и извлечь его простым копированием нельзя. Что же нужно сделать, чтобы получить этот текст - например, для цитат в своем дипломе или реферате?
Решить вопрос поможет сервис Onlineocr.net. Именно "OCR онлайн" и является его единственным назначением. Он способен преобразовать в редактируемый текст следующие графические форматы: TIF/TIFF, JPEG/JPG, BMP, PCX, PNG, GIF, PDF.
Начинаем с того, что преобразуем текст в один из указанных выше форматов. Для этого откроем файл в программе, работающей с DJVU, и пошлем "на печать" нужную страницу, выбрав в качестве принтера "Microsoft Office Document Image Writer". Реальной печати в данном случае не произойдет, а нужная страница будет помещена в файл с расширением TIF.
Используя "Microsoft Office Document Image Writer", создаем TIF-файл с нужной страницей
Полученный TIF-файл, открытый в фотоальбоме Windows
Далее заходим на Onlineocr.net и, не проходя никакой регистрации, сразу загружаем этот файл для распознавания.
Сначала надо нажать кнопку "Выберите файл", а после выбора - кнопку "Upload"
Далее выбрать язык, формат выходного файла (Word, Excel или простой текст), ввести код проверки и нажать "Recognize"
Через несколько секунд результат готов. Полученный текст можно скопировать из окна в свой документ; но можно и скачать подготовленный файл в выбранном формате (Word или Excel) и работать уже с ним.
Результат распознавания текста
Пример готового Word-файла с распознанным текстом
Как мы видим, файл, скачанный с Onlineocr.net, содержит ошибки из-за погрешностей распознавания, а также нуждается в определенном форматировании.
Довести его до товарного вида совсем не сложно: ошибки исправляются в пункте "Сервис-Правописание", а форматирование состоит в выделении всего текста и установке для него единого размера шрифта, межстрочного и межбуквенного интервалов.
После недолгой обработки получаем окончательный вариант текста
Рассмотренным способом можно распознавать только одну страницу текста. Причем за час можно распознавать только 15 таких страниц.
Регистрация даст доступ к расширенным функциям Onlineocr.net, главная из которых - возможность распознавать многостраничные документы, в том числе целые книги, объемом до 100 Мб, за один сеанс. Но эти услуги уже, к сожалению, не бесплатны. И хотя после регистрации новый пользователь и получает 20 бесплатных "кредитов", их хватит на бесплатное онлайн распознавание текста всего лишь из 20 страниц.
Тем не менее, гостевой режим вполне позволит подготовить диплом, реферат или курсовую.
Другие полезные сервисы преобразования файлов: бесплатные конвертеры в форматы PDF - FreePDFconvert.com и EPUB - 2epub.com.
В завершение надо упомянуть о русскоязычной версии сервиса Onlineocr.net: ее адрес Onlineocr.ru. Однако бесплатное распознавание текста онлайн там ограничено не 15-тью, а 10-тью страницами в час, и нет возможности скачивать результат в формате Word или Excel. Кроме того, при регистрации вы не получите даже те 20 "кредитов", которые дает Onlineocr.net. Однако Onlineocr.ru можно использовать в качестве справки - там очень подробно объяснена теория, и вы сможете приобрести просто экспертные знания по теме "OCR онлайн".
"Идеи могут создавать, идеи могут разрушать" - надеюсь, вам понравится это забавное видео
Еще естьhttp://img2txt.com/ советую добавить к статье