Как извлечь текст из изображений (OCR)
Интернет

Как извлечь текст из изображений (OCR)

Лучший способ извлечь текст из изображения – использовать оптическое распознавание символов (OCR). Мы покажем вам семь бесплатных инструментов OCR для этой работы

Когда я учился в колледже, один из моих друзей попросил меня отредактировать одно из его важных эссе по итогам года, и это не казалось большой проблемой, поэтому я согласился – но потом он сделал скриншот эссе и отправил его мне, а не сам документ. Это, конечно, сделало редактирование намного сложнее, чем нужно

Если бы я только знал тогда о технологии извлечения текста!

В наши дни у вас так много бесплатных и эффективных вариантов, когда вы хотите извлечь текст из изображения вместо того, чтобы набирать его вручную. Вот лучшие из них, которые мы нашли. Для сравнения мы пропустим изображение выше через каждый инструмент и покажем, каким получился текст для точности

Использование OneNote

OneNote уже несколько лет является одним из лучших бесплатных инструментов OCR. Это одна из тех малоизвестных функций, которые пользователи редко используют, но как только вы начнете ее применять, вы будете удивлены тем, насколько быстрой и точной она может быть. Действительно, возможность извлечения текста – это одна из функций, которая ставит OneNote впереди Evernote

Инструкции по извлечению текста:

  1. Откройте любую страницу в OneNote, предпочтительно пустую.
  2. Перейдите в раздел Вставка > Изображения и выберите файл изображения.
  3. Щелкните правой кнопкой мыши вставленное изображение и выберите Копировать текст с изображения.
  4. Вставьте текст в любое место. При желании удалите вставленное изображение.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth winged firmament seas upon lights female.

Скачать — Microsoft OneNote (бесплатно)

Использование транслятора изображений Photron

Photron Image Translator – это бесплатное приложение, доступное в Магазине Windows, которое можно использовать как на настольных, так и на планшетных версиях Windows 10. У него есть две дополнительные функции, которые могут оказаться полезными: во-первых, возможность перевести извлеченный текст на другой язык, а во-вторых, возможность прочитать текст вслух

Инструкции по извлечению текста:

  1. Когда появится запрос, выберите Изображение в качестве метода ввода.
  2. При появлении запроса выберите Галерея в качестве типа источника.
  3. Выберите файл изображения.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth winged firmament seas upon lights female.

Download — Photron Image Translator No Longer Available (Free)

Использование FreeOCR

FreeOCR обычно называют одним из лучших бесплатных инструментов для извлечения текста из изображений, и не зря: он очень хорош в своем деле. На момент написания статьи он не обновлялся с середины 2015 года, но мы не сталкивались с какими-либо проблемами, даже на Windows 10

Одна из удобных функций – экспорт извлеченного текста в формат Microsoft Word. К сожалению, если исходное изображение не имеет достаточно высокого разрешения, FreeOCR не будет таким точным, как некоторые другие методы (о чем свидетельствуют результаты ниже)

Инструкции по извлечению текста:

  1. Нажмите кнопку Открыть.
  2. Выберите файл изображения.
  3. Нажмите кнопку Очистить текстовое окно.
  4. Нажмите кнопку OCR и выберите OCR Current Page.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving ?rst good tree winged had creature fifth good be ?fth i above had together fourth above subdue. Great above grass living forth winged ?rrnament seas upon ?ghts femala

Скачать — FreeOCR (бесплатно)

Использование Copyfish

Copyfish – это простое расширение для Chrome, которое немного более гибкое, чем другие инструменты. Вместо того чтобы передавать ему файл изображения, вы можете использовать его для выбора любой области экрана браузера и мгновенного извлечения оттуда текста. Если вы смотрите на изображение, вы можете просто выделить его целиком, вместо того чтобы загружать его и передавать в другое приложение

Инструкции по извлечению текста:

  1. Откройте изображение в Chrome. Оно может быть локальным или в Интернете.
  2. Нажмите кнопку Copyfish рядом с адресной строкой URL.
  3. Выберите область изображения с текстом.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth winged firmament seas upon lights female.

Скачать — Copyfish (бесплатно)

Использование Google Drive

Существует множество советов и рекомендаций по использованию Google Drive, которые могут облегчить вашу жизнь, но вот один из них, о котором большинство пользователей не знают: Google Drive может взять любое изображение и преобразовать его в текст одним щелчком мыши. Так что если Google Диск – ваш метод облачного хранения данных, начните использовать эту функцию уже сегодня

Инструкции по извлечению текста:

  1. Загрузите файл изображения на Google Drive.
  2. В веб-версии Google Диска щелкните правой кнопкой мыши файл изображения и выберите Открыть с помощью > Google Docs.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature godlight midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth Winged firmament seas upon lights female.

Веб-сайт — Google Drive (бесплатно)

Использование онлайн OCR

Допустим, вы не хотите ничего устанавливать. У вас есть файл изображения, и все, что вы хотите сделать, это извлечь из него текст как можно быстрее и удобнее. Для этого Online OCR, вероятно, то, что вы ищете. Это просто, быстро и с возможностью вывода в текстовый формат, Word или Excel

Инструкции по извлечению текста:

  1. Нажмите Выбрать файл и выберите файл изображения.
  2. Выберите нужный формат вывода, скорее всего, текстовый.
  3. Введите код CAPTCHA, если необходимо.
  4. Нажмите Конвертировать.

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth winged firmament seas upon lights female.

Веб-сайт — Онлайн OCR

Использование PowerShell

PowerShell – это продвинутая альтернатива Command Prompt, которая может делать много интересных вещей с помощью отдельных скриптоподобных утилит, называемых командами.Windows 10 поставляется с целым набором полезных команд и сценариев PowerShell, но вы также можете создавать свои собственные, и Пратик Сингх создал один из них, используя OCR API Microsoft

Это несколько сложная настройка, поэтому можете пропустить ее, если вы никогда раньше не использовали PowerShell. Для его работы вам потребуется получить ключ подписки для OCR API Microsoft, а также ClientID и Client_secret для Bing Translation API Microsoft. Для этого также требуется подключение к Интернету

Вот полная инструкция по использованию Get-ImageText

Результаты извлечения текста:

Our meat greater hath signs two second behold shall. Fill bearing beast saw creature creature god light midst two. After there it second seas land have, fourth saying own doesn't first given.

Rule set male firmament given. Divide void which moved under third don't. Living. Fruit all. That for. Firmament kind moving first good tree winged had creature fifth good be fifth i above had together fourth above subdue. Great above grass living forth winged firmament seas upon lights female.

PowerShell встроен в Windows 7, 8 и 10, но с тех пор стал открытым исходным кодом и кроссплатформенным, что означает, что его также можно установить и использовать в Linux

Как извлечь текст?

Лучшего метода, на мой взгляд, не существует. Вы должны выбрать тот, который кажется вам наиболее удобным, а это, вероятно, тот метод, который принадлежит приложению, которым вы уже пользуетесь. Я постоянно пользуюсь OneNote, поэтому предпочитаю именно его

Из какого материала вы извлекаете текст? Какой инструмент вы предпочитаете для выполнения этой работы? Поделитесь с нами в комментариях ниже! Мы будем рады услышать вас

Об авторе

Алексей Белоусов

Привет, меня зовут Филипп. Я фрилансер энтузиаст . В свободное время занимаюсь переводом статей и пишу о потребительских технологиях для широкого круга изданий , не переставая питать большую страсть ко всему мобильному =)

Комментировать

Оставить комментарий