Нажмите "Enter", чтобы перейти к содержанию

Сканирование текста онлайн: Convertio Расценки на OCR

Содержание

История изменений

  • Главная
  • История изменений

Описание того что происходило на сайте

VersionОписание
0.6.6.1
  • Обновили ОС Fedora (fc35) и все ПО на сервере до актуальных версий.
  • Обновили фреймворк Laravel до 8й версии.
0.6.6.0

Из улучшений которые видно на сайте:

  • Улучшили обработку PDF файлов
  • Исправлен баг который не позволял распознать много страниц из PDF
  • Выбираем в меню активный пункт в разделе распознаваний

Из того что не видно:

  • Обновили ОС Fedora и все ПО на сервере до актуальных версий.
  • Обновили фреймворк Laravel до 7й версии.
  • Отрефакторили код
0.6.5.1

Мелкие правки и исправления для PDF

0.6.5.0
  • Добавлен новый функционал сохранения отредактированного текста (при отключенном adblock и если Вы владелец записи).
  • Удален виджет FB (в третий раз число лайков сбилось)
  • Правки кода бекенда
0.6.4.2

Данное обновление затрагивает 26 файлов. Из того что было сделано:

  • Улучшили микроразметку для инфо страниц
  • Дополнили сведения «О компании»
  • Обновили FAQ
  • Служебные правки
0. 6.4.1
  • Переписали этот чейнджлог и завели информацию в базу
  • Добавили FAQ
0.6.4

Новый Deploy скрипт под Laravel. Рефакторинг JS

0.6.3

Fallback загрузка для тех кто на старых браузерах. Оптимизация загрузки стилей, мелкие правки

0.6.2

Обновление Лары 5.7 -> 5.8, багфиксы

0.6.1

Добавлены новые языки распознаваний. Мелкие правки

Распознать текст (OCR) онлайн — IMG online

Главное нужно указать изображение с текстом на вашем компьютере или телефоне, обязательно выбрать основной язык текста и нажать кнопку OK внизу страницы. Остальные настройки уже выставлены по умолчанию.

Пример сфотографированного текста из книги и скриншот распознанного текста на этой фотографии:

В зависимости от размера исходного изображения и количества текста обработка может продлиться около 1 минуты.
Для достижения лучшего результата распознания текста желательно обратить внимание на подсказки возле настроек. Перед обработкой изображение нужно повернуть на нормальный угол, чтобы текст шёл в правильном направлении и небыл перевёрнут вверх ногами, а также желательно обрезать лишние однотонные края без текста, если они есть.

Обе OCR-программы для распознования текста отличаются друг от друга и могут давать разные результаты, что позволяет выбрать наиболее приемлемый вариант из двух.

Исходное изображение никак не изменяется, вам будет предоставлен распознанный текст в обычном текстовом документе в формате .txt с кодировкой utf-8 и после обработки его можно будет открыть прямо в окне браузера или же после скачивания – в любом текстовом редакторе.

1) Укажите изображение в формате BMP, GIF, JPEG, PNG, TIFF:

2) Настройки для распознавания текста


Основной язык текста №1: Азербайджанский (Azerbaijani)Албанский (Albanian)Английский (English)Английский средний (Middle English 1100-1500)Арабский (Arabic)Африкаанс (Afrikaans)Баскский (Basque)Белорусский (Belarusian)Бенгальский (Bengali)Болгарский (Bulgarian)Венгерский (Hungarian)Вьетнамский (Vietnamese)Галисийский (Galician)Голландский (Dutch)Греческий (Greek)Греческий древний (Ancient Greek)Датский (Danish)Иврит (Hebrew)Индонезийский (Indonesian)Исландский (Icelandic)Испанский (Spanish)Испанский (старый) (Spanish old)Итальянский (Italian)Итальянский (старый) (Italian old)Каннада (Kannada)Каталанский (Catalan)Китайский традиционный (Chinese Traditional)Китайский упрощенный (Chinese Simplified)Корейский (Korean)Латышский (Latvian)Литовский (Lithuanian)Македонский (Macedonian)Малайский (Malay)Малаялам (Malayalam)Мальтийский (Maltese)Немецкий (German)Норвежский (Norwegian)Польский (Polish)Португальский (Portuguese)Румынский (Romanian)Русский (Russian)Сербский (латинский) (Serbian latin)Словацкий (Slovakian)Словенский (Slovenian)Суахили (Swahili)Тагальский (Tagalog)Тайский (Thai)Тамильский (Tamil)Телугу (Telugu)Турецкий (Turkish)Украинский (Ukrainian)Финский (Finnish)Франкский (Frankish)Французский (cредний) (Middle French)Французский (French)Хинди (Hindi)Хорватский (Croatian)Чероки (Cherokee)Чешский (Czech)Шведский (Swedish)Эсперанто (Esperanto)Эсперанто альтернативный (Esperanto alternative)Эстонский (Estonian)Японский (Japanese) ← нужно выбрать существующий


Дополнительные языки, которые нужно распознать:

№2: Не распознаватьАзербайджанский (Azerbaijani)Албанский (Albanian)Английский (English)Английский средний (Middle English 1100-1500)Арабский (Arabic)Африкаанс (Afrikaans)Баскский (Basque)Белорусский (Belarusian)Бенгальский (Bengali)Болгарский (Bulgarian)Венгерский (Hungarian)Вьетнамский (Vietnamese)Галисийский (Galician)Голландский (Dutch)Греческий (Greek)Греческий древний (Ancient Greek)Датский (Danish)Иврит (Hebrew)Индонезийский (Indonesian)Исландский (Icelandic)Испанский (Spanish)Испанский (старый) (Spanish old)Итальянский (Italian)Итальянский (старый) (Italian old)Каннада (Kannada)Каталанский (Catalan)Китайский традиционный (Chinese Traditional)Китайский упрощенный (Chinese Simplified)Корейский (Korean)Латышский (Latvian)Литовский (Lithuanian)Македонский (Macedonian)Малайский (Malay)Малаялам (Malayalam)Мальтийский (Maltese)Немецкий (German)Норвежский (Norwegian)Польский (Polish)Португальский (Portuguese)Румынский (Romanian)Русский (Russian)Сербский (латинский) (Serbian latin)Словацкий (Slovakian)Словенский (Slovenian)Суахили (Swahili)Тагальский (Tagalog)Тайский (Thai)Тамильский (Tamil)Телугу (Telugu)Турецкий (Turkish)Украинский (Ukrainian)Финский (Finnish)Франкский (Frankish)Французский (cредний) (Middle French)Французский (French)Хинди (Hindi)Хорватский (Croatian)Чероки (Cherokee)Чешский (Czech)Шведский (Swedish)Эсперанто (Esperanto)Эсперанто альтернативный (Esperanto alternative)Эстонский (Estonian)Японский (Japanese)№3: Не распознаватьАзербайджанский (Azerbaijani)Албанский (Albanian)Английский (English)Английский средний (Middle English 1100-1500)Арабский (Arabic)Африкаанс (Afrikaans)Баскский (Basque)Белорусский (Belarusian)Бенгальский (Bengali)Болгарский (Bulgarian)Венгерский (Hungarian)Вьетнамский (Vietnamese)Галисийский (Galician)Голландский (Dutch)Греческий (Greek)Греческий древний (Ancient Greek)Датский (Danish)Иврит (Hebrew)Индонезийский (Indonesian)Исландский (Icelandic)Испанский (Spanish)Испанский (старый) (Spanish old)Итальянский (Italian)Итальянский (старый) (Italian old)Каннада (Kannada)Каталанский (Catalan)Китайский традиционный (Chinese Traditional)Китайский упрощенный (Chinese Simplified)Корейский (Korean)Латышский (Latvian)Литовский (Lithuanian)Македонский (Macedonian)Малайский (Malay)Малаялам (Malayalam)Мальтийский (Maltese)Немецкий (German)Норвежский (Norwegian)Польский (Polish)Португальский (Portuguese)Румынский (Romanian)Русский (Russian)Сербский (латинский) (Serbian latin)Словацкий (Slovakian)Словенский (Slovenian)Суахили (Swahili)Тагальский (Tagalog)Тайский (Thai)Тамильский (Tamil)Телугу (Telugu)Турецкий (Turkish)Украинский (Ukrainian)Финский (Finnish)Франкский (Frankish)Французский (cредний) (Middle French)Французский (French)Хинди (Hindi)Хорватский (Croatian)Чероки (Cherokee)Чешский (Czech)Шведский (Swedish)Эсперанто (Esperanto)Эсперанто альтернативный (Esperanto alternative)Эстонский (Estonian)Японский (Japanese)№4: Не распознаватьАзербайджанский (Azerbaijani)Албанский (Albanian)Английский (English)Английский средний (Middle English 1100-1500)Арабский (Arabic)Африкаанс (Afrikaans)Баскский (Basque)Белорусский (Belarusian)Бенгальский (Bengali)Болгарский (Bulgarian)Венгерский (Hungarian)Вьетнамский (Vietnamese)Галисийский (Galician)Голландский (Dutch)Греческий (Greek)Греческий древний (Ancient Greek)Датский (Danish)Иврит (Hebrew)Индонезийский (Indonesian)Исландский (Icelandic)Испанский (Spanish)Испанский (старый) (Spanish old)Итальянский (Italian)Итальянский (старый) (Italian old)Каннада (Kannada)Каталанский (Catalan)Китайский традиционный (Chinese Traditional)Китайский упрощенный (Chinese Simplified)Корейский (Korean)Латышский (Latvian)Литовский (Lithuanian)Македонский (Macedonian)Малайский (Malay)Малаялам (Malayalam)Мальтийский (Maltese)Немецкий (German)Норвежский (Norwegian)Польский (Polish)Португальский (Portuguese)Румынский (Romanian)Русский (Russian)Сербский (латинский) (Serbian latin)Словацкий (Slovakian)Словенский (Slovenian)Суахили (Swahili)Тагальский (Tagalog)Тайский (Thai)Тамильский (Tamil)Телугу (Telugu)Турецкий (Turkish)Украинский (Ukrainian)Финский (Finnish)Франкский (Frankish)Французский (cредний) (Middle French)Французский (French)Хинди (Hindi)Хорватский (Croatian)Чероки (Cherokee)Чешский (Czech)Шведский (Swedish)Эсперанто (Esperanto)Эсперанто альтернативный (Esperanto alternative)Эстонский (Estonian)Японский (Japanese)№5: Не распознаватьАзербайджанский (Azerbaijani)Албанский (Albanian)Английский (English)Английский средний (Middle English 1100-1500)Арабский (Arabic)Африкаанс (Afrikaans)Баскский (Basque)Белорусский (Belarusian)Бенгальский (Bengali)Болгарский (Bulgarian)Венгерский (Hungarian)Вьетнамский (Vietnamese)Галисийский (Galician)Голландский (Dutch)Греческий (Greek)Греческий древний (Ancient Greek)Датский (Danish)Иврит (Hebrew)Индонезийский (Indonesian)Исландский (Icelandic)Испанский (Spanish)Испанский (старый) (Spanish old)Итальянский (Italian)Итальянский (старый) (Italian old)Каннада (Kannada)Каталанский (Catalan)Китайский традиционный (Chinese Traditional)Китайский упрощенный (Chinese Simplified)Корейский (Korean)Латышский (Latvian)Литовский (Lithuanian)Македонский (Macedonian)Малайский (Malay)Малаялам (Malayalam)Мальтийский (Maltese)Немецкий (German)Норвежский (Norwegian)Польский (Polish)Португальский (Portuguese)Румынский (Romanian)Русский (Russian)Сербский (латинский) (Serbian latin)Словацкий (Slovakian)Словенский (Slovenian)Суахили (Swahili)Тагальский (Tagalog)Тайский (Thai)Тамильский (Tamil)Телугу (Telugu)Турецкий (Turkish)Украинский (Ukrainian)Финский (Finnish)Франкский (Frankish)Французский (cредний) (Middle French)Французский (French)Хинди (Hindi)Хорватский (Croatian)Чероки (Cherokee)Чешский (Czech)Шведский (Swedish)Эсперанто (Esperanto)Эсперанто альтернативный (Esperanto alternative)Эстонский (Estonian)Японский (Japanese)

Если есть не только русские, но и английские буквы, которые также нужно распознать, то для дополнительного языка №2 нужно выбрать английский язык. Порядок указания языков значения не имеет. Если на изображении есть только символы основного языка №1, то дополнительные языки от №2 до №5 лучше «не распознавать» для более точной обработки.


Предварительная оптимизация изображения
Предварительное улучшение отсканированного текста

Если отсканированный текст качественный, то для эксперимента можно сначала отключить улучшение отсканированного текста, а потом и оптимизацию изображения. Иногда это может помочь даже тогда, когда текст вообще не распознается.


Программа OCR для распознавания текста на изображении: 1  2

Если не будет получаться нормально распознать текст первой программой, то можно попробовать переключиться на вторую (работает быстрее) или же проще говоря – выбрать лучший результат из двух.



  Обработка обычно длится 20-60 секунд.

Конвертировать PDF в текст — Конвертируйте PDF в текст онлайн

Существует простой способ редактирования текста в формате PDF: преобразуйте ваши документы в формате PDF в текст с помощью OCR (оптического распознавания символов).

Если вам интересно, как извлечь текст из PDF, вы не ошибетесь, используя PDF2Go.

Перетащите файлы сюда

Преобразовать
Отсканированные страницы будут изображениями.

Premium

Преобразование с помощью OCR
Отсканированные страницы будут преобразованы в текст, который можно редактировать.

Исходный язык вашего файла

Чтобы получить наилучшие результаты, выберите все языки, содержащиеся в вашем файле.

Применить фильтр: Применить фильтр Без фильтраСерый фильтр

Информация: Пожалуйста, включите JavaScript для корректной работы сайта.

Реклама

Как извлечь текст из документов PDF

  1. Загрузите документ PDF.
  2. Нажмите «Пуск».

Преобразование PDF в текст с помощью OCR


бесплатно и куда угодно