Новая система оптического распознавания текста EasyOCR

in #ru4 years ago

Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов.

Для определения и распознавания текста на изображении применяются методы машинного обучения. Для определения текста используется алгоритм машинного обучения CRAFT (Character-Region Awareness For Text) в реализации для PyTorch, способный выделять текст на произвольных объектах, включая этикетки, информационные таблички и дорожные знаки. Для распознавания последовательностей символов применяется свёрточно-рекуррентная нейронная сеть CRNN (Convolutional Recurrent Neural Network, комбинация DCNN и RNN) и алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для декодирования выходных данных нейронной сети в текстовое представление.

Источник: https://www.opennet.ru/opennews/art.shtml?num=53314

Coin Marketplace

STEEM 0.31
TRX 0.12
JST 0.033
BTC 64485.37
ETH 3156.53
USDT 1.00
SBD 4.05