Хотел поинтересоваться, кто-нибудь использует такое из Clarion?
Насколько я понял, есть распространенный опенсорсный проект tesseract, который позволяет вызовом из командной строки вытаскивать тексты из jpeg в текстовый файл. А затем этот текстовый файл можно уже обработать в своем приложении.
Есть еще разные бесплатные и платные сервисы, которые задействуют ИИ для обучения разбору разных вариантов полученного при распознавании текста.
Распознование текста накладных (OCR)
Модератор: Дед Пахом
Правила форума
При написании вопроса или обсуждении проблемы, не забывайте указывать версию Clarion который Вы используете.
А так же пользуйтесь спец. тегами при вставке исходников!!!
При написании вопроса или обсуждении проблемы, не забывайте указывать версию Clarion который Вы используете.
А так же пользуйтесь спец. тегами при вставке исходников!!!
- Игорь Столяров
- Ветеран движения
- Сообщения: 8243
- Зарегистрирован: 07 Июль 2005, 10:19
- Откуда: г. Ростов-на-ДоМу
- Благодарил (а): 34 раза
- Поблагодарили: 105 раз
Распознование текста накладных (OCR)
ДД !
Если говорить конкретно о применении распознования текста в бизнесе и торговле, то там это направление
сейчас уже не востребовано. Нет задач. Документы, вроде накладных или УПД, передаются в пакетах открытых
форматов как ЭДО или XLSX 1С - откуда их значительно проще, надёжней и быстрее загрузить в БД.
А всякие там договора с подписями и печатями / паспорта и т.д. загружаются в БД как отсканированные
(а зачастую сфотографированные смарфоном) картинки. Вот и всё. Нечего и незачем рапозновать.
Но если Вы ищите возможность натянуть Tesseract на софт - то конечно можно что-нибудь придумать.
Если говорить конкретно о применении распознования текста в бизнесе и торговле, то там это направление
сейчас уже не востребовано. Нет задач. Документы, вроде накладных или УПД, передаются в пакетах открытых
форматов как ЭДО или XLSX 1С - откуда их значительно проще, надёжней и быстрее загрузить в БД.
А всякие там договора с подписями и печатями / паспорта и т.д. загружаются в БД как отсканированные
(а зачастую сфотографированные смарфоном) картинки. Вот и всё. Нечего и незачем рапозновать.
Но если Вы ищите возможность натянуть Tesseract на софт - то конечно можно что-нибудь придумать.
За теми, кто отстал, не возвращаться !
Кодекс
