Распознование текста накладных (OCR)

Clarion, Clarion 7

Модератор: Дед Пахом

Правила форума
При написании вопроса или обсуждении проблемы, не забывайте указывать версию Clarion который Вы используете.
А так же пользуйтесь спец. тегами при вставке исходников!!!
Аватара пользователя
Игорь Столяров
Ветеран движения
Сообщения: 8253
Зарегистрирован: 07 Июль 2005, 10:19
Откуда: г. Ростов-на-ДоМу
Благодарил (а): 34 раза
Поблагодарили: 106 раз

Распознование текста накладных (OCR)

Сообщение Игорь Столяров »

Игорь Столяров писал(а): 27 Октябрь 2025, 14:03 офисные пакеты уже лет 10 точно по умолчанию
Пардон ! 20 лет. Сейчас посмотрел Microsoft Excel 2007 - у него формат выгрузки XLSX.
Для выгрузки в бинарном XLS уже нужно выбирать формат СОХРАНИТЬ КАК -> Книга 97-2003 ... :(
За теми, кто отстал, не возвращаться ! 🏴‍☠️ Кодекс
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Игорь Столяров писал(а): 27 Октябрь 2025, 14:03
finsoftrz писал(а): 27 Октябрь 2025, 13:50 У нас это лет 20 реальность, только xls, не xlsx
Ну и отлично. Значит осталось только добится получение таких XLS файлов от контрагентов.
Тут подвох может быть в том, что современные офисные пакеты уже лет 10 точно по умолчанию
используют именно формат XLSX для сохранения ... но например, у нас загрузка сделана через
Excel ActivX и поэтому грузится и XLSX и XLS и DBF и CSV ... главное что бы формат колонок был настроен.
Загрузка экселевских файлов от поставщиков тоже давно уже работает, со всякими наворотами по распознаванию товаров. Формы описываются в специальном справочнике "Планы обмена" (из каких строк/столбцов что брать), плюс визуальные настройка и сопоставление товаров. К конкретному контрагенту можно привязать план обмена по умолчанию. Тоже через ActiveX сделано было, не было повода переделывать. Сейчас я предпочитаю для подобных вещей делать однотипно для Excel и Calc через прокладку на vbscript.
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
Игорь Столяров
Ветеран движения
Сообщения: 8253
Зарегистрирован: 07 Июль 2005, 10:19
Откуда: г. Ростов-на-ДоМу
Благодарил (а): 34 раза
Поблагодарили: 106 раз

Распознование текста накладных (OCR)

Сообщение Игорь Столяров »

finsoftrz писал(а): 27 Октябрь 2025, 14:12 Тоже через ActiveX сделано было, не было повода переделывать.
Ну и прекрасно. Значит у Вас XLSX тоже должен загружаться без проблем ! :D
За теми, кто отстал, не возвращаться ! 🏴‍☠️ Кодекс
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Игорь Столяров писал(а): 27 Октябрь 2025, 14:07
Игорь Столяров писал(а): 27 Октябрь 2025, 14:03 офисные пакеты уже лет 10 точно по умолчанию
Пардон ! 20 лет. Сейчас посмотрел Microsoft Excel 2007 - у него формат выгрузки XLSX.
Для выгрузки в бинарном XLS уже нужно выбирать формат СОХРАНИТЬ КАК -> Книга 97-2003 ... :(
По моему, в каком открыл, в таком и сохраняет, с учетом настройки ограничений. Вот biff4 в последних версиях Excel разрешить можно только на открытие. Поскольку у нас все сохраняется по умолчанию в biff4, я просто потом, если надо, открываю файл через программный интерфейс (vbscript) и поднимаю до более свежей версии.
А по поводу xls или xlsx, у нас давно все работает с xls, смысла переделывать под xlsx не видно. Xls имеет ограничения, которые для обычной работы не принципиальны, зато скорость вывода в него в разы быстрее, чем в xlsx.
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Игорь Столяров писал(а): 27 Октябрь 2025, 14:15
finsoftrz писал(а): 27 Октябрь 2025, 14:12 Тоже через ActiveX сделано было, не было повода переделывать.
Ну и прекрасно. Значит у Вас XLSX тоже должен загружаться без проблем ! :D
Загрузка из xlsx работает без проблем. У меня только прямой вывод в xls. Есть вариант и с xlsx, я его использую редко, когда возникает реальная потребность. Он не так хорошо протестирован.
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
Игорь Столяров
Ветеран движения
Сообщения: 8253
Зарегистрирован: 07 Июль 2005, 10:19
Откуда: г. Ростов-на-ДоМу
Благодарил (а): 34 раза
Поблагодарили: 106 раз

Распознование текста накладных (OCR)

Сообщение Игорь Столяров »

finsoftrz писал(а): 27 Октябрь 2025, 14:22 У меня только прямой вывод в xls.
Это как Вам удобно. Мы же говорим о загрузке документов ...
За теми, кто отстал, не возвращаться ! 🏴‍☠️ Кодекс
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Вот так выглядит распознавание упд в Abbyy, если интересно.

300.zip
(2.23 МБ) 9 скачиваний
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
Игорь Столяров
Ветеран движения
Сообщения: 8253
Зарегистрирован: 07 Июль 2005, 10:19
Откуда: г. Ростов-на-ДоМу
Благодарил (а): 34 раза
Поблагодарили: 106 раз

Распознование текста накладных (OCR)

Сообщение Игорь Столяров »

Красота неземная ! :D
Но это хороший печатный экземпляр ... и всё равно итог по стоимости не угадала.
Для привязки контрагента - придётся выполнять, столь любимый Вами, творческий парсинг текстушки. :D

Проще говоря - это черновик. Вот в таком объёме - быстрей ввести вручную.
Но если будет 80-100 строк выписки - то это хорошая заготовка.
За теми, кто отстал, не возвращаться ! 🏴‍☠️ Кодекс
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Вручную не быстрее. Товары не надо будет искать, все строки автоматически встанут. Контрагента в данном случае привязывать не надо, он выбирается перед загрузкой, так как нам же нужно план обмена подтянуть. Его можно сверить, инн/кпп в шапке определяются.

Дело не только в скорости ввода. Я уже написал, что вводом документов занимаются не бухгалтера. Бухгалтер должен осуществлять контроль после того, как документы придут в центральную базу на сервере из магазинов. На сервере мы просто запустим отчет, в котором программа автоматически сверит итоговые суммы из документов в базе данных и из сканов. Разумеется, не на точное совпадение, а на превышение, так как могут быть недовозы. Это один из элементов минимизации затрат при учете ндс.

Еще важно, что не надо искать первичные документы. Щелкаем на кнопочку в форме документа, открываем скан.
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Вот как это выглядит для документов из эдо. Сканы после ocr должны будут попасть в эту систему.

scan1.png

scan2.png
C6/C12, ШВС, tps/btrieve.
Аватара пользователя
finsoftrz
✯ Ветеран ✯
Сообщения: 5555
Зарегистрирован: 06 Ноябрь 2014, 12:48
Благодарил (а): 18 раз
Поблагодарили: 78 раз

Распознование текста накладных (OCR)

Сообщение finsoftrz »

Автоматическая сверка документов с ЭДО, выводятся только документы, по которым у программы возникли вопросы.

scan3.png
C6/C12, ШВС, tps/btrieve.
Ответить