Работа с типом проекта Умный OCR

Для использования инструкции создайте проект типа Умный OCR.

Умный OCR позволяет обучать и использовать модели детекции полей для автоматического поиска областей с текстом в документах.

Типы проектов

Распознавание документов утверждённой формы
Модель обучается на изображениях одного типа документа с фиксированным расположением полей.

Пример: распознавание данных только в паспортах.
Распознавание документов произвольной формы
Модель работает с неструктурированными документами на белом фоне. На одной странице может встречаться несколько полей одного типа.

Пример: распознавание данных в договорах или справках разного вида.
Классификация
Модель определяет, к какому классу относится документ.
Класс — это заранее известный тип документа, задаваемый в проекте через схему разметки.

Пример: определить, что изображение относится к категории «паспорт», «водительское удостоверение» или «свидетельство о рождении».

Основные задачи проекта

Создать датасет для обучения.
Обучить модель.
Использовать модель для детекции полей и извлечения текста.

⚠️

При обучении модели распознавание текста внутри полей не выполняется. Модель лишь находит поля на изображении. Извлечение текста происходит только при использовании модели.

Шаги работы

После создания проекта вы автоматически перейдёте на интерфейс проекта, где отображаются шаги работы: alt

Датасет → Обучение → Использование → Тестирование:

Датасет
Подготовка датасета: загрузка изображений для обучения и теста, настройка полей для разметки данных.
Обучение
Настройка условий и ресурсов для обучения нейросетевой модели и запуск процесса.
Использование
Управление уже обученными моделями.
Тестирование
Проверка работы обученной модели на новых данных.

Что дальше

Чтобы начать работу с проектом, выберите раздел Датасет.