Есть датасет: около 20 тыс. изображений в base64

03.03.2026

Есть датасет: около 20 тыс. изображений в base64

Модель — CNN + BiLSTM + CTC в Keras, вход 200×50×3.Сейчас дообучаю эту версию. Конечно, логичнее было бы перейти на что-то вроде transformer-based подхода (encoder–decoder с cross-attention), дабы быть на стиле с современными моделями для текста в изображениях

Пока оставляю текущий пайплайн -- быстро и предсказуемо. Посмотрим как он поведет себя результат

Есть датасет: около 20 тыс. изображений в base64

Вам также может понравиться

Некоторым нейросетевым клипам на YouTube исполняется 5 лет. Выглядят они сейчас так, как сейчас...

Telegram мощно обновился — и вот что теперь можно

Пост из Telegram