Новая модель MWS AI распознаёт рукописный текст и отвечает на вопросы по изображениям - Inc News
, автор: Быстрова А.

Новая модель MWS AI распознаёт рукописный текст и отвечает на вопросы по изображениям

Источник фото: freepik.com

Компания MWS AL представила на форуме «Финополис-2025» свою первую мультимодальную модель Cotype VL, способную одновременно анализировать изображения и текст.

Дочерняя структура МТС Web Services представила на форуме «Финополис-2025» свою первую мультимодальную модель – Cotype VL, способную одновременно анализировать и интерпретировать изображения и текст.

Модель Cotype VL разработана для сценариев, где требуется совместная обработка визуальной и текстовой информации. Она может:

  • создавать краткие и развёрнутые описания изображений;
  • отвечать на сложные вопросы, требующие сравнения, рассуждений и выводов;
  • учитывать визуальный контекст при переводе текста;
  • распознавать смешанный (печатный и рукописный) текст в документах, чеках, медицинских анализах, чертежах и скриншотах.

Решение поддерживает развёртывание в закрытом контуре и допускает дообучение на приватных данных заказчика. Это делает его применимым в юриспруденции, финансах, инжиниринге, HR и маркетинге — везде, где используются визуальные форматы: схемы, карты, таблицы, интерфейсы ПО, сканы договоров.

На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даете согласие с использованием данных технологий. Согласен