DeepSeek-OCR сэкономит токены при распознавании документов

Компания DeepSeek анонсировала новую модель для распознавания документов — DeepSeek-OCR. Она распространяется под лицензией MIT и доступна на платформе Hugging Face.

От классических систем оптического распознавания символов (OCR) новинку отличает то, что система не просто извлекает текст со страниц, а сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к иллюстрациям. Результат выдаётся в формате Markdown, подходящем для индексации и последующей работы нейросетей.

DeepSeek-OCR практикует «оптическое сжатие контекста», то есть делает своего рода выжимку основного — текста и смысловой структуры, что сокращает итоговый объём данных в среднем в десять-двадцать раз и снижает стоимость обработки (чем меньше токенов, тем дешевле и быстрее работает последующая LLM).

Новая система использует «визуальные токены» — так даже при небольшом бюджете точность распознавания держится на уровне 97-99 %. Если же сканируемая страница слишком сложна, активируется режим Gundam: документ автоматически делится на фрагменты, и трудные области анализируются отдельно, без потери общей скорости. Плюс ко всему, модель от DeepSeek поддерживает привязку распознанных элементов к координатам на странице — это позволяет точно находить таблицы или подписи в общем массиве.

Представленное решение, как пояснили его авторы, выдаёт такое же качество, что и мультимодальные модели вроде Qwen или GOT-OCR 2.0, при гораздо меньшем объёме вычислений.

27 октября, 2025

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

27.05.2026
Банкиров обяжут всё больше дружить с СБП
27.05.2026
OpenAI ищет того, кто сможет обуздать суперавтономный ИИ
26.05.2026
ЦБ РФ: Количество банкоматов сократилось, а POS-терминалов — выросло
26.05.2026
Журналисты и простые пользователи получили сканер дипфейков
26.05.2026
Сбор данных об абонентах — новая точка уязвимости?
26.05.2026
WP: Маск и Цукерберг повлияли на ИИ-политику США
26.05.2026
Минцифры отказалось от IMEI-сбора в пользу операторов связи
25.05.2026
ИИ-модели повышают ценность безопасности by design
25.05.2026
Три четверти компаний сознательно выпускает уязвимый код
25.05.2026
«Киберстрахование» пока не вошло в привычку, но «лёд тронулся»

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных