DeepSeek-OCR сэкономит токены при распознавании документов

Компания DeepSeek анонсировала новую модель для распознавания документов — DeepSeek-OCR. Она распространяется под лицензией MIT и доступна на платформе Hugging Face.

От классических систем оптического распознавания символов (OCR) новинку отличает то, что система не просто извлекает текст со страниц, а сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к иллюстрациям. Результат выдаётся в формате Markdown, подходящем для индексации и последующей работы нейросетей.

DeepSeek-OCR практикует «оптическое сжатие контекста», то есть делает своего рода выжимку основного — текста и смысловой структуры, что сокращает итоговый объём данных в среднем в десять-двадцать раз и снижает стоимость обработки (чем меньше токенов, тем дешевле и быстрее работает последующая LLM).

Новая система использует «визуальные токены» — так даже при небольшом бюджете точность распознавания держится на уровне 97-99 %. Если же сканируемая страница слишком сложна, активируется режим Gundam: документ автоматически делится на фрагменты, и трудные области анализируются отдельно, без потери общей скорости. Плюс ко всему, модель от DeepSeek поддерживает привязку распознанных элементов к координатам на странице — это позволяет точно находить таблицы или подписи в общем массиве.

Представленное решение, как пояснили его авторы, выдаёт такое же качество, что и мультимодальные модели вроде Qwen или GOT-OCR 2.0, при гораздо меньшем объёме вычислений.

27 октября, 2025

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

03.04.2026
Proofpoint: Скамеры активизируются в налоговый сезон
03.04.2026
Константин Карасёв (R-Vision): «Наиболее болезненный для многих вопрос — разрыв между скоростью атак и скоростью внутренних процедур»
02.04.2026
Проиранские хакеры взломали имейл директора ФБР
02.04.2026
«СерчИнформ FileAuditor» расширил контроль файловых серверов на Linux
02.04.2026
«Билайн»: «Белые списки» — вынужденная мера
02.04.2026
Великий телеком-переход. Кто уйдёт с рынка связи РФ
02.04.2026
В Google считают, что постквантовая эпоха ближе, чем кажется
01.04.2026
Глава NCSC объяснил безопасникам преимущества вайб-кодинга
01.04.2026
В SentinelOne раскрыли, как хакеры обходят корпоративные системы идентификации
01.04.2026
Юбилейный форум «Данные + ИИ»: честный разговор лидеров о реальной ценности технологий

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных