DeepSeek-OCR сэкономит токены при распознавании документов

Компания DeepSeek анонсировала новую модель для распознавания документов — DeepSeek-OCR. Она распространяется под лицензией MIT и доступна на платформе Hugging Face.

От классических систем оптического распознавания символов (OCR) новинку отличает то, что система не просто извлекает текст со страниц, а сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к иллюстрациям. Результат выдаётся в формате Markdown, подходящем для индексации и последующей работы нейросетей.

DeepSeek-OCR практикует «оптическое сжатие контекста», то есть делает своего рода выжимку основного — текста и смысловой структуры, что сокращает итоговый объём данных в среднем в десять-двадцать раз и снижает стоимость обработки (чем меньше токенов, тем дешевле и быстрее работает последующая LLM).

Новая система использует «визуальные токены» — так даже при небольшом бюджете точность распознавания держится на уровне 97-99 %. Если же сканируемая страница слишком сложна, активируется режим Gundam: документ автоматически делится на фрагменты, и трудные области анализируются отдельно, без потери общей скорости. Плюс ко всему, модель от DeepSeek поддерживает привязку распознанных элементов к координатам на странице — это позволяет точно находить таблицы или подписи в общем массиве.

Представленное решение, как пояснили его авторы, выдаёт такое же качество, что и мультимодальные модели вроде Qwen или GOT-OCR 2.0, при гораздо меньшем объёме вычислений.

27 октября, 2025

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

12.12.2025
В Европе и США хотят дать «карт-бланш» этичным хакерам
12.12.2025
Бакина: «Пластик» Visa и Mastercard остановился в развитии
12.12.2025
«Они готовы на это, они посчитали свою экономику». ЦОДы определились с аппетитами
12.12.2025
Британская система распознавания лиц страдает ксенофобией?
11.12.2025
Кого подготовят в рамках соглашений ИТ-компаний с вузами
11.12.2025
Австралийским подросткам запретили соцсети
11.12.2025
Почему Роскомнадзор не блокирует iMessage: две версии
11.12.2025
В России впервые использовали GenAI при проведении прямой линии главы региона
11.12.2025
Gartner советует приостановить использование браузеров с ИИ-агентами
11.12.2025
США сняли санкции с вице-президента «Лаборатории Касперского»

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных