DeepSeek представила OCR-модель второго поколения

30.01.2026
2 мин
DeepSeek представила OCR-модель второго поколения

Компания DeepSeek представила второе поколение своей OCR-модели DeepSeek-OCR 2, сделав акцент не просто на распознавании текста, а на полноценном понимании структуры документов. Новая версия имеет 3 миллиарда параметров и модифицирована обновленным визуальным энкодером DeepEncoder V2, который радикально меняет подход к считыванию изображений через последовательное чтение документа как это делает человек.

Ключевым техническим нововведением DeepSeek-OCR 2 является визуальный энкодер DeepEncoder V2, который формирует глобальное представление страницы перед определением логического порядка восприятия элементов. В традиционных моделях изображение читается линейно от верхнего левого угла к нижнему правому, что дает сбои в многостолбцовых макетах и таблицах, DeepEncoder V2 сначала схватывает структуру страницы, затем читает содержимое аналогично человеку.

Модель остается компактной с 3 миллиардами параметров, что делает ее пригодной для локального развертывания и тонкой настройки, по внутренним тестам DeepSeek новая версия на 4 процента превосходит предыдущий DeepSeek-OCR и обходит Gemini 3 Pro в бенчмарках анализа сложных документов. Это критично для корпоративных сценариев анализа контрактов, финансовых отчетов и форм, код DeepSeek-OCR 2 доступен для скачивания на Hugging Face и GitHub.

DeepSeek-OCR 2 представляет шаг от классического оптического распознавания символов к осмысленному чтению документов через восприятие страницы как логической структуры а не набора пикселей. Сочетание компактного размера и улучшенной точности делает DeepSeek-OCR 2 сильным конкурентом коммерческим VLM-решениям. Ранее DeepSeek готовит запуск модели V4 с расширенными возможностями программирования.

Выпуск DeepSeek-OCR 2 важен для специалистов по созданию сайтов и искусственному интеллекту, работающих с обработкой документов и извлечением данных, поскольку компактная модель с 3 миллиардами параметров обеспечивает точное распознавание сложных макетов для локального развертывания без зависимости от облачных API, что снижает затраты на обработку больших объемов документации и повышает безопасность данных при работе с конфиденциальной информацией.

Закрыть

Получить пример отчета

Мы собираем детальную аналитику, чтобы каждое решение было основано на данных. Сюда включены все аспекты маркетинга - от поведения аудитории до рентабельности кампаний.

✉ Укажите вашу почту, чтобы мы могли отправить вам пример отчета