Вайб-кодинг 25.06.2026 05:10
На днях вышел Mistral OCR 4
Он распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа. 😨
https://mistral.ai/news/ocr-4/
#vk_feedОн распознаёт документы на 170 языках.
Тестеры сравнили OCR 4 с другими решениями в лоб. Независимые аннотаторы вслепую ранжировали 600+ реальных документов на 12+ языках. OCR 4 победил каждую систему. Средний винрейт 72%.
На бенчмарках картина похожая. OlmOCRBench - 85.20. Особенно заметен разрыв на редких языках
Из интересного - OCR 4 смог превратить рукописный экзамен по математическому анализу в чистый LaTeX.
Модели дали фото страницы с рукописным экзаменом. Она прочитала почерк и восстановила каждую формулу в структурированный цифровой текст.
Результат: 5.1 секунды обработки при стоимости всего $0.09.
Формулы были распознаны корректно. График модель не перерисовала, но это как раз показательно. Большинство OCR-систем просто извлекают текст и теряют подобные элементы. OCR 4 распознал график, выделил его отдельным блоком и пометил как chart. Он не появился в виде новой отрисовки, но был учтён в структуре документа. 😨
https://mistral.ai/news/ocr-4/
Комментарии (0)
Пока нет комментариев. Будьте первым!