Чат-бот Mistral разрешит юристам быстро анализировать большие PDF-файлы с помощью API

Опубликовано: 07.03.2025, 13:01 | Автор: hdhAI

Mistral выпустила специализированный OCR-API, который преобразует сложные PDF-документы в читабельный для ИИ формат, сохраняя изображения и их структуру.

Источник изображения: Mistral

Французская компания Mistral, специализирующаяся на разработке языковых моделей (LLM), представила новый инструмент для работы с PDF-документами. API под названием Mistral OCR позволяет конвертировать файлы PDF в текстовый формат, удобный для обработки искусственным интеллектом.

Известно, что LLM, такие как ChatGPT, лучше всего работают с неструктурированным текстом. Поэтому компании, использующие ИИ в своих процессах, стремятся хранить данные в чистом текстовом формате, который можно легко индексировать и повторно использовать.

В отличие от большинства аналогичных решений, Mistral OCR является мультимодальным API — то есть, не только распознаёт текст, но и определяет расположение изображений, таблиц и других графических элементов, включая их в итоговый документ.

Выходные файлы формируются в формате Markdown, который широко используется разработчиками для разметки текста. Этот формат позволяет добавлять заголовки, ссылки и другие элементы, что делает его очень удобным для работы с LLM. Более того, многие ИИ-ассистенты, включая ChatGPT и Le Chat от Mistral, используют Markdown для генерации форматированного текста.

«Со временем компании накопили огромное количество документов в формате PDF и презентаций, которые остаются недоступными для языковых моделей, особенно в системах RAG. С помощью Mistral OCR наши клиенты теперь могут превращать сложные документы в читаемый контент на любом языке», — заявил сооснователь и главный научный сотрудник Mistral Гийом Лампль (Guillaume Lample).

API доступен как на платформе Mistral, так и через облачные сервисы, включая AWS, Azure и Google Cloud. Для организаций, работающих с конфиденциальными данными, предусмотрена возможность локального развёртывания.

По утверждению разработчиков, Mistral OCR превосходит аналоги от Google, Microsoft и OpenAI, особенно при работе со сложными документами, содержащими математические формулы, сложные макеты или таблицы. Также заявлено, что API лучше справляется с обработкой документов на разных языках, а за счёт узкой специализации работает быстрее, чем универсальные модели, такие как GPT-4o.

Mistral уже использует свой API в собственном ИИ-ассистенте Le Chat. Компании и разработчики смогут применять этот инструмент совместно с Retrieval-Augmented Generation (RAG) — технологией, которая позволяет загружать документы в LLM и использовать их содержание для генерации ответов. Это может быть полезно, например, юридическим фирмам, которым необходимо быстро анализировать большие объёмы документов.

Источник: TechCrunch

Похожие статьи
Интересное





Warning: file_put_contents(/var/www/angella1/data/www/hdhai.com/counter/count.php): Failed to open stream: Permission denied in /var/www/angella1/data/www/hdhai.com/counter.php on line 89