Anthropic представляет Claude 4 с рекордным окном контекста в 1 миллион токенов, превосходя конкурентов

17:29, 12 августа

Отредактировано: gaya ❤️ one

Компания Anthropic анонсировала выпуск Claude 4, новой модели искусственного интеллекта, которая может похвастаться окном контекста в 1 миллион токенов. Это значительное расширение позволяет модели обрабатывать огромные объемы данных, эквивалентные примерно 750 000 слов, за один запрос. Такая возможность открывает новые горизонты для анализа комплексных программных проектов, обширных документов и сложных систем.

Расширенное окно контекста Claude 4 позволяет анализировать полные репозитории кода и эффективно отлаживать сложные системы. Anthropic подчеркивает улучшенную связность и точность при работе с большими наборами данных. Это нововведение предлагает существенные преимущества для разработчиков программного обеспечения, потенциально сокращая циклы разработки за счет более тесной интеграции ИИ в рабочие процессы. Функции, такие как "Проекты", позволяют пользователям организовывать данные и обеспечивают Claude возможность ссылаться на предыдущие взаимодействия. С окном в 1 миллион токенов Claude 4 значительно превосходит конкурентов, таких как GPT-4 от OpenAI, который имеет ограничение в 128 000 токенов. Тесты производительности показывают, что Claude Opus 4 превосходит соперников в задачах кодирования и логических рассуждениях. Например, на бенчмарке SWE-bench Verified Claude Opus 4 демонстрирует результат 72,5%, а в условиях высокой вычислительной мощности — 79,4%, что является лучшим показателем среди всех сравниваемых моделей. Модель также лидирует или занимает высокие позиции в TerminalBench (агентное кодирование в CLI) с результатом 43,2% (50,0% в режиме высокой вычислительной мощности) и GPQA Diamond (рассуждения на уровне выпускника) с результатом 79,6% (83,3%).

Помимо разработки программного обеспечения, расширенные возможности Claude 4 открывают потенциальные применения в юридической и финансовой сферах для анализа обширных файлов дел или рыночных отчетов. Интеграция Claude 4 через Amazon Web Services Bedrock облегчает создание автономных ИИ-агентов. Например, Claude Sonnet 4, который теперь также поддерживает окно контекста в 1 миллион токенов, может обрабатывать кодовые базы с более чем 75 000 строк кода или десятки исследовательских работ за один запрос API. Это позволяет использовать Claude для проектов, требующих большого объема данных, таких как крупномасштабный анализ кода и синтез документов, а также для создания контекстно-зависимых агентов.

Приверженность Anthropic принципам безопасности и предоставлению проверяемых ответов остается отличительной чертой компании. Модель Opus 4 была выпущена с применением мер безопасности уровня AI Safety Level 3 (ASL-3), направленных на предотвращение злоупотреблений, включая разработку химического, биологического, радиологического или ядерного оружия. Эти меры включают в себя усиленные кибербезопасность, предотвращение взлома и дополнительные системы для обнаружения и отказа в обработке определенных типов вредоносного поведения. Несмотря на эти достижения, потенциальные проблемы включают высокие требования к вычислительным ресурсам и вопросы конфиденциальности данных для предприятий.

Источники

WebProNews
Anthropic unveils the latest Claudes with claim to AI coding crown
Anthropic's new AI model could be a game changer for developers: Claude Opus 4 'pushes the boundaries in coding', dramatically outperforms OpenAI's GPT-4.1, and can code independently for seven hours
Exclusive: New Claude Model Triggers Stricter Safeguards at Anthropic
Anthropic
Claude vs ChatGPT explained: What each AI does best - and how to choose the right one

Читайте больше новостей по этой теме:

19 августа

Оценка стартапов в области ИИ достигла $2,7 трлн, стимулируя создание технологического богатства

19 августа

Neuralink планирует достичь выручки в 1 миллиард долларов к 2031 году после пяти успешных имплантаций

18 августа

Hearst приобретает The Dallas Morning News за $74,9 млн, завершая эпоху местного семейного владения

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.