Anthropic выпустила Claude 3.7 Sonnet: расширенный контекст и новые возможности рассуждения
AI МоделиНовая версия Claude от Anthropic получила расширенное контекстное окно, улучшенный режим «расширенного мышления» и обновлённые инструменты для разработчиков. Модель демонстрирует значительные улучшения в задачах программирования и научного анализа.
Anthropic объявила о выпуске Claude 3.7 Sonnet — значительном обновлении своей флагманской модели. Релиз приходится на период обострившейся конкуренции в сегменте фронтирных AI-моделей и подчёркивает ставку компании на «надёжный AI» как конкурентное преимущество.
Расширенное мышление: что изменилось
Ключевая особенность Claude 3.7 Sonnet — улучшенный режим Extended Thinking. Когда он активирован, модель явно «думает вслух» перед тем, как дать финальный ответ. Этот процесс виден пользователю в реальном времени: вы буквально видите, как Claude формулирует промежуточные гипотезы, проверяет их и корректирует курс.
В предыдущей версии Extended Thinking уже существовал, но теперь он стал значительно глубже и управляемее. Разработчики могут задать «бюджет токенов» на размышления — от минимального быстрого режима до 32 000 токенов для сложных задач. Это позволяет точно балансировать между скоростью и качеством ответа.
«Мы хотим, чтобы пользователи видели не просто результат, а процесс. Прозрачность рассуждений — это не только полезно, но и безопаснее», — объяснила Дарио Амодеи в интервью журналу Wired.
Программирование: новый уровень
Среди всех улучшений наиболее заметен прогресс в задачах программирования. На популярном бенчмарке SWE-bench Verified, который проверяет способность модели решать реальные задачи из GitHub Issues, Claude 3.7 Sonnet набрал 70,3% — против 49% у предыдущей версии. Это один из лучших показателей среди всех публично доступных моделей.
- SWE-bench Verified: 70,3% (реальные задачи GitHub)
- HumanEval (генерация кода): 94,2%
- Улучшена работа с legacy-кодом и нестандартными фреймворками
- Поддержка до 64 последовательных шагов при использовании агентских инструментов
Computer Use: управление компьютером
Claude 3.7 Sonnet получил значительно улучшенную версию Computer Use — возможности управлять компьютером через скриншоты и имитацию ввода. Теперь модель надёжнее работает с веб-интерфейсами, лучше понимает контекст экрана и реже «застревает» в циклах ошибочных действий.
Anthropic подчёркивает, что Computer Use всё ещё находится в бета-режиме и требует тщательного надзора — особенно при работе с конфиденциальными данными. Тем не менее, несколько компаний уже используют эту функцию для автоматизации рутинных задач в корпоративных системах.
Безопасность как приоритет
Anthropic по-прежнему выделяется среди конкурентов своим вниманием к вопросам безопасности. Claude 3.7 прошёл расширенное тестирование по протоколам Responsible Scaling Policy (RSP) — внутренней системе оценки рисков компании.
В рамках Constitutional AI второго поколения модель теперь может объяснять свои отказы более детально: вместо общего «я не могу помочь с этим» Claude даёт конкретные причины и, где возможно, предлагает альтернативные подходы. Это делает взаимодействие с моделью значительно менее фрустрирующим при работе в граничных случаях.
API и инструменты разработчиков
Обновлённое API включает поддержку параллельных вызовов инструментов — Claude теперь может инициировать несколько одновременных действий вместо последовательных. Это критично для агентских приложений, где скорость определяет практическую применимость.
Контекстное окно остаётся на уровне 200 000 токенов для ввода, но Anthropic улучшила качество работы с длинными документами — модель теперь реже «теряет» информацию из середины большого контекста, что было заметной проблемой предыдущих версий.
Когда выбирать Claude вместо GPT
После всех обновлений выбор между Claude и GPT-5 становится вопросом конкретных задач. Claude традиционно сильнее в задачах, требующих тщательного рассуждения, работе с кодом сложных проектов и случаях, где важна предсказуемость поведения. GPT-5 лидирует по мультимодальным возможностям и интеграции с экосистемой OpenAI. Конкуренция здорова — и пользователи от этого только выигрывают.
Источник: Anthropic
Теги: anthropic, claude, llm, искусственный интеллект, программирование