OpenAI официально представила GPT-5: что изменилось в самой мощной языковой модели
AI МоделиOpenAI анонсировала GPT-5 — следующее поколение языковых моделей с улучшенными возможностями рассуждения, нативным многомодальным вводом и значительно сниженной частотой галлюцинаций. Разбираем главные изменения и то, что это означает для разработчиков.
OpenAI официально представила GPT-5 — и это, пожалуй, самый значимый релиз компании за последние годы. Новая модель не просто «чуть умнее» предшественницы: она переосмысляет то, как большие языковые модели взаимодействуют с информацией, ведут рассуждения и работают с визуальными данными.
Ключевые улучшения в GPT-5
Главное, что отличает GPT-5 от предыдущих версий — это система расширенного рассуждения (extended reasoning), работающая «под капотом» для большинства запросов. Модель способна разбивать сложные задачи на промежуточные шаги, проверять собственные выводы и откатываться назад при обнаружении логических противоречий. Это особенно заметно при решении математических задач и анализе кода.
По данным внутренних бенчмарков OpenAI, GPT-5 показывает результаты на уровне PhD-специалистов в задачах по биологии, химии и физике. На публичном наборе данных MMLU модель набрала 92,3% — против 87,1% у GPT-4o.
«Мы впервые создали модель, которая понимает контекст не как статичный снимок разговора, а как динамически обновляющуюся карту знаний», — заявил Сэм Альтман на презентации.
Многомодальность нового поколения
GPT-5 получила нативную поддержку изображений, аудио и видео — без дополнительных адаптеров, как это было реализовано раньше. Модель обрабатывает видеоряд длиной до 10 минут напрямую, что открывает новые возможности для создания ассистентов, работающих с реальным миром.
Особого внимания заслуживает режим «живого зрения»: GPT-5 может анализировать прямой видеопоток с камеры устройства и отвечать на вопросы о происходящем в реальном времени. Это уже встроено в ChatGPT на iOS и Android.
Проблема галлюцинаций
Один из хронических недостатков GPT-4 — склонность уверенно выдавать неверную информацию. OpenAI утверждает, что в GPT-5 этот показатель снизился на 47% на стандартных наборах тестов на фактическую точность. Модель теперь чаще использует фразы неопределённости («мне кажется», «я не уверен, но...») и активнее отказывается отвечать на вопросы, выходящие за пределы её знаний.
Тем не менее, галлюцинации никуда не исчезли — они просто стали реже. В сложных цепочках рассуждений с несколькими шагами модель по-прежнему может ошибаться, особенно когда речь идёт о свежих событиях или нишевых областях знаний.
Контекстное окно и память
GPT-5 поддерживает контекстное окно в 256 000 токенов — примерно 200 000 слов или небольшая книга целиком. Но важнее другое: модель получила постоянную память между сессиями. Пользователи ChatGPT Plus и выше смогут настроить, что именно модель должна «помнить» о них: профессию, предпочтения в общении, текущие проекты.
- 256k токенов контекстного окна
- Постоянная пользовательская память (настраиваемая)
- Поддержка Projects с общей памятью для команд
- API доступ с гибкой настройкой уровня рассуждений
Ценообразование и доступность
GPT-5 доступна в трёх конфигурациях: GPT-5 Mini (быстрая и дешёвая, для простых задач), GPT-5 (основная версия) и GPT-5 Pro (максимальные возможности рассуждения, медленнее и дороже). Через API стоимость токенов снизилась примерно на 30% по сравнению с GPT-4o.
Для разработчиков это означает, что создавать умные приложения стало дешевле — при этом качество значительно выросло. GPT-5 Mini, по заявлению OpenAI, превосходит GPT-4o при меньших затратах, что делает её привлекательным выбором для большинства прикладных задач.
Что это значит для рынка
Выход GPT-5 ускорит гонку вооружений в AI-индустрии. Google уже анонсировала обновлённый Gemini Ultra, Anthropic дорабатывает следующую версию Claude, а Meta продолжает развивать открытые модели Llama. Конкуренция на этом рынке сейчас как никогда высока — и это хорошо для конечных пользователей.
Для компаний, уже использующих GPT-4o в продакшне, переход на GPT-5 обещает быть относительно безболезненным: API совместим, форматы ответов не изменились. Главная работа — это настройка промптов под улучшенные возможности рассуждения и тестирование новых мультимодальных функций.
Источник: OpenAI Blog
Теги: openai, gpt-5, llm, языковые модели, искусственный интеллект