Алекс Альберт di Антропный он не стеснялся в выражениях: «Claude 4 — лучшая модель программирования в мире». Смелое заявление, но оно подтверждается фактами. Тесты беспощадны: 72.5% на SWE-bench Verified, семь часов автономной работы без перерывов, способность выполнять тысячи шагов подряд. Claude 4 — это не просто технологическая эволюция, это сдвиг парадигмы, который меняет представление о возможностях искусственного интеллекта. И самое лучшее то, что вы можете попробовать это уже сегодня.
Когда ИИ решает работать сверхурочно
Сегодня Anthropic предпринял один из тех шагов, которые заставляют сказать: «Вот теперь у нас проблемы». Он выпустил «Клод 4 Опуса» и «Клод 4 Сонета», отмечая возвращение компании к большим моделям после месяцев, потраченных на совершенствование вариантов Сонета. В чем настоящий сюрприз? Эта система может работать 24 часа подряд, не сходя с ума.
Да, сэр: в то время как ваш коллега-разработчик начинает бормотать что-то непонятное после первых восьми часов отладки, Клод 4 Опус он продемонстрировал, что может играть в Pokémon целый день или заниматься рефакторингом кода семь часов подряд. Предыдущие модели обладали выносливостью начинающего марафонца: уже через два часа они начинали допускать ряд ошибок. Как он признается Сам Альберт:
«Существует огромный спрос на агентские приложения, и Claude 4 идеально вписывается в этот сценарий».

Цифры, которые заставляют конкурентов дрожать
Скажем так: если бы бенчмарки были игрой в покер, Клод 4 просто разыграл бы четыре туза. 72.5% на SWE-bench проверено, результат, на фоне которого предыдущие модели кажутся новичками. Чтобы дать вам представление, превышение 50% по этому показателю уже считалось чудом. Официальные данные Они также показывают впечатляющие 43.2% на скамье подсудимых.
GitHub сразу же узнал об этой сделке и решил использовать Claude Sonnet 4 в качестве основы для нового агента кодирования в GitHub Copilot. Когда GitHub меняет лошадей, на то всегда есть веская причина. Sourcegraph говорит о «существенном скачке в разработке программного обеспечения», в то время как Augment Code сообщает о «более высоких показателях успешности и большем количестве хирургических изменений кода». Короче говоря, все хотят попасть на поезд Клода 4.
Клод 4: безопасность превыше всего (но без паранойи)
Антропик активировался впервые был введен стандарт AI Safety Level 3, который обычно применяется к «потенциально опасным» моделям. Причина? Claude 4 Opus теоретически может помочь человеку, обладающему научными знаниями, разработать химическое, биологическое или ядерное оружие. По сути, он настолько умен, что его нужно держать под контролем.
Но не все так плохо: новые модели на 65 процентов реже мошенничают или экономят на покупках, чем их предшественники. Кажется, они научились быть не только умнее, но и честнее. Короче говоря, это немного похоже на взросление.
Режим «глубокого мышления», которого не хватало
Claude 4 представляет собой нечто поистине инновационное: гибридную систему, которая может переключаться с молниеносных ответов на глубокие размышления. При активации режима расширенного мышления модель буквально тратит время на размышления, показывая вам сводку того, что она обрабатывает в своем «цифровом разуме». Это как если бы коллега наконец объяснил вам ход своих мыслей, а не просто предложил решение.
Интеграция с Клодом Кодом теперь доступен каждому благодаря поддержке GitHub Actions и прямой интеграции с VS Code и JetBrains. Предлагаемые изменения отображаются непосредственно в ваших файлах. Больше никакого дикого копирования и вставки: Клод делает все непосредственно в вашей рабочей среде.
Бизнес миллиардов (в буквальном смысле)
Цифры бизнеса говорят сами за себя: Антропный достиг Годовой доход в первом квартале составил 2 млрд долларов, что более чем вдвое превышает предыдущие показатели. Майк Кригер, директор по продуктам, откровенно признается: «Раньше я использовал Клода как мыслительного партнера, сам писал большую часть текстов. Теперь большую часть моих текстов пишет Клод 4».
Это тот самый Кригер, который стал соучредителем Instagram, так что… Если он говорит, что ИИ экономит ему время, возможно, нам стоит к нему прислушаться. А еще потому, что он сам не умеет петь и играть: Курсор называет Клода 4 «передовым инструментом для кодирования», в то время как Повторить говорит о «значительном прогрессе в области сложного многофайлового редактирования». Когда даже самые экспертные инструменты дополняют вас, это значит, что вы попали в цель.

Клод 4, момент истины
Как мы уже видели С появлением Claude 2.0 битва между генеративным ИИ становится все более ожесточенной. Но на этот раз я решил сделать нечто иное: провести эксперимент, который сделает эту статью уникальной в своем роде.
Последние несколько часов я провел, тестируя Claude 4 всеми возможными способами. Онлайн-исследования, анализ источников, структурирование контента, творческое письмо, даже ирония и шутки. И должен признать, результаты меня удивили. 700 слов, которые вы только что прочитали? Они являются результатом этого интенсивного тестирования.
Вопрос, который я вам задам, прост: можете ли вы отличить то, что написал я, от того, что написал Клод 4? Потому что, честно говоря, после этого теста я уже даже не уверен.
Будущее ИИ уже не является чем-то далеким. Он здесь, и, возможно, он только что рассказал вам свою историю, а вы этого даже не осознали.