News Grower

Независимое покрытие AI, стартапов и технологий.

Habr 03.04.2026 15:30 Инструменты разработки Пик Тёпло Рост в поиске

Anthropic проверяли, не задумал ли их ИИ чего плохого. Ответ — почти нет

Где-то в недрах Anthropic сидят люди, чья работа - выяснить, не пытается ли их самая умная модель тихо сломать мир. Они выпустили 53-страничный отчёт о том, как искали зло в Claude Opus 4.6. Anthropic взяли Claude Opus 4.6 - модель, которая уже вовсю пишет код на их собственной инфраструктуре, генерирует данные для ...

Погода сигнала

Пик

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Автор: wearetyomsmnv Оригинальный источник
Anthropic проверяли, не задумал ли их ИИ чего плохого. Ответ — почти нет

Где-то в недрах Anthropic сидят люди, чья работа - выяснить, не пытается ли их самая умная модель тихо сломать мир. Они выпустили 53-страничный отчёт о том, как искали зло в Claude Opus 4.6. Anthropic взяли Claude Opus 4.6 - модель, которая уже вовсю пишет код на их собственной инфраструктуре, генерирует данные для обучения, помогает проводить исследования - и попытались доказать, что она не способна их подставить. Исследование охватывает восемь конкретных путей к катастрофе: от тихого саботажа научных результатов до самостоятельной эксфильтрации весов модели на внешний сервер. По каждому пути - разбор мотивации, возможностей и того, что мешает это реализовать. Заглянуть за забор

Оставайтесь в сигнале

Следить за темой «Anthropic проверяли, не задумал ли их ИИ чего плохого. Ответ — почти нет»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Сначала отправим письмо для подтверждения, а дальше — только содержательные дайджесты.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

Тема уже растёт в поиске: импульс 923 и 28 внешнего сигнала.
У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.
Сюжет постоянно вращается вокруг Anthropic, Claude, and Claude Opus, поэтому страницы сущностей дадут самый быстрый контекст.
Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

20.05.2026 04:18 iXBT Live AI

Anthropic переманила сооснователя OpenAI для обучения Claude

Компания объявила о присоединении Андрея Карпатого, сооснователя OpenAI и бывшего директора Tesla по ИИ, к их команде

20.05.2026 04:02 3DNews Software

Google ответила на Claude Mythos — представлен ИИ-агент CodeMender для автоматического поиска и исправления дыр в ПО

Google активизировала работу в направлении кибербезопасности, анонсировав на конференции I/O расширение доступа к ИИ-агенту CodeMender дл...

19.05.2026 16:43 3DNews Breaking

Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude

Андрей Карпатый (Andrej Karpathy), исследователь в области ИИ, соучредитель и бывший сотрудник OpenAI, ранее возглавлявший отдел ИИ в Tes...

19.05.2026 14:00 ServerNews News

Arm-процессоры NVIDIA Vera поставили в ведущие ИИ-лаборатории мира — Oracle развернёт сотни тысяч таких CPU

Первые CPU Vera, разработанные компанией NVIDIA, поставили в Anthropic, OpenAI, Oracle Cloud Infrastructure (OCI) и SpaceX/xAI. Процессор...

19.05.2026 10:10 3DNews Software

Передовые чат-боты с ИИ провалились в роли радиоведущих — каждый по своему

Оригинальный эксперимент провёл стартап Andon Labs: четырём наиболее известным американским чат-ботам с искусственным интеллектом поручил...

03.04.2026 15:30 Habr

Anthropic проверяли, не задумал ли их ИИ чего плохого. Ответ — почти нет

Где-то в недрах Anthropic сидят люди, чья работа - выяснить, не пытается ли их самая умная модель тихо сломать мир. Они выпустили 53-стра...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 8% дают выраженный поисковый сигнал.

Рискованный

Надёжность

10

Свежесть

22

Источников в сюжете

6

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

iXBT Live AI 20.05.2026 04:18 AI
Пик Горячо Рост в поиске

Anthropic переманила сооснователя OpenAI для обучения Claude

Компания объявила о присоединении Андрея Карпатого, сооснователя OpenAI и бывшего директора Tesla по ИИ, к их команде

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 957 и 56 внешнего сигнала.

Google ответила на Claude Mythos — представлен ИИ-агент CodeMender для автоматического поиска и исправления дыр в ПО
Пик Горячо Рост в поиске

Google ответила на Claude Mythos — представлен ИИ-агент CodeMender для автоматического поиска и исправления дыр в ПО

Google активизировала работу в направлении кибербезопасности, анонсировав на конференции I/O расширение доступа к ИИ-агенту CodeMender для защиты кода. По заявлению компании, ин...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 962 и 28 внешнего сигнала.

Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude
Пик Горячо Рост в поиске

Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude

Андрей Карпатый (Andrej Karpathy), исследователь в области ИИ, соучредитель и бывший сотрудник OpenAI, ранее возглавлявший отдел ИИ в Tesla, присоединился к компании Anthropic. ...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 953 и 56 внешнего сигнала.

Пик Горячо Рост в поиске

Arm-процессоры NVIDIA Vera поставили в ведущие ИИ-лаборатории мира — Oracle развернёт сотни тысяч таких CPU

Первые CPU Vera, разработанные компанией NVIDIA, поставили в Anthropic, OpenAI, Oracle Cloud Infrastructure (OCI) и SpaceX/xAI. Процессоры специально разработаны с учётом особен...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 938 и 56 внешнего сигнала.

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про
Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS
Пик Тёпло Рост в поиске

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 919 и 28 внешнего сигнала.

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса
Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов
Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Дополнительное покрытие этой темы

Похожие публикации и близкие по смыслу материалы по этой же теме.

iXBT Live AI 20.05.2026 04:18 AI
Пик Горячо Рост в поиске

Anthropic переманила сооснователя OpenAI для обучения Claude

Компания объявила о присоединении Андрея Карпатого, сооснователя OpenAI и бывшего директора Tesla по ИИ, к их команде

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 957 и 56 внешнего сигнала.

Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude
Пик Горячо Рост в поиске

Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude

Андрей Карпатый (Andrej Karpathy), исследователь в области ИИ, соучредитель и бывший сотрудник OpenAI, ранее возглавлявший отдел ИИ в Tesla, присоединился к компании Anthropic. ...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 953 и 56 внешнего сигнала.

Модель Claude Mythos от Anthropic помогла взломать macOS, обнаружив и объединив две уязвимости
Пик Горячо Рост в поиске

Модель Claude Mythos от Anthropic помогла взломать macOS, обнаружив и объединив две уязвимости

Модель искусственного интеллекта Claude Mythos компании Anthropic выявила новые уязвимости в системе безопасности операционной системы macOS. Apple уже их изучает, пишет The Wal...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 930 и 56 внешнего сигнала.

Anthropic заявила, что ИИ уже пишет более 90 % её кода
Пик Горячо Рост в поиске

Anthropic заявила, что ИИ уже пишет более 90 % её кода

Технологические компании как будто объявили состязание, для кого из них искусственный интеллект пишет больше программного кода. И Anthropic, похоже, вырвалась вперёд — ИИ-помощн...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 928 и 28 внешнего сигнала.