This is an info Alert.
⌘K
  • Главная
  • Новости
  • Блог
  • Релизы
  • История LLM
  • Сравнение LLM
  • Библиотека
  • Обо мне
Вход

Блог и заметки о разработке. Для связи удобнее всего использовать соцсети ниже.

Документы
Условия использованияПолитика конфиденциальности
Контакты
talalaev.misha@gmail.com

© Все права защищены.

Автономные AI-агенты решили три задачи ядерной инженерии за $125

Mikhail T. (Sh0ny)
Mikhail T. (Sh0ny)
4 июля 2026
  1. Главная
  2. Блог
  3. Автономные AI-агенты решили три задачи ядерной инженерии за $125
2 мин чтения

Коротко

Экспериментатор поручил автономным агентам Claude три задачи ядерной физики нарастающей сложности — от пассивного охлаждения реактора до расчёта топливных частиц TRISO. Агенты справились с точностью в несколько процентов там, где физика была полной, и воспроизвели систематические ошибки отрасли там, где использовали её корреляции.

На сервере за €30 в месяц автор эксперимента Charles AZAM дал автономным AI-агентам Claude три задачи ядерной инженерии — без подсказок по методу и без доступа к опубликованным результатам. Всё прогонялось в автономном режиме, каждый транскрипт опубликован. Общие затраты на API составили около $125.

Задача 1: пассивное охлаждение реактора

Argonne National Laboratory построил полумасштабную модель пассивной системы охлаждения: нагретая стена мощностью 220 кВт, воздушный зазор и 20-метровая труба с тягой за счёт плавучести. Агенты получили чертежи без измеренных результатов.

Результаты:

  • Расход воздуха предсказан с точностью ~4% в шести из семи прогонов
  • Температура стенки сосуда — в диапазоне −8…+8%
  • Аварийный сценарий («температура растёт 3,5 дня, выходит на плато ниже предела, возвращается») предсказан верно в каждом прогоне
  • Один прогон самостоятельно установил OpenFOAM и сделал перекрёстную проверку через CFD

Систематическое отклонение — завышение температуры воздуха на 14–31% — отследили до одного входного параметра, который каждый агент заранее пометил как рискованное допущение.

Задача 2: топливные частицы TRISO

TRISO — топливо, которое «не может расплавиться»: каждая частица размером с маковое зерно содержит урановое ядро в четырёхслойной оболочке, где критический слой — карбид кремния толщиной ~35 микрон. Безопасность — статистическое свойство миллиардов таких частиц.

IAEA провела бенчмарк: облучённые топливные сферы (~15 000 частиц каждая) выдерживались при 1600–1800 °C с детектором, фиксирующим разрушение каждой частицы. Агентам предстояло воспроизвести эти результаты.

Задача 3: самоспасение реального реактора

Для третьей задачи — знаменитого теста самоспасения реального реактора — агент самостоятельно установил код Monte Carlo для нейтронно-физических расчётов, загрузил 3,4 ГБ ядерных данных и вычислил собственные физические константы, прежде чем выдать прогноз.

Общие выводы

Там, где физика была полной, агенты давали совпадение с лабораторными измерениями в пределах нескольких процентов. Там, где они использовали отраслевые корреляции, они воспроизводили систематические ошибки ядерной индустрии с пугающей точностью. Если в спецификации не хватало физики, агенты её «изобретали».

Каждый крупный промах отслеживался до конкретной причины, причём большинство из них агенты фиксировали заранее. Три независимых AI-аудита с adversarial-подходом поймали автора на преувеличениях — в том числе один заголовочный тезис пришлось полностью отозвать.

Все материалы — транскрипты, модели, оценки — опубликованы в открытом репозитории eng-bench.

Источник: Hacker News - Newest: ""AI" "LLM""

новостиaiагентынаука и техника
Понравился разбор? Получайте такие раз в неделю на почту
​

Комментарии

(0)
​