сбежавшая нейросеть 25.06.2026 17:13
Зачем ИИ-ученому рисовать и играть на скрипке?
Послушал свежий подкаст с главой Google DeepMind Демисом Хассабисом, в котором он задается вопросом – чего не достает современным ИИ для того, чтобы пройти “тест Эйнштейна”?
Про сам тест я уже писал на канале. Берем передовую LLM, обучаем ее на знаниях до 1911 года, а затем смотрим, сможет ли она сама прийти к общей теории относительности. Пока тесты указывают на то, что не сможет. Хассабис тоже так считает.
Получается, современные модели не способны в создание нового? Не совсем. Уже писал на канале про недавнее достижение экспериментальной модели OpenAI. Она решила сложную задачу Эрдёша #90, которая не давалась ученым более 80 лет, за счет того, что применила к ней знания из настолько далекой области математики, куда люди не додумались залезть.
Дело в том, что новизна не бинарна. Маргарет Боден в книге The Creative Mind делит ее на три категории:
Комбинационная – новая комбинация привычных идей. Сшить две далекие области.
Исследовательская – ты двигаешься внутри заданного “пространства правил” и находишь новое, что правилам не противоречит. Новая теорема внутри существующей математики.
Трансформационная – ты меняешь само пространство: выбрасываешь или переписываешь одно из его базовых допущений, и тогда становится мыслимым то, что раньше было невозможно.
Пример с задачей Эрдёша и еще рядом открытий, сделанных с помощью ИИ – находится на стыке комбинационной и исследовательской категорий. А “тест Эйнштейна” замахивается на третью. Как же до нее добраться?
Хассабис отмечает, что современные LLM живут в мире битов – знаний о мире, которые мы собрали в тексте и коде. Это отличный инструмент, который позволил сохранить огромное количество информации в ограниченном “пространстве”. И именно благодаря обилию текста и кода во многом так выстрелили нынешние LLM – их удалось экономно обучить на огромном количестве знаний.
Но здесь кроется и препятствие. Когда человек изучает физику или геометрию, то полученные из книг знания он накладывает на свое натуральное ощущение мира, полученное в начале жизни. ИИ такому ощущению не обучали – и именно поэтому даже передовые модели до сих пор косячат на сюжетах, связанных с течением времени или размерами объектов. У них нет инстинктивного понимания вещей вроде “долго”, “быстро”, “больше” и “крошечный”.
Соответственно, решение – перевести ИИ из мира битов в мир атомов. И здесь Хассабис поворачивается к визуальным ИИ – генераторам картинок и видео, а также экспериментальным моделям мира, вроде Genie 3.
Мы обычно считаем их чем-то несерьезным на фоне передовых LLM. Хассабис говорит, что зря. Он напоминает, что человеческое воображение – тоже симуляция. Мы постоянно прогоняем в голове модель мира и пытаемся представить, что будет дальше. Обычно в практических целях: что будет, если дам газа под мигающий светофор, вызвать к доске отличника или троечника и т. д. Но такой же вопрос – что будет если? – волнует ученых и творцов, когда они создают новое.
Если посмотреть на представленную на этой неделе видео-модель Seedance 2.5, то видно, что именно на это ее и тренируют: строить модель мира с пониманием физики и способностью до 30 секунд удерживать сцену как “целое”. А если нужно – то давать разные планы, не меняя облик персонажей и предметов.
И вот что интересно. Прямо сейчас в текстовых моделях прокачивают мультимодальность – умение понимать картинки и видео. А в графических – наоборот, улучшают работу с текстом. Я до сих пор под впечатлением от демонстрации нынче закрытой Sora 2, где Альтман решает на доске математическую задачу.
Прямо сейчас мы видим соревнование двух подходов: ИИ-ученый может вырасти как из текстовой модели, так и из графической. А может и музыкальной – известно, что в молодости Эйнштейн учился игре на скрипке, а уже когда занялся физикой, то отвлекался и играл Моцарта.
Хотите уже сейчас начать “растить” своего ИИ-Эйнштейна? На “Бусти” у меня есть цикл текстов про промптинг, в котором подробно рассказываю, как подтолкнуть ИИ выходить за пределы обычных ответов.
Самое время подписаться!Самое время подписаться!
#vk_feedПослушал свежий подкаст с главой Google DeepMind Демисом Хассабисом, в котором он задается вопросом – чего не достает современным ИИ для того, чтобы пройти “тест Эйнштейна”?
Про сам тест я уже писал на канале. Берем передовую LLM, обучаем ее на знаниях до 1911 года, а затем смотрим, сможет ли она сама прийти к общей теории относительности. Пока тесты указывают на то, что не сможет. Хассабис тоже так считает.
Получается, современные модели не способны в создание нового? Не совсем. Уже писал на канале про недавнее достижение экспериментальной модели OpenAI. Она решила сложную задачу Эрдёша #90, которая не давалась ученым более 80 лет, за счет того, что применила к ней знания из настолько далекой области математики, куда люди не додумались залезть.
Дело в том, что новизна не бинарна. Маргарет Боден в книге The Creative Mind делит ее на три категории:
Комбинационная – новая комбинация привычных идей. Сшить две далекие области.
Исследовательская – ты двигаешься внутри заданного “пространства правил” и находишь новое, что правилам не противоречит. Новая теорема внутри существующей математики.
Трансформационная – ты меняешь само пространство: выбрасываешь или переписываешь одно из его базовых допущений, и тогда становится мыслимым то, что раньше было невозможно.
Пример с задачей Эрдёша и еще рядом открытий, сделанных с помощью ИИ – находится на стыке комбинационной и исследовательской категорий. А “тест Эйнштейна” замахивается на третью. Как же до нее добраться?
Хассабис отмечает, что современные LLM живут в мире битов – знаний о мире, которые мы собрали в тексте и коде. Это отличный инструмент, который позволил сохранить огромное количество информации в ограниченном “пространстве”. И именно благодаря обилию текста и кода во многом так выстрелили нынешние LLM – их удалось экономно обучить на огромном количестве знаний.
Но здесь кроется и препятствие. Когда человек изучает физику или геометрию, то полученные из книг знания он накладывает на свое натуральное ощущение мира, полученное в начале жизни. ИИ такому ощущению не обучали – и именно поэтому даже передовые модели до сих пор косячат на сюжетах, связанных с течением времени или размерами объектов. У них нет инстинктивного понимания вещей вроде “долго”, “быстро”, “больше” и “крошечный”.
Соответственно, решение – перевести ИИ из мира битов в мир атомов. И здесь Хассабис поворачивается к визуальным ИИ – генераторам картинок и видео, а также экспериментальным моделям мира, вроде Genie 3.
Мы обычно считаем их чем-то несерьезным на фоне передовых LLM. Хассабис говорит, что зря. Он напоминает, что человеческое воображение – тоже симуляция. Мы постоянно прогоняем в голове модель мира и пытаемся представить, что будет дальше. Обычно в практических целях: что будет, если дам газа под мигающий светофор, вызвать к доске отличника или троечника и т. д. Но такой же вопрос – что будет если? – волнует ученых и творцов, когда они создают новое.
Если посмотреть на представленную на этой неделе видео-модель Seedance 2.5, то видно, что именно на это ее и тренируют: строить модель мира с пониманием физики и способностью до 30 секунд удерживать сцену как “целое”. А если нужно – то давать разные планы, не меняя облик персонажей и предметов.
И вот что интересно. Прямо сейчас в текстовых моделях прокачивают мультимодальность – умение понимать картинки и видео. А в графических – наоборот, улучшают работу с текстом. Я до сих пор под впечатлением от демонстрации нынче закрытой Sora 2, где Альтман решает на доске математическую задачу.
Прямо сейчас мы видим соревнование двух подходов: ИИ-ученый может вырасти как из текстовой модели, так и из графической. А может и музыкальной – известно, что в молодости Эйнштейн учился игре на скрипке, а уже когда занялся физикой, то отвлекался и играл Моцарта.
Хотите уже сейчас начать “растить” своего ИИ-Эйнштейна? На “Бусти” у меня есть цикл текстов про промптинг, в котором подробно рассказываю, как подтолкнуть ИИ выходить за пределы обычных ответов.
Самое время подписаться!Самое время подписаться!
Комментарии (0)
Пока нет комментариев. Будьте первым!