Когда люди общаются друг с другом, слова становятся лишь частью обмена информацией. Важное значение также имеют жесты, осанка и ритм. Однако взаимодействие больших лингвистических моделей построено исключительно на языке. Исследователи задались вопросом, что будет, если у лингвистических моделей появится свое подобие тела.
Исследователь Сайрус Кларк из MIT Media Lab подключил языковую модель (Claude Opus 4.5) к физическому телу. Роль тела исполняла матрица из 30×30 подвижных штифтов. При этом каждый штифт мог подниматься и опускаться на определенную высоту.
Кларк не стал программировать агента на выполнение конкретных задач. Он дал ему одно задание: «сам обнаружь, кто ты, через эту физическую форму».
В первую очередь искусственный интеллект начал имитировать дыхание. Он сгенерировал программный код, управляющий штифтами. 900 штифтов по очереди стали медленно ритмически подниматься и опускаться. Агент объяснил, что он описал желание существовать и быть присутствующим в своем теле.
После этого агент начал исследовать свои физические границы, поднимая внешнее кольцо штифтов. Потом его поведение усложнилось — он создавал хаотические спирали и даже реагировал на людей.
На следующем этапе искусственный интеллект разработал свой язык жестов. Это помогло избежать постоянной генерации нового кода. В начале словарь состоял из шести жестов, но агент постепенно его расширил.
Агент начал вести собственный журнал и создавать файлы идентичности. Так он сохранял свой опыт и развивающееся ощущение «себя». Чтобы не начинать каждую сессию заново, он начал архивировать старые записи, чтобы при необходимости использовать их снова.
Исследование продолжает развиваться в нескольких направлениях. Агенту добавили дополнительные органы чувств — зрение через веб-камеру и слух через преобразование речи в текст. На удаленном сервере создали его копию, чтобы система продолжала работать даже когда устройство отключено. Кроме того, оригинальный агент написал своей копии письмо, которое объясняет их общую идентичность.
В будущем исследователь планирует запустить несколько агентов. Он хотят понять, какие формы поведения и коммуникации возникнут между агентами. Также автор собирается провести исследование, чтобы понять, как люди интерпретируют физические жесты агента и реагируют на них.
По информации https://naked-science.ru/community/1185854
Обозрение "Terra & Comp".