- Google объявила о своем плане использовать ИИ для написания собственного кода на недавно запущенной платформе под названием code as policies и раскрыла свои эксперименты с демонстрационными видео и сгенерированным кодом.
- Демонстрации показывают различные типы примеров роботизированных рук, приспосабливающихся к новым инструкциям, таким как перемещение блоков в квадрате, прежде чем сделать квадрат больше.
- Google сделал код доступным на GitHub,чтобы позволить сообществу экспериментировать с этой системой, и их исследователи продолжат свое тестирование для улучшения кодирования ИИ.
Google раскрыл новый подход к использованию больших языковых моделей (LLMs), которые демонстрируют, как роботы могут писать свой собственный код после получения инструкций от человека. Последние усилия Google показывают, что продвинутый ИИ может понимать открытые подсказки от людей и реагировать разумно и безопасно в физическом пространстве.
Самокодирование Google AI
Google опубликовал новое сообщение в блоге, чтобы представить программу языковой модели «Код как политика» (CAP) ее разработчиками. В сообщении блога отображаются эксперименты и интерактивные имитационные демонстрационные видеоролики роботов, а также сгенерированный код. Эксперимент включает в себя модель искусственного интеллекта (LMP), написанную на коде Python, которая может создавать новый код, когда подсказки написаны на простом английском языке. В своем блоге исследователи Google написали:
«Что, если бы при получении инструкций от людей роботы могли бы автономно писать свой собственный код для взаимодействия с миром? Оказывается, что последнее поколение языковых моделей, таких как PaLM, способно к сложным рассуждениям, а также было обучено на миллионах строк кода. Учитывая инструкции естественного языка, современные языковые модели очень хорошо умеют писать не только общий код, но, как мы обнаружили, код, который также может управлять действиями робота.»
Исследователи Google объединили большие языковые модели со своими повседневными роботами, чтобы они могли лучше реагировать на сложные запросы от людей. По их словам, CaP позволит единой системе выполнять сложные и разнообразные роботизированные задачи без специальной подготовки. Демонстрации показывают различные типы примеров роботизированных рук, приспосабливающихся к новым инструкциям, таким как перемещение блоков в квадрате, прежде чем сделать квадрат больше. CaP обобщает на определенный слой в роботе: интерпретирует инструкции естественного языка, обрабатывает результаты восприятия и обеспечивает некоторую степень обобщения благодаря предварительно обученным языковым моделям.
Некоторые ограничения
Исследователи также испытали некоторые ограничения. По их словам, текущий кодекс ограничен объемом того, что могут описывать API восприятия, и какие элементы управления являются наиболее ранними. Только некоторые примитивные параметры можно адаптировать без перенасыщения подсказок. Caps также изо всех сил пытаются интерпретировать значительно более сложные инструкции или работать на другом уровне абстракции, чем несколько примеров, предоставленных подсказкам языковой модели.
Google выпустил код на GitHub, чтобы позволить сообществу экспериментировать с этой системой, в то время как исследователи планируют узнать больше, используя CaP. Количество кодов, написанных ИИ, растет. GitHub также недавно сделал Copilot, свою технологию кодирования на основе ИИ, общедоступной для разработчиков по всему миру.