Компания Google представила новую нейросеть Genie 3, способную в реальном времени создавать интерактивные цифровые среды на основе простых текстовых или визуальных команд. Модель обеспечивает видеовывод в HD-качестве (720p, 24 кадра в секунду).
Одним из ключевых улучшений Genie 3 стала расширенная возможность запоминания. В то время как предыдущая версия — Genie 2 — могла удерживать визуальную целостность сгенерированной среды лишь на протяжении 10 секунд, Genie 3 сохраняет объекты и локации в течение нескольких минут. Это означает, что элементы сцены не «исчезают» после выхода из поля зрения, а продолжают существовать, и к ним можно вернуться.
Genie 3 позволяет изменять среду в реальном времени с помощью текстовых команд: пользователь может добавлять новые объекты, менять погоду, создавать персонажей и многое другое.
Несмотря на прогресс, модель пока не может точно воспроизводить реальные окружающие среды, а движение людей и отображение текста иногда сопровождаются неточностями.
На данный момент Genie 3 находится на этапе закрытого доступа и будет доступна лишь ограниченному числу исследователей.