Google представив Штучний Інтелект, який створює віртуальні світи.

Google DeepMind представили оновлену версію своєї ШІ-моделі світу під назвою Genie 3.

Ця система вміє в реальному часі створювати тривимірні інтерактивні світи, в яких можна вільно переміщатися.

Головна відмінність від попередніх версій штучного інтелекту від Google — найдовша сесія роботи. Тепер світи існують не десятки секунд, а кілька хвилин. І при цьому можуть запам’ятовувати візуальні деталі, навіть якщо ви відвертаєтесь.

Google DeepMind, інструмент штучного інтелекту

Наприклад: «напис на дошці або пляма на стіні залишиться на тому ж місці, коли ви подивитеся на нього знову.»

Так звані «моделі світу» — це особливий клас штучного інтетелекту, який створює симульовані оточення для навчання, ігор або тренування інших нейромереж та роботів.

По суті, ви даєте моделі текстовий запит, і вона генерує простір, схожий на гру, але зроблений не вручну, а повністю штучним інтелектом.

У грудні минулого року було представлено Genie 2, здатну перетворювати зображення на інтерактивні світи. А над новою системою працює команда, очолювана екс-розробником Sora – генератора відео від OpenAI.

Світи в Genie 3 працюють з роздільною здатністю 720p за 24 кадри на секунду. А також здатні зберігати у візуальній пам’яті деталі приблизно протягом хвилини та підтримують динамічні зміни.

Наприклад: «можна змінити погоду чи додати персонажів через промт».

Проте, модель поки що доступна лише обмеженій кількості дослідників, як частина закритого тесту. Google підкреслює, що хоче спочатку проаналізувати ризики та обмеження, перш ніж відкривати її широкій публіці.

Серед недоліків, на даному етапі текст у сценах відображається коректно тільки, якщо був явно вказаний у запиті, а самі світи, як і раніше, не дають повної свободи дій.

https://youtu.be/PDKhUknuQDg

 

Добавить комментарий

Цікаві статті