«Сбер» создал нейросеть ruDALL-E — она генерирует изображения по описанию на русском языке.
В основе нейронной сети ruDALL-E лежат три алгоритма, которые поочерёдно генерируют изображения, выбирают наиболее соответствующие описанию и увеличивают их в размере без потери качества.
В «Сбере» сообщили, что на обучение нейросети ушло 23 тысячи GPU-часов. Всего модель обработала данные из 120 миллиона пар изображение-текст.
Нейросеть ruDALL-E можно опробовать бесплатно на её сайте. На то, чтобы сгенерировать изображение по запросу уходит от двух до нескольких десятков минут в зависимости от загруженности сервиса.