«Найдосконаліша» модель Stability AI налякала мережу зображеннями людей-мутантів — зате пальці на місці

Днями Stability AI випустила свою нову модель генерації зображень Stable Diffusion 3 Medium, яку рекламувала як «найдосконалішу» — однак обмеження у навчальних даних нейромережі призвели до проблеми у відтворенні людської анатомії.

Stable Diffusion 3 Medium генерує моторошні зображення трируких, триногих чи безголових людей. Судячи з повідомлень у соцмережах, проблеми найчастіше виникають, якщо запит включає фон на траві чи у воді (але незрозуміло з чим це пов’язано).

У коментарях припускають, що видача зображень з «людьми-мутантами», пов’язана з обмеженими навчальними даними нової моделі Stability AI, оскільки компанія, ймовірно, цензурувала більшість знімків із людьми.

Британський стартап рекламував Stable Diffusion 3 Medium, як «найдосконалішу відкриту модель перетворення тексту в зображення». Вона містить 2 млрд параметрів, має забезпечувати фотореалістичні результати й усувати «типові помилки на руках і обличчі» — ймовірно, проблему з неправильною кількістю пальців таки виправили, але, як бачимо, загальна анатомія тіла вкрай погіршилась.

Наразі користувачі можуть протестувати Stable Diffusion 3 Medium через API Stability

Заснований у 2020 році стартап Stability AI був швидко визнаний одним із нових лідерів генеративного штучного інтелекту разом з такими конкурентами як Midjourney та Dall-E від OpenAI. У 2022 році інвестори оцінювали компанію в $1 млрд. Водночас вже у 2023 році Stability AI стикнулася з низкою позовів від митців, гендиректор компанії Емад Мостак пішов у відставку у березні, а компанія задумалась про продаж через готівкову кризу.