Від слів до зображення: у чому фішка генеративних графічних систем нового покоління

Рубіж 2022-го і 2023 року для техногігантів масового ринку виглядає досить тьмяно і викликає побоювання, що розвиток компаній, особливо заснованих на рекламній моделі, зайшов у глухий кут. Але в цьому темному царстві песимізму є нехай невелика, але світла пляма, вважає СЕО найбільшого казино онлайн Україна. За неї треба дякувати розвитку продуктів на основі штучного інтелекту – генеративних графічних систем нового покоління.

Загальна картина для технологічного сектора оцінюється всіма світовими експертами як сумна.

Проблема не в тому, що технологічні гіганти перестали бути прибутковими – з прибутками у них усе, як і раніше, дуже і дуже непогано. Але любили (і цінували на біржі) ці компанії насамперед за зростання, яке здавалося нестримним, і часи пандемії надали цій любові нового відтінку. Коли все традиційне і стійке гальмувало і розвалювалося, техногіганти як ні в чому не бувало продовжували нестримно зростати, а деякі навіть прискорювалися всім локдаунам на зло. Виникла ілюзія їхньої повної невразливості, небаченої стійкості до економічних криз. І ось ця ілюзія розсипалася: зростання техногігантів у 2022 році сповільнювалося, а іноді навіть ставало дещо від’ємним (і йдеться не тільки про капіталізацію, а й про основні бізнес-метрики).

На цьому сумному тлі дуже цікавим і контрастним виглядав розвиток тренду, який виразно сформувався раніше 2022 року: поширення систем text-to-art, генераторів високоякісної графіки за словесними описами та, за бажання, за простенькими кострубатими ескізами. Ось, наприклад, Microsoft уперше за довгий час замість нарощування свого штату проводить нехай не дуже великі, але скорочення. І водночас оголошує про подальші інвестиції в OpenAI поверх того мільярда, який він у 2019 році туди вклав. Інвестиції можуть становити до $10 млрд, а оцінка молодої компанії вже наближається до $29 млрд. Генеративні можливості її знаменитої системи DALL-E 2, як оголошено, стануть використовуватися в новітньому застосунку для створення ілюстрацій Microsoft Designer і в браузері Edge.

ЧИТАЙТЕ ТАКОЖ: БК 1win лучшие казино на рынке в Украине

Інший приклад, ще більш показовий: на тлі зниження інвестиційної активності в технологічні компанії молоденька британська компанія лише з сотнею співробітників Stability.ai отримала понад $100 млн інвестицій за оцінкою, яка одразу робить її “єдинорогом” (у 2022 році це був рідкісний звір). Ця компанія розробила open-source-систему генерації високоякісних і гнучко керованих зображень Stable Diffusion, яка за кілька місяців здобула величезну популярність (і спричинила запеклі суперечки) у спільнотах художників та ілюстраторів.

Події, а також ділова і призначена для користувача активність навколо нових генеративних систем виглядають особливо привабливо на тлі складнощів іншої гарячої теми і модного слова року, що минає, – метавсесвіту. Хоча і особисто Цукерберг, і численні журналісти та піарники, і стовпи ігрової індустрії, і криптоентузіасти всіляко розкручували цю тему, жодної призначеної для користувача популярності віртуальні світи, що представляють майбутнє метавсесвіту, поки що не здобули. Незважаючи на мільярдні вкладення, улюблене метавсесвітнє дітище Цукерберга Horizon Worlds не в змозі утримати ані користувачів, ані навіть співробітників компанії за всієї їхньої лояльності. Утім, довгострокові надії на метавсесвіт цілком живі, і в 2023 році буде цікаво спостерігати за прогресом у цій галузі. Але історією успіху у 2022 році метавсесвіт точно не став.

Масові продукти, що ґрунтуються на машинному навчанні та забезпечують генерацію нового візуального, а не вербального контенту, – це лише один бік новацій 2022 року. Другий – це не настільки помітний, але від цього не менш серйозний прогрес у машинному зорі та масовості використання графічних образів як вхідного сигналу, а не результату роботи систем штучного інтелекту. Звичайно, у мобільних застосунках найбільших пошукових систем введення зображення з камери смартфона або з галереї зображень – давно звична частина інтерфейсу. Але невипадково саме восени 2022 року відбулася дуже рідкісна подія: зміна на гранично лаконічній стартовій сторінці Google, де в пошуковий рядок додалася іконка пошуку за зображеннями.

ЧИТАЙТЕ ТАКОЖ: Що потрібно знати перед покупкою посівного матеріалу соняшника?

Можна сказати, що саме 2022 рік продемонстрував у масових сервісах, наскільки добре люди навчили машини не лише читати й розуміти тексти, а й бачити навколишній світ – і відповідати на запити візуальним, а не виключно словесним контентом. Для подальшої співпраці людей і машин це важлива віха: наші дуже далекі пращури покладалися на зір за часів, коли ще не існувало жодних мов, і досі багатство світу довкола ми значною мірою сприймаємо візуально. А мати помічником і співавтором сліпого не завжди зручно й ефективно.

Тепер працювати з машинно навченими цифровими колегами (або інструментами, якщо комусь так легше сприймати те, що відбувається) стане комфортніше і плідніше. Якщо ж поглянути зі споживчого погляду глядача, а не автора або бізнесмена, то можна впевнено очікувати у 2023 році не тільки достаток і красу плоских згенерованих алгоритмами картинок, а й появу виразних генеративних відео і 3D-сюжетів у віртуальних світах – буде на що помилуватися.