Wykorzystanie generatywnej sztucznej inteligencji do tworzenia grafiki staje się coraz bardziej popularne. Mówiąc dosadniej, AI rewolucjonizuje sposób, w jaki firmy tworzą i korzystają z treści wizualnych. Technologia ta znajduje zastosowanie w różnych dziedzinach, w tym w:
Materiały graficzne generowane przez sztuczną inteligencję pozwalają firmom na stworzenie bardziej atrakcyjnych i spójnych wizualizacji, a także udoskonalenie identyfikacji wizualnej marki. Dostępne są również narzędzia pozwalające na automatyzację procesów takich jak:
Dziś jednak chcielibyśmy przyjrzeć się wielkiej trójce malarzy AI: Midjourney, Stable Diffusion, oraz DALL·E 2. Są to narzędzia, które mają bardziej wszechstronne zastosowania. Choć ich użycie do celów biznesowych wymaga nieco więcej wysiłku niż wpisanie nazwy firmy i kliknięcie przycisku ,,Generuj”, rezultaty mogą przerosnąć najśmielsze oczekiwania.
Firma Midjourney powstała jako niezależne laboratorium badawcze stworzone aby badać nowe sposoby myślenia i poszerzać ludzką wyobraźnię. Pomimo kolosalnej popularności pracuje w nim tylko 11 pełnoetatowych pracowników, którym pomaga grono doradców.
Narzędzie Midjourney stworzone przez Davida Holza nazywane jest silnikiem wyobraźni. Oparte jest na sztucznej inteligencji i umożliwia tworzenie obrazów na podstawie tekstu i wskazówek wizualnych. Na początek można wygenerować za darmo około 25 obrazów, których jakość zdecydowanie przewyższa tę oferowaną przez prostsze w użyciu narzędzia.
Aby skorzystać z możliwości Midjourney, trzeba posiadać konto na Discordzie, a po wejściu na stronę kliknąć przycisk ,,Join the Beta”. Dopiero wtedy zaczyna się zabawa. Po dołączeniu do kanału trzeba wykonać kilka kroków:
Może okazać się, że za pomocą Midjourney w kilka minut otrzymamy wymarzone:
Jeśli mamy złożony pomysł uwzględniający kompozycję lub określony styl, warto podejrzeć prompty stosowane przez bardziej doświadczonych użytkowników.
Używana obecnie wersja Stable Diffusion, 2.1., została upubliczniona w grudniu 2022. Stoi ona również za bardziej wyspecjalizowanymi aplikacjami do tworzenia obrazów, takimi jak na przykład Lensa AI – aplikacja tworząca awatary na podstawie zdjęć, wokół której narosło sporo kontrowersji związanych z pogłębianiem stereotypów społecznych, rasowych i płciowych. Niemniej jednak aplikacje wykorzystujące model stworzony przez zespół Stability AI zostały pobrane dotąd przez ponad 40 milionów osób, a liczba ta wciąż rośnie.
W odróżnieniu od Midjourney, Stable Diffusion można wypróbować korzystając bezpośrednio ze strony internetowej Stable Diffusion Online. Podstawowym minusem tego rozwiązania jest czas oczekiwania. Jeśli trafimy na godziny szczytu, trzeba wielokrotnie wpisywać w okienko prompt, zanim uda się skorzystać z generatora obrazu.
Dla bardziej wymagających użytkowników powstało DreamStudio , dostępne w wersji beta.
Dla porównania, korzystając z dokładnie tego samego prompta, który podaliśmy Midjourney, Stable Diffusion w wersji przeglądarkowej wygenerował następujące obrazy:
Zaś w Dream Studio:
W przypadku Stable Diffusion Online ważna jest nie tylko umiejętność pisania promptów, lecz również dodawanie ,,negatywnych promptów”. Powyższy prompt opatrzyliśmy zastrzeżeniem, że obraz nie powinien zawierać szerszenia, liści, kwiatów.
Warto chwilę zastanowić się nad opisaniem tego, co nie powinno znaleźć się na naszym obrazie. Szczególnie, jeśli chcemy otrzymać proste wektorowe logo przestawiające ilustrację pszczoły na białym tle otoczonej kilkoma abstrakcyjnymi liniami.
DALL·E 2 od twórców czatu GPT, to jedno z narzędzi dostępnych w ramach laboratoriów Open AI. Działa on w przeglądarce i jest dostępny pod tym linkiem.
Oprócz możliwości tworzenia obrazów na podstawie wskazówek tekstowych i wizualnych DALL·E 2 pozwala na tzw. Outpainting, czyli poszerzanie i łączenie ze sobą różnych obrazów. Dzięki temu może on być wykorzystywany do:
W ten sposób można na przykład połączyć ze sobą obrazy wygenerowane przez wszystkich trzech malarzy AI albo umieścić baner z identyfikacją wizualną firmy na wygenerowanym przez sztuczną inteligencję budynku:
Każdy z trójki wielkich grafików AI jest obdarzony innym rodzajem wyobraźni i ma swoje ograniczenia. Jednak to nic dziwnego – wystarczy przypomnieć sobie jedną z rozbudzających kreatywność gier, podczas której jedna osoba czyta opis postaci albo miejsca, a pozostałe starają się je narysować. Prawdopodobieństwo pojawienia się dwóch bardzo podobnych do siebie obrazów jest bliskie zeru!
Znając możliwości trzech narzędzi, Midjourney, Stable Diffusion oraz DALL·E 2 łatwiej będzie wybrać sposób obrazowania najbliższy wizerunkowi preferowanemu przez firmę. Warto jednak zwrócić uwagę nie tylko na pierwsze rezultaty, lecz poćwiczyć tworzenie odpowiednich promptów. Dzięki użyciu właściwych sformułowań można bowiem uzyskać rezultaty o spójnej stylistyce i bardzo wysokim poziomie wykonania.
Przeczytaj także: Muzyka i głosy AI w materiałach firmowych
Jeśli podobają Ci się treści, które tworzymy, sprawdź również: Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest,TikTok.
Autor: Marta Matylda Kania
Założycielka Superpowered by AI. Opracowuje dla biznesu procesy tworzenia treści przez generatywną sztuczną inteligencję. Interesuje się przyszłością AI w biznesie, pisze zaawansowane prompty i prowadzi szkolenia z ChataGPT dla firm.
Produktywność jest w ostatnim czasie szczególnie często poruszanym zagadnieniem. Powodem takiego stanu rzeczy jest fakt,…
Specjaliści od zarządzania zasobami ludzkimi są odpowiedzialni za szereg ważnych decyzji. Wybór odpowiedniego kandydata przyczyni…
Wraz z ukształtowaniem się nowych pokoleń, zmianom ulega również środowisko i kultura pracy. Generacja Y,…
Badania przeprowadzone przez firmę Owl Labs wskazują, że już 16% organizacji pracuje w trybie zdalnym,…
Wykorzystanie sztucznej inteligencji sprawia, że możemy komunikować się z naszymi urządzeniami używając języka naturalnego –…
“Zamknij okno!” wypowiedziane do asystenta AI będzie oznaczać co innego, gdy pracujemy w edytorze tekstu,…