Sztuczna inteligencja tworzy zaskakujące, ujmujące obrazy. Zmusza do myślenia, odpowiadając na pytania o samą siebie. Pisze zdania i akapity korzystając z dostępnych w internecie treści, bazując na wskazówkach i dodatkowych pytaniach. Tłumaczy, parafrazuje i przekształca nagrania spotkań w zgrabne notatki. Jak zatem wykorzystać w firmie ogromny potencjał tkwiący w najnowocześniejszych rozwiązaniach z dziedziny AI?
Dziś i jutro kreatywnej AI w biznesie – omówione zagadnienia:
- Wstęp
- Od tekstu do obrazu. DALL-E 2 i jego potencjalne zastosowania biznesowe
- GPT-3, Leta i pisarz przyszłości
- Podsumowanie
Wstęp
Czy tworzenie treści stanie się wyłączną domeną sztucznej inteligencji? Czy AI będzie generować multimedia na życzenie? Czy sztuczna inteligencja będzie wspierać nas w kreatywnych przedsięwzięciach pozwalając tworzyć filmy, obrazy i teksty o niespotykanej dotąd jakości? Dziś jeszcze nie znamy odpowiedzi na te pytania. W poniższym tekście chcielibyśmy jednak przyjrzeć się, w jaki sposób kreatywna AI radzi sobie z kreowaniem obrazów, tekstów i odpowiadaniem na złożone pytania. Zastanowimy się także, jakie perspektywy dla biznesu otwierają się wraz z rozwojem kreatywnej sztucznej inteligencji.
Od tekstu do obrazu. DALL-E 2 i jego potencjalne zastosowania biznesowe
Jednym z rozwiązań, które w ostatnich miesiącach rozbudzają wyobraźnię entuzjastów sztucznej inteligencji jest stworzony przez fundację OpenAI model DALL-E 2. Generuje on realistyczne obrazy na podstawie opisu w języku naturalnym. I to nie byle jakie obrazy.
Fundacja ogłosiła niedawno cenę pakietu generowanych obrazów. Po wyczerpaniu limitu darmowych 50 zapytań, trzeba będzie zapłacić 15$ za kolejnych 115. Pozwala to na wygenerowanie aż 460 różnych obrazów.
Prawdopodobnie oznacza to gwałtowną zmianę na rynku pracy concept artystów, a także osób tworzących materiały wizualne, które jeszcze nie wypracowały sobie rozpoznawalnego stylu i marki osobistej. Szczególnie, że OpenAI to niejedyna organizacja prowadząca intensywne prace nad kreatywną sztuczną inteligencją generującą obrazy. Honorowe wzmianki należą się w tym miejscu konkurencji DALL-E 2, czyli Disco Difussion oraz Imagen. A rozwiązań tego typu będzie prawdopodobnie coraz więcej.
Oznaczać to może również rewolucję w wyglądzie stron internetowych zapełnionych obecnie przez powtarzalne stockowe zdjęcia. Szczególnie, że DALL-E 2 potrafi nie tylko wygenerować jedno “zdjęcie” lub stylizowany obraz w określonym stylu, lecz również tworzyć wariacje na zadany temat. Można więc naprawdę niewielkim kosztem wygenerować ogromną ilość obrazów w dużej rozdzielczości, a następnie wybrać te, które najbardziej odpowiadają potrzebom firmy. Zamiast zatrudniać modeli i projektantów, płacić agencji multimedialnej za sesje zdjęciowe wystarczy więc – potencjalnie – nieco czasu na sprecyzowanie tego, co powinno znajdować się na zdjęciu.
Po tworzeniu obrazów na podstawie tekstu przyjdzie pora na generowanie filmów video oraz trójwymiarowych modeli na podstawie wizualnych lub tekstowych wskazówek. Już teraz trwają intensywne prace nad takimi rozwiązaniami. Przykładem może być GANverse3D stworzony przez Nvidia. Jest to narzędzie, które umożliwia tworzenie trójwymiarowych modeli na podstawie jednego obrazu, na przykład przedstawiającego smoka.
Narzędzie uczy się kształtu przedstawionego obiektu na podstawie udostępnionej mu biblioteki obrazów czy ilustracji. A następnie tworzy możliwie spójny model trójwymiarowy. Największym problemem jest modelowanie fragmentów rzadko uwiecznianych na zdjęciach. Tak więc na przykład w przypadku smoka problemem może być grzbiet czy dolna płaszczyzna brzucha. W dalszym ciągu taki model trójwymiarowy osiągnie standard produkcyjny znacznie mniejszym nakładem pracy, niż tworzony od zera przez artystę 3d. Jest to szczególnie ważna wskazówka dla tych firm, które zamierzają wejść na rynki związane z obecnością w rzeczywistości wirtualnej oraz Metaverse.
GPT-3, Leta i pisarz przyszłości
Aktywności związane z pisaniem to jedna z najszybciej rozwijających się gałęzi kreatywnej sztucznej inteligencji. O ile automatyczne generowanie unikalnych opisów podobnych do siebie produktów i parafrazowanie paragrafów przeznaczonych do publikacji w mediach społecznościowych nie wydaje się już niczym niezwykłym, możliwości AI sięgają o wiele dalej. A jesteśmy dopiero na początku tej kreatywnej drogi. Kolejny ważny aspekt kreatywnej AI, o którym chcielibyśmy dzisiaj wspomnieć to przyszłość sztucznej inteligencji posługującej się językiem naturalnym, w tym wirtualnych asystentów.
W kwietniu 2022 The New York Times napisał, że sztuczna inteligencja jest już w stanie tworzyć oryginalne wypowiedzi prozą, które są nieodróżnialne od tekstów tworzonych przez człowieka. Stwierdzenie to dotyczyło właśnie modelu GPT-3. Jest to obecnie jedno z najciekawszych rozwiązań pozwalających przekształcać duże ilości danych przetwarzanych przez sztuczną inteligencję w zrozumiałe dla człowieka wypowiedzi. Generative Pre-trained Transformer 3, bo tak rozwija się skrót GPT-3, to model językowy wykorzystujący uczenie głębokie (Deep Learning) do używania języka, w tym do udzielania odpowiedzi na pytania.
Jednym z najciekawszych sposobów prezentacji działania GPT-3 jest seria wideo, w których dr Alan D. Thompson rozmawia z awatarem o imieniu Leta. Leta w zaskakujący i kreatywny sposób odpowiada na pytania – zarówno te dotyczące wiedzy o świecie, jak i o nią samą. Wydaje się, że nic nie stoi na przeszkodzie, by podobnie wytrenowany model rozmawiał z klientami na temat wszystkich aspektów produktów czy usług oferowanych przez daną firmę.
Komercyjne zastosowania GPT-3 koncentrują się jednak raczej wokół tworzenia contentu. Wśród dostępnych już dzisiaj narzędzi zdolnych do pisania oryginalnych tekstów wymienić można między innymi:
- Jasper
- Word AI
- Copysmith
- Writesonic
- Copy.ai
Piszą one oryginalne teksty na bazie wskazówek, na przykład zdefiniowanych nagłówków, i optymalizują je zgodnie z wymaganiami wyszukiwarek.
Model GPT-3 wykorzystywany jest już również do obsługi czatbotów i voicebotów, a nawet do generowania pomysłów biznesowych. Jest także używany do tworzenia podręczników użytkownika dotyczących oprogramowania, a nawet jako narzędzie umożliwiające tworzenie aplikacji bez konieczności programowania, potrafi bowiem przetłumaczyć wypowiedź w języku naturalnym na przykład na język SQL.
Jedną ze zdolności, które mogą być szczególnie cenne dla biznesu jest również umiejętność podsumowywania tekstu – w tym nagranych dialogów przekształconych w tekst. Narzędzie bazujące na GPT-3 jest bowiem w stanie stworzyć w mgnieniu oka notatkę podsumowującą meeting, a także w razie potrzeby przetłumaczyć je na ojczysty język każdego z uczestników spotkania.
Podsumowanie
Jeśli do sztucznej inteligencji tworzącej obrazy, modele trójwymiarowe, filmy, odpowiadającej kreatywnie na pytania, podsumowującej spotkania i piszącej teksty dodamy jeszcze zdolności tworzenia muzyki… Tak jak na przykład ma to miejsce w projekcie Jukebox – okazuje się, że twórcza działalność sztucznej inteligencji pokrywa większość obszarów najbardziej poszukiwanego contentu.
Na szczęście dla twórców, na razie komercyjnie dostępna kreatywna AI to raczej narzędzia pozwalające generować pomysły i szkice, jednak wciąż wymagające sporego wkładu człowieka. Niemniej jednak w ostatnim czasie skokowy, a chciałoby się powiedzieć – lawinowy rozwój sztucznej inteligencji każe poważnie zastanowić się nad przyszłością biznesu związanego bezpośrednio z tworzeniem i wykorzystaniem cyfrowych treści.
Z jednej strony AI oznacza bowiem znaczącą redukcję kosztów produkcji unikatowego contentu, z drugiej zaś, konieczność zatrudnienia wyżej wykwalifikowanych pracowników, którzy będą w stanie posługiwać się narzędziami wspieranymi przez sztuczną inteligencję i dokończyć po niej pracę, czyli dopracować materiały tak, by spełniały oczekiwania firmy i coraz bardziej wymagających klientów.
Sprawdź również: Multimodalna AI i jej zastosowania w biznesie
Jeśli podobają Ci się treści, które tworzymy, sprawdź również: Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest.

Autor: Robert Wilczycki
Ekspert i wykładowca JavaScript, który zajmuje się szkoleniem działów IT. Jego głównym celem jest zwiększanie produktywności zespołów poprzez uczenie innych efektywnej współpracy.
AI w biznesie:
- Sztuczna inteligencja w biznesie. Wprowadzenie
- AI w biznesie: zagrożenia i szanse cz.1
- AI w biznesie: zagrożenia i szanse cz.2
- Zastosowania AI w biznesie. Przegląd
- Co to jest NLP, czyli przetwarzanie języka naturalnego w biznesie
- Automatyczne przetwarzanie dokumentów
- AI i media społecznościowe – co o nas mówią?
- Automatyczny tłumacz. Inteligentna lokalizacja produktów cyfrowych
- Czatboty tekstowe wspomagane przez AI
- O działaniu i biznesowych zastosowaniach voicebotów
- Wirtualny asystent, czyli jak rozmawiać z AI?
- Dziś i jutro biznesowego NLP
- Jak sztuczna inteligencja może pomóc w BPM?
- Czy sztuczna inteligencja zastąpi analityków biznesowych?
- Rola AI w podejmowaniu decyzji biznesowych
- Czym jest Business Intelligence?
- Planowanie wpisów w mediach społecznościowych. W czym może pomóc AI?
- Automatyczne wpisy w mediach społecznościowych? Co może dzisiejsza AI
- Sztuczna inteligencja w zarządzaniu contentem
- Dziś i jutro kreatywnej AI w biznesie
- Multimodalna AI i jej zastosowania w biznesie
- Nowe interakcje. Jak AI zmienia sposób obsługi urządzeń?
- Jak to wszystko połączyć? RPA i API w cyfrowej firmie
- Nowe produkty i usługi oparte o działanie sztucznej inteligencji
- Przyszłość pracy i zawody przyszłości
- Zielona AI i AI dla Ziemi. Odpowiedzialność ekologiczna sztucznej inteligencji i tworzenie zielonych rozwiązań
- EdTech. Sztuczna inteligencja w edukacji
- Narzędzia AI dla managera