Midjourney – generator obrazów AI bez tajemnic… i tabu. Przewodnik krok po kroku
Hasło: sztuczna inteligencja odmieniane jest ostatnimi czasy przez wszystkie przypadki. Midjourney jest jedną z jej form, która pozwala na generowanie obrazów na podstawie opisu tekstowego. Jak działa? Czy jest dostępna za darmo? I dlaczego wywołuje tyle kontrowersji?
Przed Wami krótki przewodnik po Midjourney – generatorze obrazów, któremu zawdzięczamy wiralowe zdjęcia papieża Franciszka w stylowej, śnieżnobiałej kurtce oraz dramatyczne fotografie ukazujące aresztowanie Donalda Trumpa. Skąd ten pomysł i do czego zmierza?
Co to jest Midjourney?
Midjourney to niezwykle popularny ostatnimi czasy generator obrazów, bazujący na sztucznej inteligencji. Na podstawie komunikatu tekstowego, wprowadzanego przez użytkownika (tzw. promptu) tworzy on wizualizacje, które oddają rzeczywistość bądź wręcz przeciwnie – stanowią jej fantazyjną, niekiedy wręcz surrealistyczną wizję.
Liczba wariacji dostarczanych przez Midjourney jest w zasadzie nieograniczona. Wykorzystane w nim algorytmy uczenia maszynowego przeanalizowały miliony, jeśli nie miliardy grafik z całego Internetu (co do legalności ich pozyskania wypowiemy się szerzej w poniższym fragmencie artykułu), z pomocą których osiągają niepowtarzalne efekty swojej pracy.
Aby skorzystać z generatora obrazów, należy stworzyć konto i zalogować się na Discordzie, gdzie znajdziecie przeznaczony temu celowi serwer. Na tę chwilę nie ma oddzielnej witryny ani aplikacji stworzonej z myślą o Midjourney.
Midjourney – jak używać?
Jak korzystać z Midjourney? Mechanizm funkcjonowania jest dość intuicyjny, a jego pierwszym krokiem jest sformułowanie komunikatu tekstowego – tzw. promptu – będącego mniej lub bardziej syntetycznym opisem obrazu, który chcemy wygenerować. Ten poprzedza odpowiednia komenda, najczęściej: /imagine lub /blend.
Po wpisaniu tej pierwszej na ekranie pojawia się okno tekstowe, przeznaczone na opis obrazu. Aby uzyskać najbardziej satysfakcjonujące efekty, warto pamiętać, aby:
- posługiwać się językiem angielskim,
- używać prostych zwrotów,
- zawrzeć w opisie istotne szczegóły, takie jak perspektywa, oświetlenie, kolorystyka czy stylistyka.
Postępy pracy Midjourney możecie obserwować w czasie rzeczywistym. Czas potrzebny na wygenerowanie obrazów może wynieść od około minuty aż do kilkunastu minut. Każdorazowo zależy to od poziomu skomplikowania danego projektu, stopnia obciążenia serwerów oraz wykupionego pakietu (o czym więcej poniżej).
Ostatecznie na Waszym ekranie pojawią się cztery wizualizacje tego samego opisu – mniej lub bardziej do siebie zbliżone – które możecie następnie edytować (button “U” z odpowiednią, przypisaną do danej grafiki cyfrą) lub wystosować żądanie stworzenia wybranego obrazu od nowa (button “V”).
Druga z komend – /blend – pozwala na połączenie dwóch, wybranych przez siebie obrazów (znajdujących się w galerii lub na dysku), a tym samym dowolne kształtowanie materiału wyjściowego, którym “karmimy” SI. W przypadku tej metody jakość końcowego efektu niejednokrotnie pozostawia wciąż jednak wiele do życzenia i wymaga dużych nakładów pracy ze strony użytkownika.
Midjourney – cena
Czy Midjourney jest darmowy? – Jeszcze do niedawna był. Zmieniło się to jednak po fali deepfake’ów z jego udziałem, które obiegły świat i zmyliły niejednego obserwatora życia publicznego (wspomniany przypadek papieża Franciszka czy aresztowanie Trumpa).
Obecnie dostęp do Midjourney możecie uzyskać w ramach trzech różnych pakietów, które różnią się między sobą poziomem szybkości, z jaką generowane są obrazy, limitem grafik możliwych do wygenerowania w ciągu miesiąca oraz równolegle – w trybie szybkim. Kluczowe różnice między nimi prezentują się następująco:
Plan Basic
- Cena: 10 $ miesięcznie / 96 $ rocznie + podatek
- Liczba grafik możliwych do wygenerowania w ciągu miesiąca: ok. 200
- Liczba grafik możliwych do równoległego generowania w trybie szybkim: 3
Plan Standard
- Cena: 30 $ miesięcznie / 288 $ rocznie + podatek
- Liczba grafik możliwych do wygenerowania w ciągu miesiąca: brak ograniczeń
- Liczba grafik możliwych do wygenerowania w ciągu miesiąca w trybie szybkim: ok. 900
- Liczba grafik możliwych do równoległego generowania w trybie szybkim: 3
Plan Pro
- Cena: 60 $ miesięcznie / 576 $ rocznie + podatek
- Liczba grafik możliwych do wygenerowania w ciągu miesiąca: brak ograniczeń
- Liczba grafik możliwych do wygenerowania w ciągu miesiąca w trybie szybkim: ok. 1800
- Liczba grafik możliwych do równoległego generowania w trybie szybkim: 12
- Opcja generowania obrazów “po cichu” – w przypadku pozostałych planów wygenerowane obrazy są dostępne publicznie
W odniesieniu do każdego z powyższych planów istnieje możliwość dokupienia dodatkowych kredytów w cenie 4 $ za około 60 wygenerowanych obrazów.
Midjourney – kontrowersje
Fascynacja Midjourney jest równie silna, co związane z nim wątpliwości. Zagrożeń bowiem nie brakuje i to na wielu poziomach – począwszy od kwestii ochrony praw autorskich (i samych autorów, którzy podjęli już swego czasu walkę z SI), przez likwidację stanowisk pracy, na ryzyku dezinformacji skończywszy.
Skala tej ostatniej była dostrzegalna jeszcze przed tym, jak kolejne generatory AI znalazły się na ustach całego świata. Niespokojne czasy, w jakich przyszło nam żyć, wzniosły zaś związane z nią ryzyka na nieporównywalnie wyższy poziom.
Obraz papieża Franciszka w stylizacji godnej blogera modowego czy emocjonalnego aresztowania byłego prezydenta Stanów Zjednoczonych to zaledwie dwa przykłady deepfake’ów, które obiegły świat. Oddając do rąk milionów narzędzie o takich możliwościach, trzeba zaś liczyć się z tym, że korzystają z niego ludzie o najróżniejszych intencjach.
Nie mniej problematyczny jest legalny aspekt funkcjonowania Midjourney, który zahacza o kwestie, takie jak ochrona prawa autorskiego i innych praw własności intelektualnej oraz konsekwencje wykorzystywania obrazów generowanych przez AI dla celów osobistych i komercyjnych. Więcej o tym poniżej.
Midjourney a prawo. Czy można legalnie używać?
Z punktu widzenia prawa problem z Midjourney zaczyna się u jego fundamentów. Założyciel generatora nie kryje, że, tworząc jego bazę danych, nie zwrócił się do podmiotów, którym przysługuje prawo autorskie do wykorzystanych utworów o udzielenie licencji. W jego ocenie powód jest prosty: dotarcie do twórców, których dzieła wykorzystano na tak szeroką skalę jest po prostu nieosiągalne (za Forbes). W konsekwencji Midjourney korzysta nielegalnie z utworów, co do których autorzy nie wyrazili zgody na utrwalanie i zwielokrotnianie swoich dzieł. A to właśnie na ich podstawie generowane są kolejne obrazy…
Niewykluczone, że w związku z tak mało finezyjnym doborem treści do bazy danych, znajdą się w niej również elementy podlegające ochronie na innej podstawie (np. kwestia zezwolenia na rozpowszechnianie wizerunku, ochrona znaków towarowych lub wzorów przemysłowych). My zaś, korzystając z wygenerowanych przez AI obrazów – nawet nieświadomie – naruszymy cudze prawo i narazimy się z tego tytułu na odpowiedzialność cywilną, a nawet karną. O ile więc korzystanie z Midjourney do domowego użytku budzi wątpliwości, o tyle w celach komercyjnych wiąże się już ze znacznym ryzykiem.
Trudno też oczekiwać, że generując jakiś obraz z pomocą Midjourney, uzyska się do niego prawa wyłączne. Wymagałoby to wkładu twórczego, który w znaczący sposób ukierunkowałby działanie AI, np. za pomocą obszernego promptu i następczych edycji. Zdecydowanie nie byłoby to jednak najłatwiejsze zadanie i należałoby raczej do rzadko spotykanych przypadków.
Źródło: Midjourney, Forbes, twitter.com/singareddynm, twitter.com/WorldOfWeirdAI
Komentarze
1Co więcej, model można poduczyć zgodnie ze swoimi specyficznymi potrzebami (np. aby generować assety do konkretnej gry, albo projekty ubrań czy innych przedmiotów). Hasło: LoRA.