Internet

Wymyśliłem film, a Sora AI go zrobiła. Cóż, kariera w Hollywood musi poczekać…

przeczytasz w 3 min.

Strzeżcie się, twórcy hollywoodzkich blockbusterów za setki milionów dolarów. Właśnie zainwestowałem 100 zł, odpaliłem Sorę i… A dobra, już nieważne.

Sora to hucznie zapowiadany generator filmów, stworzony przez OpenAI. Twórcy ChataGPT udostępnili ją pod koniec ubiegłego roku, ale mieszkańcy Europy musieli poczekać kilka tygodni dłużej. 

Chciałbym napisać, że warto było czekać. Ale chcieć to sobie mogę. 

Sora w akcji. Jakość generowanych przez AI filmów jest… dyskusyjna

Sora działa na zasadzie podobnej do generatorów obrazów. Wystarczy słownie opisać, co ma się znaleźć na filmie, a sztuczna inteligencja wygeneruje wideo o wybranej długości, rozdzielczości i proporcjach. Ja ograniczyłem się do 10-sekundowych filmów 480p w klasycznych 16:9. 

W ramach rozgrzewki zacząłem od najprostszego przykładu jaki przyszedł mi do głowy. 

"Kobieta kroi pomidory na blacie wypełnionym warzywami. Zbliżenie na dłonie, widok z góry, delikatny ruch kamery": 

Nie spodziewałem się, że AI twórców ChataGPT polegnie już na takiej błahostce. Ale dałem drugą szansę i zmodyfikowałem prompt precyzując, że chodzi o krojenie pomidora w plasterki. Niestety efekt wcale nie uległ poprawie. 

Gdybym jednak potrzebował prostego ujęcia z kuchni, po prostu pobrałbym wideo z jakiegoś darmowego stocka. W założeniu Sora ma pomóc w realizacji bardziej skomplikowanych projektów, prawda? No to spróbujmy. 

"Mężczyzna w pomarańczowej koszulce z białym napisem BENCHMARK siedzi pod drzewem. Na drzewie zamiast liści rosną smartfony. Humanoidalny robot podchodzi do drzewa, zrywa jeden smartfon i podaje mężczyźnie. W tle widać ubogą średniowieczną osadę. Powolny ruch kamery": 

Zaczęło się nieźle, ale skończyło się na typowym AI. Ale OK, może wymagam zbyt wiele, więc uprośćmy polecenie. Przy okazji od razu poprosiłem o wygenerowanie dwóch filmów. 

"Mężczyzna w pomarańczowej koszulce z białym napisem benchmark.pl siedzi pod drzewem, na którym zamiast liści rosną smartfony. Powolne zbliżenie na zamyśloną twarz. W oddali widać średniowieczną osadę": 

Wciąż nie jest idealnie, ale pierwszego klipu od biedy dałoby się użyć w jakimś projekcie. 

Dobra, pora odpiąć wrotki. 

"Skrzyżowanie w Nowym Jorku. Tłumy ludzi spacerujących i zapatrzonych w swoje smartfony. Z nieba błyskawicznie zlatuje superbohater ubrany w pomarańczowy kostium z białym napisem benchmark.pl na klatce piersiowej. Uderzenie superbohatera w ziemię sprawia, że budynki w tle się zawalają": 

Cóż, Marvel może jeszcze czuć się bezpiecznie. 

A co z innymi stylami graficznymi? 

"Styl kreskówki Disneya z lat 30. XX wieku. Humanoidalna żyrafa z zabawnym wyrazem twarzy biegnie za odjeżdżającym pociągiem, ale w ostatniej chwili przewraca się o skórkę od banana. Ludzie na peronie wytykają żyrafę palcami i pękają ze śmiechu": 

Widzę tu przebłyski inteligencji, bo styl graficzny mi się podoba. Niestety animacja nie ma żadnego sensu, a wykorzystanie sztucznej inteligencji jest bardziej niż oczywiste. 

Z ożywianiem zdjęć Sora również radzi sobie średnio

Alternatywną funkcją Sory jest przerabianie zdjęć na filmy. No to załóżmy, że zrobiłem sobie fotkę na MWC 2025, ale chciałbym jej użyć w wideo. 

Sztuczna inteligencja zrobiła dziwne rzeczy z moją twarzą, ale zadziwiająco dobrze ogarnęła tło. Z tego 10-sekundowego klipu przy odrobinie chęci dałoby się wyciąć krótki fragment i użyć go jako przebitki, a może nawet nikt by się nie zorientował, że to AI. 

Kolejny przykład. Tym razem zdjęcie wzbogacone o prompt "wyścigi uliczne, samochody jadące z zawrotną prędkością": 

Cała sekwencja jest pozbawiona sensu, bo w pewnym momencie samochód zmienia swój wygląd, gdyż powody. Gdy już jednak zaczyna się właściwy wyścig, efekt staje się używalny. 

Sora to na razie loteria. Droga loteria

Aby skorzystać z Sory konieczne jest wykupienie płatnego planu, a więc minimum ChatGPT Plus za ok. 100 zł miesięcznie. W ramach abonamentu użytkownik otrzymuje 1000 kredytów, których zużycie uzależnione jest od jakości, długości i proporcji filmu. 

 5 sekund10 sekund15 sekund20 sekund
480p kwadrat20 kredytów40 kredytów60 kredytów80 kredytów
480p25 kredytów50 kredytów100 kredytów150 kredytów
720p kwadrat30 kredytów75 kredytów150 kredytów225 kredytów
720p60 kredytów180 kredytów360 kredytów540 kredytów
1080p kwadrat100 kredytów300 kredytów650 kredytów1000 kredytów
1080p200 kredytów600 kredytów1300 kredytów2000 kredytów

W najlepszym razie za te 100 zł można wygenerować 50 klipów. Nie ma jednak gwarancji, że wszystkie będą nadawać się do użytku, bo dobre filmy pochłaniają tyle samo kredytów, co te kompletnie zmasakrowane. A - jak widać - Sorze zdarza się generować pozbawiony składu szum. 

Niestety aktualna skuteczność Sory w połączeniu z takim modelem sprzedaży sprawia, że realne koszty usługi są ciężkie do oszacowania. Gdyby dziś przełożony polecił mi wygenerowanie 30-sekundowego spotu promocyjnego, nie umiałbym wskazać nawet przybliżonych kosztów. Może wystarczyłoby mi 1000 kredytów, a może i po włożeniu 10 000 zostałbym z niczym. Loteria. 

Pamiętając jaką drogę przeszły generatory obrazów wierzę, że i Sora któregoś dnia sprawi, że firany pospadają mi w domu z wrażenia. Ale to jeszcze nie ten moment.

Komentarze

1
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Kenjiro
    0
    Poproszę o skończenie zdania:
    "Cała sekwencja jest pozbawiona sensu, bo w pewnym momencie samochód zmienia swój wygląd, gdyż powody."

    Witaj!

    Niedługo wyłaczymy stare logowanie.
    Logowanie będzie możliwe tylko przez 1Login.

    Połącz konto już teraz.

    Zaloguj przez 1Login