OpenAI konsekwentnie rozwija narzędzia bazujące na sztucznej inteligencji. Efekty prac potrafią zaskoczyć. Co powiecie na surrealistycznego słonia, który wygląda realistycznie? Ten fascynujący klip wygląda niepokojąco.
OpenAI oprócz Chat GPT ma innego asa w rękawie. Jest nim Sora, czyli model zamiany tekstu na wideo, który ma pomóc w generowaniu realistycznych filmów trwających maksymalnie 60 sekund. To zadanie znacznie bardziej złożone od “zwykłego” generowania obrazów; model uwzględnia ruch, szczegóły obiektów oraz tło. Jak to wszystko wygląda w praktyce?
Sora w akcji
Chociaż model nie jest jeszcze publicznie dostępny, to w sieci bez problemów znajdziemy nagrania wygenerowane przez Sora. Oto jedno z nich - poznajcie słonia z liści w naturalnym środowisku.
Wykorzystany prompt brzmi “an elephant made of leaves running in the jungle” i tyle wystarczyło, by model Sora wygenerował dość ciekawe nagranie. Na szczególną uwagę zasługuje zachowanie liści, które reagują na ruchy zwierzęcia, być może nawet na wiatr.
Kiedy Sora trafi do użytkowników?
Pojawia się więc pytanie: kiedy Sora zostanie udostępniona publicznie? Otóż Mira Murati - dyrektorka techniczna OpenAI - potwierdza w rozmowie z Wall Street Journal, że pełnoprawna premiera nastąpi jeszcze w tym roku w perspektywie kilku nadchodzących miesięcy. I w tym miejscu przechodzimy do kolejnego tematu: jaka będzie cena Sora?
Z jednej strony Mira Murati podkreśla, że działanie Sora jest droższe od np. DALL-E, niemniej narzędzie ma być dostępne w podobnych cenach. Pozostaje więc uzbroić się w cierpliwość i czekać na doniesienia z obozu OpenAI.
Źródło: OpenAI
Komentarze
3