Internet

ChatGPT z dużym ulepszeniem. "Nowy poziom swobody twórczej"

przeczytasz w 1 min.

OpenAI uruchomiło funkcję generowania obrazów w modelu GPT-4o. ChatGPT ma radzić sobie z tworzeniem grafik lepiej niż kiedykolwiek wcześniej.

ChatGPT otrzymał funkcję tworzenia obrazów bazującej na dużym modelu językowym GPT-4o, który dotychczas odpowiadał za generowanie tekstu i kodu. Nowy model zastępuje rozwijaną od lat technologię DALL-E. 

W chwili publikacji tego artykułu nowa funkcja ChatGPT jest dostępna dla wszystkich użytkowników płatnych planów Plus, Pro oraz Team. Firma OpenAI poinformowała jednocześnie, że proces wdrażania nowego modelu w darmowym planie także już się rozpoczął. 

Z nowego modelu można korzystać za pośrednictwem chatbota ChatGPT oraz usługi Sora

ChatGPT 4o - nowa jakość generowania obrazów

Twórcy chwalą się, że GPT-4o - w odróżnieniu od wcześniejszego modelu DALL-E 3 - został wytrenowany tak, by precyzyjnie odwzorowywać tekst w grafikach, co ma umożliwić tworzenie menu, zaproszeń czy infografik. Model ma także wierniej realizować złożone polecenia, zachowując wysoką dokładność nawet w przypadku szczegółowych kompozycji. Umożliwia także kontynuację pracy na bazie wcześniejszych obrazów i tekstów, w tym edycję własnych zdjęć za pomocą słownych opisów. Obsługuje różne style artystyczne – od fotorealizmu po ilustracje stylizowane.

OpenAI nie ukrywa, że - z uwagi na poziom technologicznego zaawansowania - GPT-4o generuje grafiki znacznie wolniej niż DALL-E, ale aspekt ten ma zostać w przyszłości dopracowany. 

Jako że nowy model AI znacznie ułatwia tworzenie tzw. fake’ów, wszystkie obrazy generowane przez GPT-4o zawierają metadane C2PA, co ma pozwolić na weryfikację ich pochodzenia. OpenAI wprowadziło również zabezpieczenia przed generowaniem szkodliwych treści. 

Szef OpenAI, Sam Altman, określił wprowadzenie tej funkcji jako "nowy poziom swobody twórczej". 

Komentarze

6
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Abgan
    1
    Ciekawe, że puszczacie dziś artykuł o dodatku do ChatGPT-4o, a o Gemini 2.5 pro jest cisza.

    Jasne, ChatGPT-4o potrafi teraz robić obrazki, to wielki news! Multimodalne Gemini 2.5 pro, robiące obrazki, kod, audio i z rekordowymi wynikami w benchmarkach jest bez znaczenia :-P

    Chyba ktoś tu nie przepada za Google i przeszkadza mu to w pracy :-D
    • avatar
      piomiq
      0
      A na wideo musi być multikulti.
      Nie, nic nie mam przeciwko różnorodności, a tylko robieniu tego na siłę bo tak jest politycznie poprawnie...
      • avatar
        piomiq
        0
        Na końcu filmiku generowana jest moneta, raz z tłem drugi raz bez. Tyle że w drugim przypadku pani poprosiła tylko aby użyć przeźroczystego tła i ono się pojawiło, niestety zniknął cień.
        • avatar
          Naruto1
          0
          "Jako że nowy model AI znacznie ułatwia tworzenie tzw. fake’ów, wszystkie obrazy generowane przez GPT-4o zawierają metadane C2PA, co ma pozwolić na weryfikację ich pochodzenia."

          A co w przypadku konwersji albo po prostu print screena?

          Witaj!

          Niedługo wyłaczymy stare logowanie.
          Logowanie będzie możliwe tylko przez 1Login.

          Połącz konto już teraz.

          Zaloguj przez 1Login