ChatGPT z dużym ulepszeniem. "Nowy poziom swobody twórczej"

26 marca 2025przeczytasz w 1 min.

OpenAI uruchomiło funkcję generowania obrazów w modelu GPT-4o. ChatGPT ma radzić sobie z tworzeniem grafik lepiej niż kiedykolwiek wcześniej.

ChatGPT otrzymał funkcję tworzenia obrazów bazującej na dużym modelu językowym GPT-4o, który dotychczas odpowiadał za generowanie tekstu i kodu. Nowy model zastępuje rozwijaną od lat technologię DALL-E.

W chwili publikacji tego artykułu nowa funkcja ChatGPT jest dostępna dla wszystkich użytkowników płatnych planów Plus, Pro oraz Team. Firma OpenAI poinformowała jednocześnie, że proces wdrażania nowego modelu w darmowym planie także już się rozpoczął.

Z nowego modelu można korzystać za pośrednictwem chatbota ChatGPT oraz usługi Sora.

ChatGPT 4o - nowa jakość generowania obrazów

Twórcy chwalą się, że GPT-4o - w odróżnieniu od wcześniejszego modelu DALL-E 3 - został wytrenowany tak, by precyzyjnie odwzorowywać tekst w grafikach, co ma umożliwić tworzenie menu, zaproszeń czy infografik. Model ma także wierniej realizować złożone polecenia, zachowując wysoką dokładność nawet w przypadku szczegółowych kompozycji. Umożliwia także kontynuację pracy na bazie wcześniejszych obrazów i tekstów, w tym edycję własnych zdjęć za pomocą słownych opisów. Obsługuje różne style artystyczne – od fotorealizmu po ilustracje stylizowane.

OpenAI nie ukrywa, że - z uwagi na poziom technologicznego zaawansowania - GPT-4o generuje grafiki znacznie wolniej niż DALL-E, ale aspekt ten ma zostać w przyszłości dopracowany.

Jako że nowy model AI znacznie ułatwia tworzenie tzw. fake’ów, wszystkie obrazy generowane przez GPT-4o zawierają metadane C2PA, co ma pozwolić na weryfikację ich pochodzenia. OpenAI wprowadziło również zabezpieczenia przed generowaniem szkodliwych treści.

Szef OpenAI, Sam Altman, określił wprowadzenie tej funkcji jako "nowy poziom swobody twórczej".

Obejrzyj w

Przeczytaj także:

Komentarze

Zaloguj się, aby skomentować

Abgan
2025-03-2614:06
1
Ciekawe, że puszczacie dziś artykuł o dodatku do ChatGPT-4o, a o Gemini 2.5 pro jest cisza.

Jasne, ChatGPT-4o potrafi teraz robić obrazki, to wielki news! Multimodalne Gemini 2.5 pro, robiące obrazki, kod, audio i z rekordowymi wynikami w benchmarkach jest bez znaczenia :-P

Chyba ktoś tu nie przepada za Google i przeszkadza mu to w pracy :-D
piomiq
2025-03-2622:44
0
A na wideo musi być multikulti.
Nie, nic nie mam przeciwko różnorodności, a tylko robieniu tego na siłę bo tak jest politycznie poprawnie...
piomiq
2025-03-2623:00
0
Na końcu filmiku generowana jest moneta, raz z tłem drugi raz bez. Tyle że w drugim przypadku pani poprosiła tylko aby użyć przeźroczystego tła i ono się pojawiło, niestety zniknął cień.

Naruto1
2025-03-2715:08
0
"Jako że nowy model AI znacznie ułatwia tworzenie tzw. fake’ów, wszystkie obrazy generowane przez GPT-4o zawierają metadane C2PA, co ma pozwolić na weryfikację ich pochodzenia."

A co w przypadku konwersji albo po prostu print screena?

ChatGPT 4o - nowa jakość generowania obrazów

Komentarze

Witaj!