Internet

Sprawdziłem, co potrafi ChatGPT 4.5. Werdykt? Czekam na GPT 5

przeczytasz w 8 min.

Zastanawiasz się, czy warto płacić ekstra za dostęp do modelu GPT 4.5? O ile nie masz mocno sprecyzowanych wymagań, to niekoniecznie.

Początkowo model GPT 4.5 dostępny był jedynie w planie ChatGPT Pro za 200 dol. miesięcznie, ale jego dostępność została rozszerzona także o tańsze abonamenty Plus oraz Team. 

Aktualnie jest to jedna z nielicznych przewag planu płatnego nad darmowym, bo z większości funkcji - choć z limitami - można korzystać bezpłatnie. Przy czym model dostępny jest na razie w wersji poglądowej i sami twórcy zwracają uwagę, że może jeszcze nie działać idealnie. 

ChatGPT 4.5 kontra ChatGPT 4o

Przedstawiciele firmy OpenAI zwracają uwagę, że w przypadku LLM-ów nowsze modele nie zawsze są jednoznacznie lepsze od starszych. Każdy ma swoje mocniejsze i słabsze strony, więc wszystko zależy od scenariusza użycia. 

GPT 4.5 jest - według deklaracji twórców - "dobry do pisania i odkrywania pomysłów". Dlatego właśnie tego typu zadania mu wymyśliłem, a następnie porównałem odpowiedzi z GPT 4o. 

Zacznijmy od polskiej poezji, z którą LLM-y wciąż mają ogromne problemy. 

Napisz rymowany wiesz w języku polskim, który wytłumaczy 8-latkowi jak działa fotosynteza.

ChatGPT 4.5:ChatGPT 4o:

Oto wiersz, który wyjaśni dziecku, jak działa fotosynteza:

Na listeczkach, w blasku słońca, dzieje się coś wprost bez końca. Rośliny słońce bardzo lubią, bo energię z niego gubią.

Fotosynteza – trudne słowo, ale zaraz powiem prosto, zdrowo: Roślinka słońce łapie liśćmi, i oddycha też przez listki.

Wciąga z ziemi wodę chętnie, a powietrze wdycha pięknie. Gaz, co wdycha, zwą dwutlenkiem, jest dla roślin jak cukierek.

Światło słoneczne z wodą razem, w listku tworzą coś wspaniale: tworzą cukier dla roślinki, by rosła, miała piękne minki.

Przy okazji, całkiem skrycie, wytwarzają też powietrze, którym oddychamy w świecie, byśmy mogli biegać przecież!

Więc pamiętaj, drogi smyku: bez zielonych tych listeczków, nie byłoby życia wokół – więc dbaj zawsze o nie, w słońcu i w półmroku!

Czy ten wierszyk dobrze spełnia Twoje oczekiwania?

Jasne! Oto rymowany wiersz o fotosyntezie, dostosowany do wieku 8-latka:

"Magia zielonych liści"

W liściach roślin cud się dzieje,
gdy słonko na nie jasno grzeje.
To fotosynteza, tak się zwie,
zaraz wyjaśnię, jak to się dzieje!

Roślina liście w górę wznosi,
światło ze słońca w sobie gości.
Z ziemi wodę pije przez korzenie,
a z powietrza bierze dwutlenek węgla – bez wytchnienia.

Te trzy składniki – światło, woda, gaz –
zmienia w cukier, co energię da.
To pokarm dla rośliny, siła do wzrostu,
do liści, łodyg, kwiatów i pąków w rozkwicie i rozroście.

A przy okazji – to ważna sprawa –
roślina nam oddaje tlen do oddychania!
Więc dzięki liściom, co pracują w dzień,
my mamy świeże powietrze – tlen!

Więc podziękuj liściom, że tak pracują,
i że powietrze dla nas szykują.
Bo choć to czary, to prawda czysta –
tak działa natura, tak działa fotosynteza!

Chcesz, żebym zrobił wersję jeszcze bardziej zabawną albo krótszą?

Szef OpenAI - Sam Altman - twierdzi, że komunikacja z ChatGPT 4.5 przypomina rozmowę z człowiekiem. Najwidoczniej mowa o człowieku, któremu natura poskąpiła talentu literackiego. Choć oba wiersze pozostawiają wiele do życzenia, to ten wygenerowany przez GPT 4o jest moim zdaniem znaaacznie lepszy. 

Model GPT 4.5 ma także lepiej radzić sobie z kojarzeniem faktów, dlatego w kolejnym zadaniu poprosiłem o wskazanie tytułu filmu na podstawie bardzo lakonicznego opisu. 

Kilka lat temu oglądałem kryminał, w którym kobieta została uwięziona w jakimś wielkim pojemniku, w którym co kilka miesięcy zwiększano ciśnienie. Co to za film?

ChatGPT 4.5:ChatGPT 4o:

Film, o którym mówisz, to najprawdopodobniej "Kobieta w klatce"("Kvinden i buret", ang. tytuł "The Keeper of Lost Causes") z 2013 roku, będący ekranizacją powieści duńskiego pisarza Jussiego Adlera-Olsena.

Charakterystyczne elementy filmu:

- Kobieta zostaje uwięziona w komorze ciśnieniowej (dużym pojemniku), a jej porywacz regularnie zwiększa ciśnienie, by stopniowo zadawać jej cierpienie.

- Dwóch policjantów, Carl Mørck i Assad, po latach próbują rozwikłać tajemnicę jej zaginięcia.

- Fabuła opiera się na śledztwie, które prowadzi do odkrycia miejsca przetrzymywania kobiety.

Film należy do cyklu adaptacji kryminałów Adlera-Olsena znanego jako "Departament Q", w którym każdy film dotyczy rozwiązywania niewyjaśnionych spraw kryminalnych sprzed lat.

Na podstawie Twojego opisu, prawdopodobnie chodzi o film "The Cellar Door" (2007) – thriller psychologiczny, w którym kobieta zostaje uwięziona w specjalnie przygotowanym pojemniku/pomieszczeniu przez swojego oprawcę. Choć nie ma tam dokładnie motywu zwiększania ciśnienia co kilka miesięcy, klimat zamknięcia, klaustrofobii i przerażenia może pasować do Twoich wspomnień.

Jednak motyw zwiększającego się ciśnienia w pojemniku jako forma tortury lub zagrożenia brzmi bardzo specyficznie – jeśli masz jeszcze jakieś dodatkowe szczegóły, np.:

- Czy film był anglojęzyczny?

- Czy pamiętasz, kto grał główne role?

- Czy chodziło o porwanie, zemstę, eksperyment?

- Czy ciśnienie miało zabić ofiarę, czy miało jakiś inny cel?

To bardzo pomoże w znalezieniu właściwego tytułu. Chcesz spróbować podać jeszcze coś więcej?

Z tym zadaniem ChatGPT 4.5 faktycznie poradził sobie bezbłędnie. GPT 4o specjalnie zignorował część zamieszczonych przeze mnie informacji, by dopasować odpowiedź do reszty. 

OK, sprawdźmy jak u GPT 4.5 z kreatywnością.

Otwieram sklep z grami wideo. Lokal znajduje się starym, odrestaurowanym młynie, położonym nad rzeką. Zaproponuj 5 nazw.

ChatGPT 4.5:ChatGPT 4o:

Oto pięć propozycji nazw, które nawiązują do klimatu i charakteru lokalizacji:

1. "Młyn Gier" – nawiązanie bezpośrednie do miejsca i działalności.

2. "RetroMłyn" – podkreśla historyczny charakter miejsca, idealne jeśli sklep oferuje także starsze gry.

3. "Pixel nad Rzeką" – klimatyczne połączenie gamingowego świata z lokalizacją.

4. "Level Młyn" – dynamiczna, gamingowa nazwa nawiązująca do przechodzenia kolejnych poziomów w grach.

5. "Rzeczny Quest" – gra słów, która wprowadza klimat przygody w wyjątkowym miejscu.

Super pomysł na lokalizację – klimat starego młyna nad rzeką świetnie nadaje się do stworzenia wyjątkowej atmosfery! Oto 5 propozycji nazw, które łączą motyw gier wideo z charakterem miejsca:

1. Pixelowy Młyn – połączenie retro-gamingowego ducha z lokalizacją w młynie. Łatwo zapada w pamięć i budzi skojarzenia z klasyką.

2. Save Point – nazwa znana każdemu graczowi, a w kontekście młyna nad rzeką może być też metaforą bezpiecznej przystani.

3. Level Rzeka – gra słów nawiązująca do poziomów w grach i rzeki przy młynie. Nietypowe, ale oryginalne i klimatyczne.

4. XP Młyn – skrót od |Experience Points|, czyli punktów doświadczenia, z nutą industrialnego stylu miejsca.

5. Gryflowy Zakątek – lekko baśniowe i przytulne, pasuje do miejsca z duszą, a |gryflowy| to zgrabna gra słów z “gry” i |przytulny/zakątek|.

Chcesz, żeby poszło bardziej w klimaty fantasy, retro, nowoczesne czy z przymrużeniem oka? Mogę podrzucić więcej. :)

Żaden z modeli nie wspiął się na wyżyny kreatywności, ale zaproponowane przez GPT 4.5 nazwy Młyn Gier i RetroMłyn jako jedyne do mnie trafiają. Punkt dla nowego modelu. 

Wyjaśnij mi prostymi słowami, w jaki sposób Słońce świeci.

ChatGPT 4.5:ChatGPT 4o:

Słońce świeci, ponieważ w jego wnętrzu dochodzi do reakcji zwanych reakcjami termojądrowymi. Najprościej mówiąc, wodór (którego w Słońcu jest bardzo dużo) zamienia się tam w hel. Podczas tej przemiany uwalnia się ogromna ilość energii – głównie w postaci światła i ciepła. Ta energia dociera do nas na Ziemię, dzięki czemu widzimy światło słoneczne i czujemy ciepło.

Jasne! Oto proste wyjaśnienie:

Słońce świeci, ponieważ w jego wnętrzu zachodzi reakcja jądrowa, zwana fuzją jądrową. To trochę jak gigantyczny piec.

Jak to działa?

1. W środku Słońca jest bardzo gorąco i bardzo duże ciśnienie.

2. Wodorowe atomy zderzają się ze sobą tak mocno, że łączą się w atomy helu.

3. Podczas tego łączenia (czyli fuzji) uwalnia się ogromna ilość energii – w postaci światła i ciepła.

Ta energia wędruje na zewnątrz i dociera do nas jako światło słoneczne i ciepło – to dlatego widzimy, że Słońce świeci i czujemy jego ciepło.

Porównanie:

Możesz sobie wyobrazić Słońce jak wielką kulę ognia, ale zamiast zwykłego ognia, jest tam potężna reakcja, która trwa miliardy lat.

Chcesz, żebym wyjaśnił to jeszcze bardziej obrazowo? 

W tym przypadku odpowiedź udzielona przez nowszy model jest moim zdaniem zbyt zwięzła, bo sprowadzenie fuzji termojądrowej do “wodór zamienia się w hel” jest ekstremalnym uproszczeniem. ChatGPT 4o wyjaśnił przynajmniej z grubsza, na czym ta przemiana polega. 

Czekam na ChatGPT 5

ChatGPT 4.5 raz radzi sobie od starszego modelu lepiej, a raz gorzej. To tylko obrazuje szerszy problem ze sztuczną inteligencją i aktualną ofertą OpenAI. 

Aktualnie w płatnym modelu mam dostęp do siedmiu (!) różnych modeli, z których każdy - według deklaracji twórców - wypada lepiej w innych zadaniach. 

Już na etapie GPT 4o, GPT 4 mini, GPT 4, o1, o3-mini i o3-mini-high łatwo było pogubić się w ofercie. A teraz doszedł jeszcze do tego GPT 4.5, który - jak widać - nie ma jednoznacznej przewagi nawet nad starszymi modelami z tej samej rodziny. 

Efekt? ChatGPT z miesiąca na miesiąc staje się coraz mniej przystępny. Na szczęście twórcy zdają sobie z tego sprawę, bo obiecują, że nadchodzący GPT 5 rozwiąże ten problem i będzie sam w stanie wybrać najbardziej optymalny model do konkretnego zadania. Trzymam za słowo, bo dopiero wtedy będzie można mówić o przełomie w AI.

Komentarze

6
Zaloguj się, aby skomentować
avatar
Komentowanie dostępne jest tylko dla zarejestrowanych użytkowników serwisu.
  • avatar
    Kenjiro
    -1
    Prędzej dojdziemy do wersji 666, niż modele językowe będą zdatne do sensownego użycia. ;-)
    • avatar
      piomiq
      0
      "Najwidoczniej mowa o człowieku, któremu natura poskąpiła talentu literackiego. "
      Tak się jakoś składa, że większości ludzi na Ziemi "natura poskąpiła talentu literackiego. "
      Zatem to niczego nie przesądza i nie przeczy Twierdzeniom szefa OpenAI. W związku nie trafiona uszczypliwość drogi autorze.
      • avatar
        piomiq
        0
        "bo sprowadzenie fuzji termojądrowej do “wodór zamienia się w hel” jest ekstremalnym uproszczeniem. "
        A moim zdaniem to zwykłe czepianie się. Miało być prostymi słowami i jest.

        "Wodorowe atomy zderzają się ze sobą tak mocno, że łączą się w atomy helu."
        a to nie są już tzw. proste słowa, moim zdaniem.

        "ChatGPT 4o wyjaśnił przynajmniej z grubsza, na czym ta przemiana polega. "
        Ale nie chodziło o to by wyjaśniał na czym polega przemiana, tylko miał powiedzieć prostymi słowami dlaczego słońce świeci i moim zdanie spełnił dobrze swoje zadanie.

        Autor znów ocenia na swoje widzi mi się, "to lepiej trafia do mnie" plus czepianie się.

        "ChatGPT 4.5 raz radzi sobie od starszego modelu lepiej, a raz gorzej."
        I te zadania mają to niby potwierdzać? Bo raz autorowi wydawało się że taka odpowiedź jest dla niego gorsza, a raz lepsza? Słabe to.
        • avatar
          piomiq
          0
          "Sprawdziłem, co potrafi ChatGPT 4.5. "
          Nie sądzę. Te parę prostych zadań na pewno nie obejmuje tego co ten model potrafi.
          Tytuł znów zahacza o klikbajt.

          Witaj!

          Niedługo wyłaczymy stare logowanie.
          Logowanie będzie możliwe tylko przez 1Login.

          Połącz konto już teraz.

          Zaloguj przez 1Login