Jak ChatGPT wypada na tle konkurentów? Pewne badanie pokazuje nam, która sztuczna inteligencja jest obecnie najbardziej wydajna

Zbadano, która sztuczna inteligencja wypada obecnie najlepiej. ChatGPT otarł się o pierwsze miejsce.

tech
Anita "anison99" Zych19 lutego 2024
Źrodło fot. Unsplash | Mojahid Mottakin
i

ChatGPT cieszy się niezwykłą popularnością wśród internautów. W marcu 2023 roku według badań przeprowadzonych przez Genimus, tylko w Polsce rozwiązanie, udostępnione przez OpenAI, posiadało 2,4 miliona użytkowników. Klientów wciąż przybywa, popularność rośnie i co za tym idzie, firmy, które dostrzegły potencjał w generatywnej sztucznej inteligencji, ruszyły wdrażać własne rozwiązania. Jak się okazało na rynku mamy obecnie trzech czołowych czołowych graczy - Microsoft, OpenAI oraz Google.

Porównanie rozwiązań

Na stronie Search Engine Land opublikowano w 2023 roku wyniki analizy skuteczności czterech generatywnych sztucznych inteligencji - Bard, Bing Chat Balanced, Bing Chat Creative oraz ChatGPT w wersji 4.0. Zbadano je pod kątem:

  • sensowności odpowiedzi - czy były one związane z tematem zadanego pytania,
  • dokładności - czy odpowiedzi są trafne i prawidłowe,
  • kompletności - czy żadna z istotnych informacji nie została pominięta,
  • jakości - czy wygenerowana odpowiedź jest spójna gramatycznie.

Każda ze sztucznych inteligencji otrzymała ten sam zestaw trzydziestu pytań z różnych dziedzin, jak na przykład medycyna, czy żarty. Kompletną listę pytań autor zamieścił na końcu artykułu. Jest to dość mała próba badawcza (co podkreślił sam autor), jednak mniej więcej pomoże ona zobrazować na ile skuteczne są badane rozwiązania. W tym roku postanowiono zaktualizować te badania i do listy sprawdzanych AI dołączyło Claude AI oraz listę rozszerzono do 44 pytań.

Wyniki z 2023 i 2024 roku

Według wyników analizy przeprowadzonej w 2023 roku to ChatGPT zdobył podium z wynikiem 81,5% pod względem dokładności. Drugi z kolei był Bing zdobywając 77,8%, a ostatni Bard od Google. We wszystkich kategoriach rozwiązanie od OpenAI zdeklasowało pozostałych konkurentów.

Wyniki dla wszystkich kategorii (2023) |Źródło: Search Engine Land

Jednak, jeśli popatrzymy na rezultaty powtórzonego badania rok później, to Bard w wynikach ogólnych osiągnął najlepszą punktację.

Wyniki dla wszystkich kategorii (2024) |Źródło: Search Engine Land

ChatGPT po raz kolejny osiągnął wysokie wyniki w kategorii sensowność wypowiedzi, jednak patrząc na wszystkie cztery kategorie, zdecydowanie sztuczna inteligencja od Google lepiej sobie poradziła z postawionymi zadaniami.

Rosnąca konkurencja

Dotychczasowy faworyt w dość niedługim czasie zyskał kilku mocnych konkurentów. Przedstawiona analiza daje do myślenia i pokazuje, że konkurencja nie próżnuje oraz wdraża co raz to lepsze rozwiązania odpowiadając na potrzeby użytkowników. Rozwój sztucznej inteligencji postępuje niezwykle szybko i kto wie, jak ranking mógłby wyglądać w niedługim czasie.

Anita "anison99" Zych

Anita "anison99" Zych

Zainteresowanie technologią oraz światem gier komputerowych rozwijała od najmłodszych lat, rozpoczynając ją od największych klasyków w branży. Zafascynowana rozgrywką w Diablo II, przygodami Bezimiennego w Górniczej Dolinie oraz rozwijaniem cywilizacji w Age Of Empires, chciała kreować własne historie nieustraszonych bohaterów dzięki rysunkowi i pisaniu pierwszych komiksów. W późniejszych latach pogłębiała swoją wiedzę na temat technologii dzięki podjęciu studiów ściśle związanych z inżynierią oprogramowania. Dzięki temu poznała nowe możliwości, jeśli chodzi o gamedev – projektowanie modeli 3D, rysunki koncepcyjne oraz budowanie świata wirtualnego stały się dla niej bardziej przystępne dzięki zrozumieniu zasad programowania. W przyszłości chciałaby stworzyć własną grę.

Nintendo Switch 2 może mieć 12GB RAM-u, konsola ma być kontynuacją tego, co znamy z obecnego modelu

Nintendo Switch 2 może mieć 12GB RAM-u, konsola ma być kontynuacją tego, co znamy z obecnego modelu

Ten malutki PC może być zasilany nawet kablem od internetu, Minisforum S100 czaruje niewielkim rozmiarem

Ten malutki PC może być zasilany nawet kablem od internetu, Minisforum S100 czaruje niewielkim rozmiarem

Oto przenośne PS5 z wbudowanym ekranem i własnym zasilaniem, skonstruowane przez youtubera

Oto przenośne PS5 z wbudowanym ekranem i własnym zasilaniem, skonstruowane przez youtubera

Wszystkie smartfony wcale nie wyglądają tak samo. Nothing Phone 2a to przeciwieństwo nudnego designu

Wszystkie smartfony wcale nie wyglądają tak samo. Nothing Phone 2a to przeciwieństwo nudnego designu

Gracz wysyła nowego RTX 4090 do naprawy - powinien zapłacić więcej niż oficjalnie kosztuje

Gracz wysyła nowego RTX 4090 do naprawy - powinien zapłacić więcej niż oficjalnie kosztuje