Korzystałem z Copilota i poza jedną funkcją kompletnie nie rozumiem tej sztucznej inteligencji

Darmowa aplikacja Copilot od Microsoftu obiecuje łatwy dostęp do zaawansowanej sztucznej inteligencji (model GPT-4) na urządzeniu mobilnym. Po kilku tygodniach korzystania mam jednak sporo wątpliwości, czy w obecnym kształcie ma to sens.

tech
Konrad Sarzyński8 lutego 2024
13

ChatGPT na dobre zadomowił się w naszej świadomości i właściwie stał się dla wielu synonimem sztucznej inteligencji. Microsoft, idąc za ciosem, wypuścił darmową aplikację Copilot na urządzenia mobilne, która obiecuje sporo. W końcu otrzymujemy dostęp do potężnego modelu GPT-4 zaklętego w formie wszechstronnego mobilnego asystenta. Przynajmniej w teorii, bo praktyka wypada dużo gorzej.

Aby sprawdzić aplikację Copilot w praktyce, przeprowadziłem długodystansowy test. Nie było tu zarwanej nocy i intensywnego użytkowania, ale kilka tygodni ciągłej obecności na moim telefonie. W końcu chciałem sprawdzić nie tylko bezpośrednie działanie bota, ale także to, czy znajdę dla niego zastosowanie w prawdziwych sytuacjach, zwłaszcza poza domem.

UWAGA! Tekst dotyczy przede wszystkim aplikacji mobilnej Copilot!

Choć spora część narzędzi, a także główne zalety i wady są wspólne dla wszystkich platform, na których znajdziemy Copilota, a także z ChatGPT, w moim tekście skupiam się na doświadczeniach z niedawno wypuszczonej aplikacji mobilnej. O innych sposobach na skorzystanie z asystenta piszę w dalszej części tekstu.

W chwili obecnej Copilot radzi sobie co najwyżej średnio. Jak głosi slogan, to „Twój codzienny pomocnik AI”, jednak na smartfonie wyjątkowo doskwiera rozwlekłość odpowiedzi (czy wręcz wodolejstwo), a brak precyzji sprawia, że dużo szybciej i pewniej znajdziemy informacje chociażby w Google. Jedyne, do czego Copilot mi się przydaje i działa naprawdę dobrze, to integracja z DALL-E i możliwość łatwego generowania dowolnych obrazów. Ale to chyba nie o to chodziło Microsoftowi.

PLUSY:
  1. łatwe generowanie obrazków, które będą czymś nowym i pozwolą przyszpanować znajomym;
  2. ChatGPT w kieszeni – przyda się zwłaszcza do kreatywnych działań…
MINUSY:
  1. … jednak kompletnie nie radzi sobie, gdy potrzeba szybkiej i precyzyjnej odpowiedzi;
  2. problemy z wiarygodnością informacji;
  3. niskie tempo działania;
  4. dziwnie działająca „cenzura”.
Dokładnie tak wygląda nasza redakcja. DALL-E kiepsko sobie radzi z napisami (dziwne literówki i artefakty), więc wygenerowanie tego obrazka wymagało nieco cierpliwości. - Korzystałem z Copilota i poza jedną funkcją kompletnie nie rozumiem tej sztucznej inteligencji - wiadomość - 2024-02-08
Dokładnie tak wygląda nasza redakcja. DALL-E kiepsko sobie radzi z napisami (dziwne literówki i artefakty), więc wygenerowanie tego obrazka wymagało nieco cierpliwości.

OpenAI, Copilot, ChatGPT, GPT-4 i inne bajery

ChatGPT to najpopularniejszy bot, którego nazwę kojarzą także niezbyt interesujący się sztuczną inteligencją. Stworzyła go firma OpenAI, która działając początkowo jako podmiot non-profit, stopniowo przechodzi w kierunku typowo komercyjnego projektu. Choć niedawny „pucz” i próba obalenia szefa Sama Altmana w listopadzie 2023 roku pokazują, że nie wszystkim w firmie się to podobało. Wygrała jednak frakcja popierająca komercjalizację, a Altman po krótkim epizodzie poza firmą wrócił za jej stery.

Najcenniejszym produktem OpenAI jest jednak nie sam bot, a duży model językowy (large language model; LLM), nad którym pracuje. Obecna wersja to GPT-4, choć w sieci można trafić na sporą liczbę newsów o wersjach GPT-3 oraz GPT-3.5, które zrobiły ogromną karierę właśnie za sprawą ChatGPT. O skali postępu między kolejnymi wersjami może świadczyć liczba parametrów wykorzystywanych do szkolenia – w przypadku GPT-3 i GPT-3.5 było to 175 miliardów, podczas gdy GPT-4 ma korzystać z około 1,7 biliona parametrów (podzielonych na 8 modeli po 220 miliardów).

Microsoft Copilot wykorzystuje modele opracowane przez OpenAI. Można więc powiedzieć (w uproszczeniu), że jest to bliski krewny ChatGPT, bazujący na tym samym silniku, choć z własną „nakładką”, która może różnić się w funkcjonalności.

Copilot niejedno ma imię

Jeżeli chcemy skorzystać z Copilota, możemy to zrobić na kilka sposobów. Microsoft stara się przyciągnąć jak najwięcej użytkowników do swojego asystenta opartego na sztucznej inteligencji nie tylko oferując, co wręcz wciskając go każdemu, kto akurat przechodzi nieopodal. Dlatego dostajemy Copilota w przeglądarce Edge (przycisk w prawym górnym rogu), możemy skorzystać z niego na stronie internetowej, a w przypadku urządzeń mobilnych (Android i iOS), pobrać również aplikację.

Większość funkcji jest identyczna, choć przykładowo w aplikacji mobilnej możemy wybrać, czy chcemy korzystać ze standardowego modelu, czy lepszego, opartego na GPT-4, który może działać nieco wolniej, zaoferuje jednak lepsze i bardziej kreatywne odpowiedzi. Nie mamy z kolei do wyboru 3 tonów wypowiedzi dostępnych na PC (kreatywny, zrównoważony, precyzyjny).

Krótki żywot Bing Chat

Bing Chat nie cieszył się zbyt długą karierą. Na początku 2023 roku Microsoft wprowadził duże zmiany do wyszukiwarki Bing, dodając jej funkcjonalności oparte o AI w formie asystenta Bing Chat. Jednak już w listopadzie zeszłego roku firma zdecydowała się porzucić to nazewnictwo. Sztuczna inteligencja zyskała wówczas nazwę Copilot.

Aplikacja Copilot na Androida i iOS

Copilota możemy pobrać zarówno na sprzęty z Androidem, jak i działające pod kontrolą iOS oraz iPadOS. Dostępna jest za darmo i od momentu premiery została pobrana już ponad milion razy z Google Play. Aplikacja nie jest zbyt wymagająca, testowałem ją na POCO M4 Pro 5G i działała bez zarzutu, potrzebując około 500 MB miejsca (z czego 316 MB sama aplikacja, jednak przyda się jakiś zapas na dodatkowe dane).

Poza podstawowym widokiem, do dyspozycji dostajemy też wyspecjalizowanych asystentów, którzy pomogą nam w gotowaniu, artystycznych przedsięwzięciach, treningu czy podróżach.

Pozytywnym zaskoczeniem jest fakt, że nie musimy się logować, by korzystać z asystenta. Choć jak sam Microsoft kusi w aplikacji, po zalogowaniu się będziemy mogli zadawać więcej pytań i prowadzić dłuższe konwersacje.

Co to oznacza w praktyce? Bez logowania dostajemy 5 odpowiedzi w ramach jednej rozmowy, po zalogowaniu 30. Nawet jednak ta niższa liczba wystarczy w większości sytuacji, w których będziemy po prostu potrzebowali jakiejś informacji i ewentualnie poprosimy o doprecyzowanie. Nie jest to też ograniczenie zbytnio przeszkadzające, bo jeśli jakaś część tematu zostanie dla nas niejasna, zawsze możemy zacząć nową rozmowę, pytając bezpośrednio o to. Największym ograniczeniem dla niezalogowanych użytkowników jest brak dostępu do generowania obrazków.

Czy leci z nami (co)pilot?

Jak najprościej podsumować niepokojąco dużą część moich interakcji z Copilotem? Mniej więcej tak: 10 sekund zastanawiania się, 50 sekund odpowiadania, a po minucie dostałem okrągłe nic. Z reguły odpowiedź składa się z kilku akapitów i ma ustrukturyzowaną formę z wprowadzeniem i zakończeniem. Niestety wygląda to tak, jakby Copilot musiał wyrobić normę słów na wiadomość, a gdy temat nie wymaga tak rozwiniętej odpowiedzi, to tym gorzej dla tematu.

W pojedynczych przypadkach zdarzało się, że asystent podawał nieprawdziwe informacje, zwłaszcza dotyczące konkretnych osób czy zajmowanych przez nich stanowisk. Opierał się też czasem na dość dziwnych źródłach – linki pochodziły albo z bardzo niszowych źródeł, które w żaden sposób nie zajmowały się daną tematyką, albo wprost prowadziły np. na stronę główną jakiegoś portalu i nijak nie dało się zweryfikować prawdziwości cytowanych danych.

Jednocześnie największym problemem wydaje się być sam Copilot. Nie szukałem przepisu na wegetariańskie kanapki, to on sam mi to zaproponował. Kliknąłem więc w sugerowane zapytanie i otrzymałem absurdalną odpowiedź. Tak dzieje się zdecydowanie zbyt często.

Asystent sugeruje kilka początkowych zapytań. Użycie ich najczęściej nie daje zadowalających rezultatów.

Podobnie wygląda to w ciągu dyskusji, gdy po każdej odpowiedzi Copilota otrzymujemy „przydatne” wiadomości, które możemy wysłać jednym kliknięciem. Wydają się być faktycznie sensowne, jednak z jakiegoś powodu są formułowane w sposób trudny do zrozumienia przez AI i tym samym raczej utrudniają niż pomagają prowadzić rozmowę.

To, co działa dość dobrze i sprawiało mi przyjemność, to generowanie obrazków przez DALL-E. Efekty są bardzo nieprecyzyjne i często kompletnie rozjeżdżające się z naszymi poleceniami, jednak przy odrobinie wprawy będziemy w stanie tworzyć grafiki, które będą niezłą ilustracją np. naszych rozmów ze znajomymi. Możemy wpisywać polecenia po polsku, Copilot następnie je tłumaczy na angielski (dość dobrze!) i przekazuje je do DALL-E.

Gdy poprosimy o stworzenie obrazka, dostaniemy 4 wersje. Nic nie stoi jednak na przeszkodzie, by poprosić o kolejne warianty.

Otrzymywane grafiki mają typowy dla DALL-E rozmiar 1024x1024 pikseli, nie są więc one wyjątkowo wysokiej rozdzielczości. Narzędzie nie ma jednak służyć do tworzenia profesjonalnych obrazów w 4K, a raczej generować „codzienne” ilustracje, które możemy wysłać znajomym. I w takim scenariuszu sprawdza się dobrze. Choć muszę przyznać, że samo zapisywanie obrazków na smartfonie nie jest zbyt intuicyjne i za pierwszym razem warto sprawdzić, czy na pewno grafika trafiła do naszej galerii (przycisk „pobierz” zdaje się nie zawsze działać i czasem trzeba po prostu zapisać obraz przez menu kontekstowe).

To miałem być ja grający w Timberborn. Wyszło jednak lepiej – dostałem bobra-streamera. - Korzystałem z Copilota i poza jedną funkcją kompletnie nie rozumiem tej sztucznej inteligencji - wiadomość - 2024-02-08
To miałem być ja grający w Timberborn. Wyszło jednak lepiej – dostałem bobra-streamera.

Copilot nie ma też problemu z rozpoznawaniem zdjęć. Możemy je robić bezpośrednio w aplikacji lub wgrać te już zapisane na naszym urządzeniu. Przetestowałem to na moim kocie i właściwie to była najprecyzyjniejsza i najlepsza odpowiedź, jaką otrzymałem od Copilota.

Rozpoznawanie zdjęć działa dobrze, nawet gdy przedstawiają one obiekty w nieco mniej typowym ułożeniu i sytuacji.

Copilot kompletnie sobie nie radzi z poczuciem humoru. To bolączka ChatGPT i także tutaj dostajemy nawet nie tyle siermiężne i suche, co kompletnie niezrozumiałe dowcipy. Przykładowo, poprosiłem o kawał i dostałem coś takiego (pisownia oryginalna):

Dlaczego komputerowi nigdy nie jest zimno?

Bo zawsze ma Windows!

Gdy poprosiłem o wytłumaczenie kawału, właściwie niewiele to dało. Pisownia w cytacie poniżej oryginalna.

Oczywiście, oto wyjaśnienie tego żartu: Komputerowi nigdy nie jest zimno, ponieważ Windows to popularny system operacyjny stworzony przez firmę Microsoft. "Windows" to gra słów, ponieważ oznacza zarówno "okna" (czyli interfejs graficzny systemu operacyjnego) jak i "Windows" (nazwę systemu operacyjnego). W tym kontekście "Windows" jest używany jako nazwa systemu operacyjnego. Okna (czyli interfejs graficzny) na komputerze zawsze są otwarte, więc komputer nie odczuwa zimna. To zabawne, ponieważ sugeruje, że komputer jest tak "gorący", że nie może być mu zimno. W skrócie, to żart o tym, że komputer zawsze ma "Windows" (czyli okna), więc nie odczuwa zimna.

Śmiechom nie było końca.

Rozmowy kontrolowane

Copilot ma szereg ograniczeń, które właściwie bardziej zdają się chronić Microsoft niż użytkownika. Nie porozmawiamy z nim na jakiekolwiek „nieodpowiednie” tematy, zwłaszcza te dotyczące sposobów pozyskiwania zakazanych substancji czy nierządu. A także wszystkiego, co z tymi tematami związane. Co jednak zabawne, autocenzurę nakłada na siebie w czasie rzeczywistym w trakcie pisania odpowiedzi, czyli właściwie wtedy, gdy już jest za późno.

Posłużmy się przykładem Sashy Grey. Obecnie prowadzi streamy w serwisie Twitch, gromadząc średnio 1500-2000 widzów, tworząc całkiem przyjemne i raczej pozbawione podtekstów materiały. Swego czasu grała sporo w Wiedźmina 3 i Cyberpunka 2077, a w opisie określa się pisarką i dj-em. W przeszłości występowała jednak w filmach, których pewnie nie zobaczymy w kinach, czym zdobyła sobie światową sławę i rozpoznawalność. I to właśnie na ten wątek trafia w pierwszej kolejności Copilot, tworząc odpowiedź.

Copilot unika wrażliwych tematów. Niestety analizuje swoje wypowiedzi dopiero po tym, jak pojawią się na ekranie, po czym usuwa swoją wiadomość.

Drocząc się w ten sposób z Copilotem, miałem przed oczyma kompletnie nieświadomego zarozumiałego człowieka, który zaczyna z typową dla siebie pewnością siebie odpowiadać na moje pytanie, podnosząc jednak coraz wyżej brew z każdym wypowiedzianym słowem, w duchu czując, że coś jest nie tak. Otwierając kolejne strony w poszukiwaniu informacji, Copilot z coraz większym przerażeniem dostrzegał kolejne zakazane słowa kluczowe, aż w końcu, gdy dotarł do… No właśnie, można tylko zgadywać do czego, ale postanowił usunąć swoją wiadomość i nigdy nie wracać do tematu.

Jak widać, Copilot na bieżąco analizuje tworzone treści i nawet jeżeli samo pytanie nie zawiera tematów zakazanych (np. nie jest w stylu „jak otrzymać <nazwa substancji>”), skanuje własną odpowiedź i ocenia, czy jest właściwa. System jednak działa absurdalnie źle, bo czasami bot potrafi zabrnąć dość daleko nim usunie wiadomość, a niskie tempo działania powoduje, że bez trudu przeczytamy jej treść.

Zdecydowanie zabrakło jakiegoś bardziej wyrafinowanego systemu. Przykładowo Copilot mógłby zdawkowo, jednym zdaniem podsumować „zakazaną” część życiorysu Sashy, po czym skupić się na jej działalności w ostatnich kilkunastu latach. Elokwentnie i dyplomatycznie wybrnąć z niezręcznej sytuacji. W obecnej formie raczej tylko podkreśla, jak źle działa. A nieświadomego użytkownika dodatkowo naprowadzi na tę mroczniejszą część zagadnienia, o które pyta.

Copilot nie ma sensu, ale to nieistotne

Czy Copilot jest przydatną aplikacją? W chwili obecnej nie. To gadżet, zabawka i ciekawostka, jednak trudno na niej polegać. Wydaje się, że to jednak nie ma większego znaczenia dla Microsoftu. To obecnie najlepsze, co może zaoferować na tak dużą skalę. A coś zaoferować właściwie musi, żeby zabezpieczyć swoją pozycję na rynku i przygotować grunt pod kolejne, zapewne coraz lepsze wersje asystenta. Aplikację mobilną Copilota rozważałbym bardziej jako narzędzie w strategicznej walce o przyszły rynek i działanie PR-owe niż jako przydatne narzędzie dla użytkownika.

Odniosłem też wrażenie, że wersja mobilna uwydatnia wszystkie wady, z jakimi boryka się zarówno Copilot, jak i ChatGPT. Boty oparte o modele GPT-3.5 i GPT-4 mają ciągoty do tworzenia rozbudowanych, „barokowych” odpowiedzi na nawet najprostsze pytania. W chwili, gdy jesteśmy poza domem i potrzebujemy szybko precyzyjnej odpowiedzi, Copilot robi wszystko odwrotnie, niż powinien.

Copilot ma asa w rękawie, ale nie w aplikacji mobilnej

Czytając ten tekst możecie odnieść wrażenie, że Copilot jest całkowicie pozbawiony sensu. Cóż, tak zupełnie szczerze, wersja mobilna taka jest. Jeżeli jednak korzystamy z Copilota na komputerze, to ma on potężną zaletę – potrafi błyskawicznie podsumować dla nas film na YouTubie. Wystarczy wkleić link i poprosić o streszczenie np. recenzji sprzętu czy przydługiej konferencji z prezentacją nowych produktów, a już po chwili dostaniemy w punktach wypisane najważniejsze informacje. Więcej o tym znajdziecie w poradniku Krystiana.

W aplikacji teoretycznie możemy wysłać link i poprosić o streszczenie, ale nie udało mi się tego zrobić. W odpowiedzi z reguły dostaję opis jakiejś losowej piosenki, do której podobno wiódł wklejony przeze mnie link.

Asystent Microsoftu jest pewny siebie i swoich odpowiedzi. To, czy są one prawdziwe, to już mniej istotne. Dlatego też przez te kilka tygodni miałem ogromne problemy z zaufaniem mu właściwie nawet w najbardziej błahych sprawach. Bo wiedziałem, że nie powie mi, że czegoś nie wie tylko stworzy fałszywe informacje na swoje potrzeby.

Microsoft starał się zaradzić temu poprzez dodawanie linków do źródeł informacji, z których czerpie Copilot. Te jednak bywają bardzo ogólne, mocno nieprecyzyjne albo, co gorsza, całkowicie niewiarygodne. To, że coś jest w sieci nie sprawia, że z automatu musi być prawdziwe. Niestety ktoś zapomniał powiedzieć o tym Copilotowi.

W obecnej formie widzę tylko dwa sensowne zastosowania dla Copilota w formie aplikacji mobilnej. Pierwsze to wszelkiego rodzaju „kreatywne szkice”, w postaci tworzenia roboczych wersji pism, opowiadań, zarysów fabuły powieści, szablonów maili z życzeniami świątecznymi, itd. Drugie zastosowanie to generator obrazków, który przyjmie także bardziej opisowe zamówienia i przekształci je w konkretne komendy w języku angielskim dla DALL-E.

Zwłaszcza to pierwsze zastosowanie, jeśli podejdziemy do sprawy z głową, może nam pomóc w pracy czy w rozwijaniu zainteresowań. W końcu sztuczna inteligencja bez trudu podsumuje duże ilości tekstu czy wygeneruje coś, co wynika z powtarzalnych i żmudnych działań. Na tym etapie rozwoju, nie odważyłbym się jednak użyć takich treści bez dokładnej weryfikacji i raczej wybrałbym wersję przeglądarkową asystenta, żeby móc dalej pracować z danymi, które od niego otrzymam. Czy to się zmieni, czas pokaże.

Konrad Sarzyński

Konrad Sarzyński

Od dziecka lubił pisać i zawsze marzył o własnej książce. Nie spodziewał się tylko, że będzie to naukowa monografia. Ma doktorat z rozwoju miast, czym chętnie chwali się znajomym przy każdej możliwej okazji. Z GOL-em przygodę zaczął pod koniec 2020 roku w dziale Tech. Mocno związał się z newsroomem technologicznym, a przez krótki moment nawet go prowadził. Obecnie jest redaktorem w Futurebeat.pl odpowiedzialnym za publicystykę i testy sprzętu. Czasem też zrecenzuje jakąś grę o budowaniu, w końcu ma z tego doktorat. Gra od zawsze, lubi też dużo mówić. W 2019 roku postanowił połączyć obie te pasje i zaczął streamować na Twitchu. Wokół kanału powstała niewielka, ale niezwykła społeczność, co uważa za jedno ze swoich największych osiągnięć. Ma też kota i żonę.

Wyciekła specyfikacja RTX 5070 Ti; karta pobierze więcej prądu niż 4070 Ti

Wyciekła specyfikacja RTX 5070 Ti; karta pobierze więcej prądu niż 4070 Ti

Chcą zmiażdżyć konkurencję ceną; nowe laptopy z procesorami Snapdragon będą tanie i ze wsparciem dla AI

Chcą zmiażdżyć konkurencję ceną; nowe laptopy z procesorami Snapdragon będą tanie i ze wsparciem dla AI

Ustawienia Stalker 2: Zdecydowanie powinieneś zmienić te 9 ustawień grafiki, sterowania, HDR i inne

Ustawienia Stalker 2: Zdecydowanie powinieneś zmienić te 9 ustawień grafiki, sterowania, HDR i inne

Do dziś korzystam z konsoli, która sprzedawała się tak dobrze, że niemal pobiła wynik PlayStation 2. Nintendo DS właśnie kończy 20 lat

Do dziś korzystam z konsoli, która sprzedawała się tak dobrze, że niemal pobiła wynik PlayStation 2. Nintendo DS właśnie kończy 20 lat

RTX 5090 będzie tańszy niż sądziliśmy; Nvidia ma zaskoczyć graczy

RTX 5090 będzie tańszy niż sądziliśmy; Nvidia ma zaskoczyć graczy