Najbolj znan klepetalni robot Chat GPT je prejel veliko posodobitev. Zdaj mu lahko pošljete slike, poleg tega pa ima zdaj tudi težko pričakovano funkcijo – dostop do interneta. Poglejmo, kakšne novosti so na voljo in kako jih najbolje uporabljati.
Najbrž ni človeka, ki ne bi bul impresioniran nad vsestranskim chatbotom Chat GPT. Lahko pa si tudi priznamo, da čeprav se je izkazal za izredno pametnega, so ga doslej ovirali zelo omejeni vhodni in izhodni kanali. Z njim ste lahko samo pisali, on pa je pisal nazaj- po principu »Besedilo noter, besedilo ven«. Druga omejitev je bilo dejstvo, da je deloval le na podlagi tistega, kar se je naučil do septembra 2021, torej dve leti zastarelo, zaradi česar ni mogel biti uporabna alternativa iskalnikom za iskanje aktualnih informacij.
Toda pri OpenAI so se v zakulisju mesece ukvarjali s pripravo številnih posodobitev, s katerimi se je njihov klepetalni robot lotil vseh tekmecev naenkrat. Podjetje s Samom Altmanom na čelu je tako prejšnji teden razkrilo, da je njihov ChatGPT nadgrajen tako, da razume govorjene besede, se odziva s sintetičnim glasom in analizira slike, kar mu omogoča, da »vidi, sliši in govori«.
Ta izboljšava je največja posodobitev od uvedbe GPT-4, saj uporabnikom omogoča glasovne pogovore prek mobilne aplikacije ChatGPT. Uporabniki lahko izbirajo med 5 različnimi sintetičnimi glasovi za odgovore bota. Poleg tega lahko uporabniki z robotom ChatGPT delijo slike in določijo področja, na katera se morajo osredotočiti ali jih analizirati, na primer z vprašanjem: “Katere pasme je pes na sliki?” Ustvarjalci so sporočili, da bodo te spremembe naročenim uporabnikom predstavljene v prihodnjih tednih, ni pa jasno, kdaj točno bo posodobitev na voljo v Sloveniji. Glasovna funkcija bo na voljo izključno v aplikacijah za iOS in Android, medtem ko bo funkcija obdelave slik razširjena na vse platforme.
Chat GPT lahko vidi slike
Ljudje se zavedamo večje jasnosti, ki jo omogoča vizualno zaznavanje, v primerjavi z izključno besednim opisom. Podobno je natančen opis bistveno bolj zapleten kot preprosta predstavitev predmeta. Saj veste – »Slika pove več kot tisoč besed«. Zato je bilo neizogibno, da bo umetna inteligenca sčasoma morala razviti čutne zaznave, podobne našim, da bi omogočila čim bolj tekočo in učinkovito komunikacijo. Ta ključna točka je bila zdaj dosežena pri ChatGPT:
Zdaj lahko na potovanju posnemete sliko znamenitosti in se v živo pogovarjajte o tem, kaj je na njej zanimivega. Ko ste doma, lahko slikate hladilnik, da ugotovite, kaj bo za večerjo, ChatGPT pa vam bo sestavil možne recepte – glede na vsebino hladilnika. Po večerji pomagajte otroku pri reševanju matematične naloge tako, da posnamete fotografijo, obkrožite sklop nalog in mu dovolite, da z vama deli namige.
Medtem ko smo še pred nekaj tedni pisali, da ChatGPT stagnira, če ne nazaduje, pa je s tem pokazal eksponentno rast uporabnosti. Pozabite na tipkanje – pokažite, povejte, fotografirajte, postavite vprašanje in poslušajte odgovor. Glede na to, kako vseprisotni so postali fotoaparati in mikrofoni – skoraj vsakdo jih stalno nosi v žepu – se ChatGPT spreminja v vedno bolj prisotnega pomočnika na poti.
Meta Ray Ban očala in Chat GPT kot odličen par
Zaradi tega bi bila lahko oprema za razširjeno resničnost (AR), kot so nedavno napovedana druga generacija pametnih očal RayBan Meta s kamero, zvočniki in mikrofonom, zelo uporabna, saj bi lahko nemoteno uporabljali ChatGPT, ne da bi pri tem segli v žep. Morda je prav to tisti manjkajoči element, ki je v zadnjih letih manjkal vsem vrstam pametnih očal, odkar so pred desetletjem predstavili zdaj že upokojena očala Google Glass. Zakaj ne bi namesto poskusa ustvarjanja stalnega zaslona pred našimi očmi preprosto uporabili vgrajene kamere, da bi pomočnik z umetno inteligenco videl, kar vidimo, in slišal, kar slišimo in mu rečemo?
Kako dostopati to nove slikovne funkcije?
Posodobitev bo predvidoma zaživela pred koncem leta, vendar natančen čas, ko bodo slikovne in glasovne funkcije predstavljene javnosti, še ni znan. Običajno imajo plačljivi naročniki prednostni dostop do večine posodobitev OpenAI, vključno z različico ChatGPT GPT-4. V mobilni aplikaciji ChatGPT so na voljo trije načini nalaganja fotografij. Na začetku lahko izberete možnost kamere, ki jo najdete levo od vrstice za sporočila, in s pametnim telefonom posnamete novo fotografijo. Pred prenosom slike imate možnost, da s prstom obkrožite kateri koli del, na katerega želite, da se klepetalni robot osredotoči.
Težko pričakovana nadgradnja: Dostop do interneta
Kot da to ne bi bilo dovolj za en teden, je OpenAI vse skupaj dopolnil še s češnjo na tortici, ki so jo vsi čakali: ChatGPT bo končno začel brskati po internetu v realnem času. Nič več omejitev informacij do septembra 2021, vprašate ga lahko o čemer koli in vrnil vam bo odgovore in povezave do virov.
Po partnerstvu z Microsoftom in njihovi veliki naložbi v OpenAI, je funkcija zgrajena na podlagi storitve Bing, brskanje po kateri boste morali omogočiti v ChatGPT, da boste dobili rezultate v živo. To je tudi velik izziv za Google, katerega lastni chatbot Bard še ni uspel zaživeti na podoben način. Povezovanje prek obstoječih iskalnikov je v primerjavi z inteligentnim botom boleče okorno. Številni rezultati so še vedno povišani s spornimi praksami SEO in pogosto traja nekaj časa, preden se dokopljete do informacij, ki ste jih zares iskali (pri tem pa se izognete prevaram, neželeni in zlonamerni programski opremi).
Nasprotno pa lahko klepetalni robot v nekaj sekundah poda natančne odgovore in obide vse nepovezane informacije. Spremenil bo način iskanja informacij na spletu, čeprav ne bo popolnoma odpravil tradicionalnih iskalnikov. Morda se bodo ohranili kot rezervna možnost za tiste, ki bodo želeli ročno potrditi točnost informacij, ki jih bo zagotovil navidezno inteligentni pomočnik – vendar je bolj verjetno, da bo to specializiran, obroben primer kot pa prevladujoča praksa, kot je trenutno.
AI tekma se nadaljuje
Velika nadgradnja ChatGPT se dogaja vzporedno z naraščajočo konkurenco na področju umetne inteligence med vodilnimi razvijalci klepetalnikov – OpenAI, Microsoft, Google in Anthropic. Da bi potrošnike spodbudili k vključevanju generativne umetne inteligence v vsakdanje rutine, ti tehnološki velikani hitro uvajajo ne le nove aplikacije klepetalnikov, temveč tudi inovativne funkcije, zlasti letos poleti. Google je predstavil vrsto nadgradenj svojega klepetalnega robota Bard, Microsoft pa je v Bing vključil vizualno iskanje.
V začetku tega leta je Microsoftova naložba v OpenAI v obsegu 10 milijard dolarjev postala največja naložba v umetno inteligenco. Aprila naj bi zagonsko podjetje zaključilo prodajo delnic v vrednosti 300 milijonov dolarjev, pri čemer naj bi bilo ocenjeno na 27 do 29 milijard dolarjev, vanj pa so vlagala podjetja, kot sta Sequoia Capital in Andreessen Horowitz.
ChatGPt integracija z internetom ne vpliva le na Googlove prihodke od iskanja, temveč tudi na oglaševanje, saj so pasice nameščene ob vsebini, ki pa je bo porabljeno veliko manj, če bodo ljudje želeno vsebino dobili v aplikaciji, kot je ChatGPT. Če ne bodo brskali po spletnih straneh, ne bodo brali člankov in klikali na oglase, kar bo škodilo tako založnikom kot Googlu. Skupaj to ogroža skoraj 70% trenutnih prihodkov podjetja Google, ki se na to ne more odzvati in še vedno dohiteva uporabnost aplikacije ChatGPT.
Pomisleki glede zasebnosti in globokih ponaredkov
- Pojavili so se tudi pomisleki glede zasebnosti pri dostopu do informacij v realnem času: Bot bi lahko izbral škodljivo gradivo, dezinformacije in avtorsko zaščitene vsebine na spletu ter jih prikazal uporabnikom. Poleg tega morajo uporabniki za delovanje novega vtičnika brskalnika omogočiti zgodovino klepeta, kar pomeni, da se morajo odločiti za deljenje svojih osebnih podatkov z modelom. Raziskave so pokazale, da so z določenimi vrstami pozivov prek različnih sistemov uhajale določene vrste zasebnih podatkov. Pri tem pa ne vemo, kaj vse je bilo razkrito, ker so ta podjetja ohranila visoko raven zasebnosti svojih podatkovnih virov.
- To pa ni edini pomislek. Strokovnjaki so izrazili pomisleke glede sintetičnih glasov, ki jih ustvarja umetna inteligenca, saj bi v tem primeru lahko uporabnikom omogočili bolj naravno izkušnjo, a tudi prepričljivejše globoke ponaredke (deepfake). Globoki ponaredek ali deepfake je sintetični medij, običajno videoposnetek ali zvočni posnetek, ustvarjen z uporabo naprednih tehnik umetne inteligence, v katerem sta podoba in/ali glas osebe prepričljivo nadomeščena z glasom nekoga drugega, tako da se zdi, da oseba govori ali počne stvari, ki jih v resnici nikoli ni počela.
Akterji in raziskovalci kibernetskih groženj so že začeli raziskovati, kako bi lahko globoke ponaredke uporabili za prodor v sisteme kibernetske varnosti. Podjetje OpenAI je v objavi priznalo te pomisleke in navedlo, da so bili sintetični glasovi ustvarjeni z glasovnimi igralci, s katerimi soo neposredno sodelovali, in ne zbrani od neznancev.
- Medtem ko je del uporabnikov ChatGPT posodobitve toplo pozdravil, pa so nekateri izrazili pomisleke, da bi umetna inteligenca preveč posnemala človeške lastnosti. Poudarili so, da lahko posodobitve zasenčijo manjša zagonska podjetja s področja umetne inteligence in izpodrinejo programske inženirje, drugi pa so odsvetovali uporabo ChatGPT. Navajali so skrbi, ki izhajajo iz nedavnih pravnih postopkov proti OpenAI zaradi kršitev zakonov o avtorskih pravicah in posegov v pravice intelektualne lastnine.
Nasveti za ekperimentiranje s Chat GPT Slovenija
To ni prvi primer, ko je oblika “računalniškega vida” dostopna širši javnosti, vendar kombinacija intuitivnega uporabniškega vmesnika in robustnega klepetalnega robota daje občutek, da se dogaja nekaj edinstvenega in potencialno revolucionarnega.
Želite omejiti, koliko časa bo OpenAI hranil vaše podatke in interakcije z umetno inteligenco za usposabljanje klepetalnega robota? Pojdite v Setting, nato v Data Control sin izklopite možnost Chat History & Training. Če je ta možnost onemogočena, se vaši podatki izbrišejo po enem mesecu. Ta postopek je treba opraviti posebej za vsak brskalnik, ki ga uporabljate za dostop do ChatGPT, tako za osebne kot za mobilne naprave.
Kljub temu, da orodje omogoča iskanje informacij, ne zaupajte takoj njegovim odgovorom 100%.