Obavijesti

Tech

Komentari 0

Masovna blamaža AI modela: Evo što je 'autopraona test'

Masovna blamaža AI modela: Evo što je 'autopraona test'

Po društvenim mrežama se širi jednostavno pitanje koje je mnogim AI modelima zadalo probleme: ‘Želim oprati auto, autopraonica je blizu. Trebam li do nje autom ili pješke?’ Evo kako AI modeli odgovaraju.

Admiral

Internetom se širi novi pokazatelj da iako AI često djeluje sve naprednije, on ipak nema inteligenciju u punom smislu te riječi. Radi se o vrlo jednostavnom testu, gdje ljudi pitaju AI trebaju li ići autom do autopraone. Točan prompt bi bio nešto tipa "Trebam oprati auto a autopraona je udaljena 50 metara, preporučaš li da idem pješke ili autom?" Jasno, treba nam auto da bi ga oprali, koliko god praona bila blizu. No dio AI modela je otišao u drugom smjeru i tretirao pitanje kao odluku o načinu života: hodaj jer je zdravije, hodaj jer je ekološki, hodaj da uštediš gorivo. 

Zato je ‘autopraona test’ zanimljiv kao mali primjer šireg problema, a to je da AI često radi ‘tečno’ i uvjerljivo, ali ne provjerava uvijek to što piše i u njegovim odgovorima ponekad fali najobičnije logike. Umjesto da prvo zaključi što je korisnik zapravo htio postići, model se zna zakačiti za poznati obrazac savjetovanja, zdravlje, ekologija, navike, i ostalo pametovanje i onda isporuči lijepo složen tekst koji nema veze s rješenjem. 

U praksi, ovo postaje bitno kako AI ulazi u sve više svakodnevnih odluka, od preporuka do asistenata koji planiraju, rezerviraju i automatiziraju. Ako model ne “čuva” cilj korisnika, može predložiti nešto što zvuči pametno, ali vas odvede u krivom smjeru, pogotovo kad su u pitanju financije, zdravlje ili sigurnost. Zato ovakvi viralni testovi nisu važni jer ismijavaju AI, nego jer podsjećaju da dobar tekst nije isto što i dobro rješenje.

Naravno da ‘autopraona test’ nije znanstveni benchmark, ali je dobra provjera zdravog razuma. Ako AI na takvom pitanju krene moralizirati o šetnji i ekologiji, a zaboravi auto, imate signal da treba dodatno paziti kako mu zadate cilj i da njegove odgovore treba tretirati kao prijedlog, ne kao autoritet.

Igre na sreću mogu izazvati ovisnost. 18+

Sve što je bitno, na dohvat ruke
Skini aplikaciju za najbolje iskustvo portala. Čitaj, komentiraj i budi uvijek u toku s najnovijim vijestima.
Komentari 0
Jack Dorsey otpušta tisuće ljudi u Blocku i tvrdi: 'Većina tvrtki će isto učiniti, mijenjaju se pravila'
VELIKA AI OKLADA

Jack Dorsey otpušta tisuće ljudi u Blocku i tvrdi: 'Većina tvrtki će isto učiniti, mijenjaju se pravila'

Kao ključni razlog nije naveo slabe poslovne rezultate ili potrebu za rezanjem troškova, već nešto mnogo fundamentalnije: umjetnu inteligenciju.
Appleov šef najavljuje veliki tjedan. Stiže MacBook za mase?
KONKURENCIJA GOOGLEU

Appleov šef najavljuje veliki tjedan. Stiže MacBook za mase?

U svojoj objavi na platformi X, Tim Cook je napisao: "Pred nama je velik tjedan. Sve počinje u ponedjeljak ujutro!". Poruku prati i kratki video koji prikazuje animirani Appleov logotip na srebrnoj aluminijskoj površini
Globalni top 10 proizvođača auta u 2025.: Po prvi put su unutra čak tri kineska diva
KRALJEVI PRODAJE ZA 2025.

Globalni top 10 proizvođača auta u 2025.: Po prvi put su unutra čak tri kineska diva

Zaključene su globalne prodajne ljestvice za 2025., nakon što su izašli i zadnji financijski izvještaji velikih grupa. Na vrhu su i dalje poznata imena, ali najveća promjena je ulazak čak tri kineska proizvođača u top 10. BYD je skočio na šesto mjesto, SAIC je sedmi, a Geely deveti, dok je Nissan ispao iz top 10. Podaci u tablici su u milijunima prodanih vozila i temelje se na službenim izvještajima kompanija.