Goran S. Milovanović:
AI (ne)će uništiti ljudsku rasu
Goran S. Milovanović je doktor psihologije sa dugogodišnjim iskustvom u oblasti koju danas zovemo Data Science. Svoju akademsku karijeru u kognitivnim naukama i veštačkoj inteligenciji započeo je pre 30 godina, dok mu je programiranje pasija već četiri decenije.
Milovanović je Lead Data Scientist u srpsko-holandskom startapu smartocto, gde vodi LABS tim zadužen za razvoj i inovacije, osnivač je DataKolektiva, agencije koja pruža konsultantske usluge u oblasti informacionih tehnologija, kao i edukaciju iz oblasti Data Science, Machine Learninga, AI i analitike. Takođe, jedan je od pokretača Mašinerije, zajednice koja okuplja veliki broj različitih IT stručnjaka.
Možete li nam malo pojasniti čime se, zapravo, bavite?
Bavim se podacima kojima se opisuje ljudsko ponašanje. Moj klijent je bilo koji biznis koji za sobom ostavlja poširok trag u podacima. Bilo da su u pitanju numeričkih podaci – brojevi – ili podaci bilo koje druge vrste: koliko ste čega prodali, kakve ste usluge imali, koje su karakteristike tih usluga, ko su vaši kupci, kako možete njih da opišete numerički ili kategorijama, šta su kupovali, koliko su kupovali, šta koristili, kada su kupovali vaše usluge ili proizvode.
Danas je skoro svaka firma u stanju da ima tehnološku implementaciju baza podataka, koje te brojeve i slova čuvaju negde. Posao ljudi u mojoj struci jeste da proučavamo strukture tih podataka, da na osnovu toga nađemo pravilnosti u tom poslu, da na osnovu tih pravilnosti damo savete kako mogu da se posao učine efikasnijim, bržim, gde može da se uštedi, gde može da se dodatno zaradi, da li postoji nešto što nije iskorišćena vrednost, a što ti podaci otkrivaju. To su poslovi Data Science, koja se oslanja na metode mašinskog učenja i veštačke inteligencije.
Gde ste sada, a i u prethodnih nekoliko godina, bili angažovani?
Tržišta na kojima sam radio su vezana za informacije neposredno – znači, u digitalu, u medijima, sada sam Lead Data Scientist u smartocto, koji je kuća upravo za medijsku analitiku. Naš posao je da razvijamo proizvode koji vama, tj. ljudima koji su vlasnici medija, redakcijama, urednicima, pruži uvid u to kakav je performans digitalnog sadržaja koji proizvode, i preporuči akcije na osnovu kojih možete da poboljšate vaše poslovanje i donošenjem boljih odluka. Takođe, sa DataKolektiv sam edukovao veliki broj istraživača tržišta iz raznih marketing agencija,uključujući tehnološke inovatore u oblasti analize ljudskog ponašanja, u oblasti Data Science, a kao istraživač tržišta sam i sam radio pre moje karijere u Data Science.
U smartocto, na osnovu gomile podataka sa servera naših klijenata koje prikupljamo pošto se naš softver instalira, pravimo preporuke za njih: kako da se digitalna novina proda bolje, kako da više saobraćaja ide ka njima, kako da ako serviraju reklame prodaju više, kako da njihov subscription model radi bolje i slično.
Koja je razlika u podacima koje vi prikupljate pomoću vašeg programa u odnosu na ono što daju Google Analitics i slični alati?
Razlika je u tome što su sistemi koje mi razvijamo podržani mašinskim učenjem i veštačkom inteligencijom, i omogućavaju mnogo dublji uvid u strukturu tih podataka od onoga što vam daje Google Analytics. To je ono što prodaje smartocto.
Razlika je i u tome što mi radimo tzv. sisteme za preporuke, odnosno recommendation engines, kako se zovu. To je jedan od osnovnih naših proizvoda, koji, zapravo, pomaže urednicima da upravljaju radom u samom donošenju odluka, za razliku od Google Analytics, koji vam pruža pasivan uvid u to šta se dešava na nekom sajtu.
Dakle, vi ljudima objašnjavate zašto, dok alati poput Google Analytics kažu samo koliko, sa čime ne mogu da urade baš previše stvari?
Uzmimo neposredne primere u razmatranje. Malo ljudi zna da jedan informativni sajt, koji objavljuje vesti, naslov neke vesti može da promeni čak i nekoliko puta u, recimo, prvih pola sata-sat vremena, od kada je ta vest objavljena. Malo ljudi zna da, kada ide na sajtove medija, može da se dogodi da istu vest različiti čitaoci prime sa različitim naslovima.
U pitanju je proces koji se zove A/B testiranje naslova vesti, i tu tehnologiju, recimo, razvijamo i prodajemo. I u prvih nekoliko minuta, pola sata-sat, ona informiše uredništvo i kaže koji je naslov najbolji, a zatim sajt počinje da svim posetiocima servira tu vest sa istim, najboljim izabranim naslovom. U pozadini se nalazi reinforced learning algoritam, koji se zove Tompsonovo uzorčenje i na osnovu koga se određuje „pobednički“ naslov vesti.
Takođe, sada imamo smartocto.ai, sistem baziran na generativnim AI, koji na osnovu nekog polaznog naslova vesti, koji novinari i redakcija predlažu, prvo prouče prethodne performanse sličnih vesti na vašem sajtu – dakle, one vesti koje su slične vesti na kojoj radimo, a bile su najviše čitane – i daju automatske preporuke za alternativne naslove, koji se potom šalju na A/B testiranje.
Onda imamo sisteme koji pomažu urednicima i novinarima u kreiranju sadržaja. Neke stvari treba pisati brzo. Čovek je nesiguran oko jednog paragrafa, jednostavno ga je napisao iz glave, ali vidi da je potrebno popraviti ga. Zato imamo sisteme, ponovo bazirane na generativnim AI, koji automatski pružaju alternativni paragraf, koji korisnik zatim može delimično ili u potpunosti da iskoristi.
Dalje, imamo sisteme bazirane na klasičnom mašinskom učenju, koji za dati članak daju preporuku redakciji kada je optimalno vreme za objavu istog na osnovu istorijskih podataka o tome kada su prethodno objavljivali slične članke, i kako su koji članci prolazili u zavisnosti od vremena objavljivanja.
Dakle, u odnosu na Google Analytics, koji je dobra polazna mera, da kažemo, u medijskoj analitici, to su sistemi koji su aktivni i koji pružaju podršku u donošenju odluka.
Vaši kijenti su ozbiljni mediji koji se ne bave klikbejtovima i sličnim stvarima, već se trude da prave što više kvalitetnog sadržaja. Parametri koje pratite obuhvataju ne samo broj pregleda članka i vreme zadržavanja, nego daleko više različitih informacija – postoji čitav sistem bodovanja koji, na kraju, daje zaključak koji članak je, zapravo, najznačajniji.
Da, to se oslanja na veliki opseg i kvalitet podataka koji se koriste. Naravno, što su podaci kompleksniji, to morate više na njima da radite i njihova analiza je složenija, te su vam potrebni stručni ljudi koji to mogu da rade, a ni ulaganja u analitičku infrastrukturu nisu mala. Analizira se dubina čitanja članka, dokle je članak pročitan, koliko se neko zadržao na kom delu članka, koliko je pažnje posvetivo u kom delu članka, itd.
Mnogo toga se dobije time kad se ukrste podaci iz različitih članaka koji su prethodno objavljivani, pa se vidi kako slične stvari ili stvari koje su objavljivane u slično vreme prolaze kod publike u odnosu na te parametre.
Vaše prethodno radno iskustvo bilo je vezano za rad na možda jednom od najvećih setova podataka na svetu – Wikidata.
Wikidata je centralizovan repozitorijum svog faktičkog znanja i informacija koje se nalaze po različitim jezičkim verzijama slobodne enciklopedije Wikipedia u svetu. Šta to znači? To znači da je Wikipedija, kao enciklopedija, data u formi klasičnog jezičkog narativa. Iz toga sledi da biste vi članak o Leonardu da Vinčiju mogli da napišete na jedan način, a ja na drugi, dok bi faktografija – poput godine i mesta rođenja, ili podataka o Leonardovom opusu – bili isti u oba teksta.
Takvog faktičkog znanja u Wikipedia ima mnogo, jer ona u svojoj misiji insistira na prikupljanju proverljivih informacija i dokazivog, demonstrabilnog znanja. Wikidata je onda mesto na kome su, bez obzira na razliku ko je pisao tekst ili na kom jeziku, bez obzira na sve moguće takve razlike, sve faktičke informacije centralizovane u jednom ogromnom sistemu podataka koji uzima oblik grafa.
Moj posao tamo je bio da pružam analize i pravim sisteme mašinskog učenja, koji su, zapravo, pratili upravo strukturu i odnos između tih podataka u Wikidata kako bi se pomoglo da se oni, u oko 300 verzija enciklopedije Wikipedia na različitim jezicima, najefikasnije koriste. Takva saznanja distribuirali smo urednicima Wikipedia, autorima koji tamo pišu, obaveštavali gde treba da se interveniše: šta se od ukupnog znanja koristi, a šta ne, iz čega znamo koji članak treba proširiti, a koji skratiti, itd… Ukratko, olakšati život ljudima koji pišu taj sadržaj, pružiti im analize na osnovu kojih mogu lakše da upravljaju svojim radom.
Kroz taj angažman ste, na neki način, pokrenuli DataKolektiv. Šta je bila ideja iza toga?
Ja sam doslovce slučajno postao preduzetnik. Pre toga sam u karijeri mnogo radio sam, frilenserski, kao konsultant. To je bio takav posao da nikada nisam osetio potrebu da osnujem firmu. U momentu kad se pojavio taj projekat, ta potreba je postojala i ja sam tada registrovao firmu, bez ikakve ideje da ću nešto od nje praviti ozbiljnije, razmišljati o rastu.
Međutim, onda me to zainteresovalo, jer sam shvatio da sve te razne stvari koje sam radio u životu – konsalting, edukacije, treninzi, pa i posao vezan Wikidata, koji je oduzimao pregršt vremena – centralizujem i počnem da se njima bavim kao jednim poslom, kao firma.
Otuda sam slučajni preduzetnik – ta igra mi se jednostavno u jednom trenutku dopala. Počeo da gradim DataKolektiv kao malu konsultansku kuću, koja dan-danas tako funkcioniše i radi.
Rano ste došli u kontakt sa računarima – bili ste u programiranju i studirali psihologiju. Obično psiholozi završe u HR službi ili postanu terapeuti, ali ste vi krenuli drugim putem.
Bila je to velika sreća. Sve je počelo neke 2010. godine, kada je počeo da se koristi termin Data Science. Mi smo se 90-ih zvali kvantitativni anlitičari i statističari, pa Data Mining na početku 21. veka, dok oko 2010. termin Data Science ulazi u upotrebu. Tada se dogodilo da su algoritmi i matematika, koji su prethodno igrali ulogu mahom u naučnim teorijama, dobili novu primenu.
Sreća se sastojala u tome da sam imao fundamentalno obrazovanje u pravom trenutku i u pravo vreme za stvar koja se tek pojavila na tržištu. Onda sam uzeo to da radim i shvatio da mogu da živim od nečega što me beskonačno interesuje i što bih radio i za badava. Da imam sve pare ovog sveta i da imam hobi, ja bih sedeo na internetu, tražio interesantne podatke, probleme, stvari koje me interesuju, i koristio metode Data Science da bih mogao ovaj svet što bolje razumem.
Zalomilo se da sam programer još od 80-ih godina, da sam završio gimnaziju usmerenog obrazovanja za matematičko-programerskog saradnika, programirajući od malih nogu kroz PASCAL i Fortran, da sam znao dovoljno matematike koju sam neko vreme i studirao, i da sam na psihologiji otkrio oblast kognitivnih nauka koja me je zainteresovala do te mere da 90-ih nisam radio skoro ništa drugo do proučavao je. Toliko okolnosti se poklopilo.
Šta je uticalo na to da neuronske mreže, o kojima postoje prilično stare teorije, zadobiju praktičnu primenu?
Ideje i osnove neuronskih mreža su prilično stare, svi su ti matematički modeli napredovali vremenom, a poslednje dve decenije se promenilo mnogo toga. Ono što se dogodilo je sledeće – poklopile su se tri stvari.
Prva stvar jeste razvoj matematičkog razumevanja nekih stvari, pre svega u teoriji matematičke statistike. Druga stvar jeste razvoj hardvera, koji je ubrzo čitav proces računskih operacija. Treća stvar jeste da se, od 80-ih pa na ovamo, ubrzano razvijaju baze podataka, oblast data inženjeringa sa njima, i sve više i više biznisa je osvešćeno da treba da imaju makar solidnu relacionu bazu podataka.
Te tri stvari su odredile pojavu nove profesije: Data Science, i tog momenta odjednom Machine Learning i Artificial Intelligence postaju buzzwords i interesantne svima. Koliko njih zaista i primeni te tehnologije i unapredi poslovanje njima – a uopšte nije pitanje da li je tako nešto moguće već samo hoće li se neko dovoljno oko toga potruditi – otvoreno je pitanje.
U prethodne dve godine dešava se revolucija sa veštačkom inteligencijom. Svi sve moraju da probaju, sve je magija i sve je fantastično. Otkud sad odjednom to?
Radi se o tome da je svima, koji su bili istraživači oblasti veštačke inteligencije, Sveti gral bilo pitanje kako rešiti komunikaciju čoveka sa mašinom na prirodnom jeziku. To je slučaj od 1950-ih, kada se prvi put pominje termin „veštačka inteligencija“ i otkad je Turing 1950. objavio i formulisovao tzv. Turingov test, koji je važio kao lakmus papir o tome da li je nešto inteligentno ili ne.
Tehnologija na kojoj danas počiva ChatGPT i svi njegovi konkurenti, a ima ih podosta, jeste tehnologija koja je otkrivena u Googleu 2017. godine. Šta je vodilo ka tome? Prvo, svest o tome da izgleda problem komunikacije na prirodnom jeziku može da se reši masivnim treningom, na ogromnim podacima, ogromnih neuronskih mreža, uz nekoliko tehničkih inovacija i trikova. Drugo, investicija u to, jer za pokretanja GPT potrebna je ogromna računarska moć – ergo, pozamašna finansijska sredstva.
Kada se pričamo o tome kako funkcioniše ChatGPT, u suštini se svodi na to da računanjem pretpostavlja šta je sledeća logična reč. Ali, godinama ranije je postojao T9 rečnik na mobilnim telefonima koji je prepoznavao koja je moguća sledeća reč. Zašto su današnji modeli toliko dobri?
Upravo zato što se ne bazira na pojmu rečnika na taj način na koji se tehnologije poput T9 bazirale. Vi u rečniku, kad pogledate reč, imate raznorazne odrednice, od korena reči do padeža.
Sistemi kao što je ChatGPT, kao što je Anthropic Claude, Google Gemini, Mistralovi modeli – sve to što zovemo generativna veštačka inteligencija – oni fundamentalno ne znaju ništa o jeziku, ne znaju jezička pravila. To ne znači da neće dati tačan odgovor na pitanje, recimo, šta je nominativ, ali to će učiniti bez ikakvog prethodnog razumevanja o zadatom pojmu.
Oni funkcionišu na statistiku, na to što prate, u ogromnim količinama teksta kojima se treniraju, koja se reč sa kojom drugom reču nalazi u kontekstu. Taj kontekst je definisan od toga da kažete da su reči na primer bile u istoj knjizi, da su štampane iste godine, do istog paragrafa, do iste rečenice, do istog položaja u rečenici i slično.
Još je banalnije od toga: ti sistemi uče da prate međusobne odnose tokena, delića reči, koji lingvistički posmatrano uopšte nisu nužno relevantni. Na primer, uopšte ne moraju da odgovaraju prirodnoj podeli na slogove reči u fonologiji nekog jezika. To je doslovce čista, ogromna statistička mašinerija koja odlično oponaša kako prirodni jezik izgleda „na površini“, dok duboko razumevanje jezika uopšte ne dotiče.
Ali, kako je moguće onda da ćemo svaki put dobiti drugu stvar na isti upit?
To se dešava iz tog razloga što postoje, u nekim fazama rada tih sistema, koraci koji se baziraju na uzimanju uzoraka, tzv. semplovanju.
Ako bismo pokušali da te mašine doteramo da rade besprekorno i uvek isto predviđaju, to bi uključivalo mnogo računskih operacija, sortiranja i cela stvar bi radila sporo, a treba da opsluži 100 miliona korisnika. Tu se pribegava trikovima. Jedan od njih je da se otprilike nađe što bolji nastavci neke rečenice i onda se on pruži korisniku. Zato je moguće da na isti upit ili prompt, kako to zovemo, vi dobijete odgovore koje su varijabilni, ali su fundamentalno slični.
Međutim, ovi sistemi boluju od tog jednog problema, a to je oni vama uvek nekako mogu (i moraju) da odgovore. Čak i kad je mogući nastavak neke rečenice malo verovatan, on može da bude trenutno najverovatniji u sistemu kako ga generativna AI vidi. Kad se “zakuca” u takvu situaciju, on će vam odgovarati nečim, prvim, najboljim što ima, a što to neće biti nužno tačno, a mi onda kažemo da AI halucinira.
Kada bismo mogli da napravimo da se ovi sistemi samo drže zadatih pravila i značanja definisanih u rečniku, doslovce, algoritmski, kao kod Pythona ili bilo kog programskog jezika, halucinacije se ne bi dešavale. Ali, još uvek ne znamo da smislimo takav sistem pravila.
Ono što će se dogoditi na kraju je, zapravo, da ćemo ući u hibridne veštečke inteligencije, koje će kombinovati ta dva sistema. To je, sada, inženjerski jako teško izvesti, ali je sledeći korak skoro nužno taj.
Možete li da objasnite šta je razlika između veštačke inteligencije i onog što sad imamo? Šta je pravi pojam veštačke inteligencije, a šta je generativni AI?
Komplikovano je odgovoriti na to. Do pre neku godinu imali smo diskusije oko toga da li je Turingov test dobar test za inteligenciju ili nije. Sedite ispred displeja i vodite dijalog, gde ako čovek ne može sa verovatnoćom većom od 50% da kaže ovo kuca drugi čovek ili ovo generiše mašina, smatra se da je ta mašina veštački inteligentna.
Pokazala se jedna stvar – mi možemo konstruisati sisteme koji prolaze Turingov test, a koji rade na čistu statistiku, markantno različito od prirodnog ljudskog uma koji definitivno manipuliše simbolima pored statistike i asocijacija, i sad znamo da ta Turingova definicija veštačke inteligencije više ne pije vodu. Ima nečega dubokog što ne razumemo o fenomenu prirodne inteligencije još uvek.
Da se vratimo na nauku o podacima. To je nešto što je potrebno svakome ko mora da donosi kompleksne odluke. Kako se to uči i ko su ljudi koji su dobri kandidati da uče o nauci o podacima?
Da pođemo od realnosti toga ko su Data Scientisti. Prvo, postoji razlika između Data Scientista i Data Analysta, ali ona zavisi od toga gde radite i negde će biti manje, a negde više izražena.
Posao Data Analyst je da iz podataka, kad ih prikupi, sprovede neku analizu i onda iznese neke zaključe i izveštava o tome menadžment, kolegu u drugom timu, klijenta, kupca, kome je god ta analitika potrebna.
Za razliku od njega, posao Data Scientista je da takvu analizu spakuje u kompletan softerski proizvod, automatizuje, i posluži kao deo neke aplikacije, recimo. Data Scientist je uvek i sofverski inženjer, dok Data Analyst ne mora da to bude.
Da li postoji razlika u nivou kompleksnosti i razumevanja?
Ne nužno. Zato i kažem, ta razlika je upitna. Pitanje je gde radite, kakva je firma, kakva je organizacija, kakav je kontekst.
Data Analyst može da bude izuzetno zahtevna pozicija, koja, na primer, zahteva kompletno matematičko obrazovanje i znanje, i još neke stvari za koje se očekuje da Data Scientist poseduje.
Data Scientist će napraviti sistem koji će automatizovano donositi odluke, dok će Data Analyst najčešće analizirati neku konkretno situaciju i reći trenutno o tome znamo to i to.
Kako se uči, kako se počinje i šta je potrebno imati kao osnovu?
Da bismo to razumeli, najbolje je da pogledamo realnost ko su ti ljudi, na tržištu. Uglavnom su dva backgrounda u igri: to mogu da budu ljudi koji dolaze iz pravca računarskih nauka i softverskog inženjeringa, koji u jednom trenutku shvate da postoji takvo usmerenje, koje im postane zanimljivo i požele da se time bave; druga grupa ljudi su oni koji su ponajviše školovani za neku drugu naučnu disciplinu u kojoj su počeli da se bave matematičkim analizama. Mogu da budu biolozi, farmaceuti, psiholozi, sociolozi, ekonomisti, itd.
U različitim oblastima je različit odnos prisustva te dva obrazovna backgrounda.
Dakle, tu matematika mora da se uči. Nivo matematike koji je potreban za Data Science jeste primenjena, inženjerska matematika, onakva kakva se u proseku, ja bih rekao, predaje na prve dve godine naših inženjerskih fakulteta.
Druga stvar je programiranje, programiranje, programiranje. Znači, mora da se kodira mnogo i da se stekne što više veštine u programiranju i projektovanju softverskih sistema.
Treća komponenta je to što se naziva domenskim znanjem. Može čovek da nauči sve to i da bude odličan u tome, ali na kraju, kad se bude razgovaralo o poslu, poziciji, morate da budete u stanju da razumete tržište na kome treba da radite. Teško je, na primer, mene kao kognitivnog psihologa zaposliti u razvoju veštačke inteligencije za autonomna vozila – takva pozicija zahteva izuzetna znanja fizike i mašinskog inženjeringa. S druge strane, prirodno je za nekoga sa mojom domenskom specijalizacijom da radi u oblastima u kojima suštinski podatke generišu ljudi, ljudsko ponašanje, njihova komunikacija. Za svakog postoji mesto pod Suncem u tom svetu, a poznavanje zanata je za sve zajedničko: matematika i softversko inženjerstvo.
To su te neke tri komponente i zato su, istorijski gledano, u ovim oblastima bolje prolazili ljudi iz posebnih nauka. Za njih je teže da nauče matematiku i programiranje, ali kada to pokupe, znaju kako to najbolje da iskoriste. Generalisti, kako nazivamo Data Scientist koji rade na osnovu poznavanja matematike i programiranja u najrazličitijim oblastima, mogu da rade dobro, ali retko daju vrhunske doprinose.
Kroz DataKolektiv vi već godinama radite edukaciju iz ovih oblasti. Neke stvari su besplatno dostupne u nekim osnovnim oblicima, neke stvari idu kroz kurseve, ali da li je to za svakoga?
DataKolektiv ima kurseva koji su namenjeni svima bez obzira na njihovo predznanje. To su kursevi AI koje sam počeo da razrađujem u poslednjih godinu dana, koji su upravo vezani za generativne veštačke inteligencije, jer mi je postalo jasno da su ti sistemi stigli do te granice da sad stvarno može da ih koristiti svako bez ikakvog predznanja.
Onda imamo dve stručne linije kurseva: jedna je upravo Analyst linija kurseva za analitičare; druga koja se zove Data Science Sessions, koja je intenzivan kurs koji traje 3 ili 6 meseci, zavisi u kom formatu se sprovodi. Može da se radi u programskom jeziku R, može da se radi u programskom jeziku Python. Taj kurs predstavlja temeljan uvod u Data Science i treba ga shvatiti kao intenzivnu pripremu za konkurisanje na entry level pozicije.
Šta je preduslov za taj kurs?
Srednjoškolska matematika, gimnazijska. Ne mora da osoba dođe navežbana, ali mora da razume šta je logaritamska, a šta eksponencijalna funkcija. Ne možemo da joj objašnjavamo šta je polinom, šta je vektor, jer to su sve stvari koje se uče u srednjoj školi. Za ovaj kurs osoba mora da bude pripremljena i ne prihvatamo sve. Ipak, za sve to mi imamo pripremljene repetitorijume tako da polaznici mogu da osveže svoja znanja.
Kako su kursevi nastali?
Upravo zato što sam čovek koji je iz nauke došao u te stvari, a ne iz inženjeringa, pritom sam godinama radio upravo u obrazovanju i u statistici, shvatio sam da sam stekao veštinu toga da te stvari objasnim ljudima jednostavno. Pošao sam od toga da napravim kurs za ljude koji su onakvi kakav sam ja nekada bio. Želim da dođu psiholozi, sociolozi, ekonomisti, politikolozi, biolozi, a ne nužno neko iz tehničko-matematičkog sveta. Ako sam uspeo ja i toliko mojih kolega, zašto ne pružiti šansu drugima. Mnogi ljudi iz društvenih nauka su danas vrhunski Data Scientist i okupiraju pozicije u vrhunskim kompanijama i startapima. Psiholozi su među najistaknutijima.
A analyst kursevi imaju niži entry level od mojih Data Science Sessions kurseva. Tu upravo očekujem ljude koji će mi reći R ili Python su moji prvi programski jezici. Najčešće se ne pojavljaju takvi ljudi, uglavnom znaju nešto malo, ali mogu da dođu ljudi kojima su to prvi programski jezici.
Ta dva kursa imaju dva različita cilja i različite su težine.
Osim edukacije, kroz DataKolektiv radite i konsultacije. U kojim slučajevima ste vi adresa na kojoj je potrebno potražiti pomoć i na kakvim tipovima projekata radite?
Recimo, globalna agencija za istraživanje tržišta, tehnološki prilično napredna u odnosu na konkurenciju, hoće da iskoristi u svom poslu generativni AI. Imaju neke ideje koje nisu doveli do kraja, treba im neko ko ima iskustva u tome da pogleda i da im kaže da li njihove ideje mogu da se realizuju.
Onda taj rad izgleda kao neka vrsta privremenog vođenja njihovih timova. Dođete, popričate sa njima i napišete im parče koda, koji onda neposredno primene na poslovni problem. Potom se vrate na proveru, sve dok se ne osamostale u jednom trenutku.
Najčešće tu onda završimo saradnju i kažemo: „OK, to je to, možete da gurate sami, više vam nismo potrebni.”
Da li radite i sa analognim biznisima koji žele da se digitalizuju na dobar način?
Naravno. Prvi korak obuhvata analizu posla. Sledeći korak jeste odluka oko toga da li vi hoćete u tehnološki razvoj da uđete tako što će neko eksterno da vas razvija ili hoćete interni tim. To sve zavisi od vrste posla, ali je uvek najbolja odluka interni tim.
Onda vam tražimo te ljude, komponujemo taj tim, obučavamo tim, ali i vas, jer vi ste ti koji donosite odluke i morate biti svesni toga što se dešava. Kada se to postavi, onda možemo pričati o tome šta se radi sa Data Science i mašinskim učenjem, i to traje od nekoliko meseci do godinu dana.
Šta je MAŠINERIJA i ko bi trebalo da se zainteresuje za nju i priključi?
MAŠINERIJA je istorijska posledica toga što neformalne veze i iskreno prijateljstvo među stručnjacima u ovim oblastima u Srbiji postoje od 2015. godine. Od grupe korisnika programskog jezika R, preko momaka koji su napravili Big Data Meetup i počeli da popularizuju Big Data sisteme u Srbiji.
MAŠINERIJA je osnovana u trenutku kad je naša scena potpuno zamrla, a to je bio moment pandemije. Kad se pandemija završila, ja sam preuzeo inicijativu da tu zajednicu ponovo povežem. Hteo sam da mlade i nove ljudi uvedemo tu zajednicu, a najbolji način da uradite tako nešto jeste da pokrenete događaje na kojima se zajednica okuplja.
Onda se dogodila još jedna istorijska okolnost – rusko-ukrajinski rat, gde je emigracija, pre svega ruskih stručnjaka, promenila našu scenu potpuno. Upoznali smo se sa njima, pozvali ih i počeli da funkcionišemo kao jedna zajednica, sa engleskim kao lingua franca.
Sa UNDP Srbija smo 2023. godine održali prvu značajnu stvar vezanu za generativnu veštačku inteligenciju u Srbiji, organizaciju jedne sjajne mini-konferencije o kojoj se izveštavalo i regionalno. Tu nas je ugostila inicijativa Digitalna Srbija. Rado nas ugoste i drugi prostori, ICT Hub, često smo u Startitu, sa kojima smo stari prijatelji sa kojima sarađujemo i u Novom Sadu.
Šta mislite, vezano za pitanje koje je veoma popularno danas, da li će nas veštačka inteligencija uništiti?
Sa svakom tehnologijom postoji ista rasprava. Sa veštačkom inteligencijom je ta rasprava zapaljivija, jer je ona simulacija nas samih i ima puno antropocentrizma i antropomorfizma u tome, svi prepoznajemo nešto pseudoljudsko u njoj, pa se, verovatno, zato nje više plašimo.
Ali, surova realnost svake tehnologije jeste – struja napona od 220 volti može da nas zagreje, da nam skuva ručak, na nju radi računar, a može i da nas ubije. Nuklearna energija može da napravi najefikasnije i ekološki najčistije elektrane, a termonuklearne bojeve glave mogu da ubiju milione ljudi za nekoliko sekundi.
Zato, kažem, odluka je apsolutno naša. Ako razvijete sistem veštačke inteligencije, ja se nadam jednog dana, mnogo moćniji od ovih koje imamo danas, prepustite mu da upravlja energetikom, saobraćajem, vojskom… Ne uspostavite li vid kontrole nad njim, onda može stvarno da bude svašta. Ali, to će biti posledica ljudske nebrige, a ne posledica veštačke inteligencije. Mi smo nju stvorili, mi možemo njoj da zabranimo stvari i to efikasno, tako da se nikada ništa loše ne desi. Do nas je. Bez čoveka u petlji, veštačka inteligencija sama po sebi ne može da zabrlja ništa bitno.
Autori
Pravnik u pokušaju, novinar i prevodilac po definiciji. Ljubitelj japanske kulture. Ospe se kad pročita nemogu i/ili neznam. Ume da izrecituje (ne tražite da peva ako vam je sluh mio) Barbaru od Žaka Prevera, na francuskom, bez akcenta, koju je nabiflao samo iz njemu znanih razloga.
Više o AleksandruVeć dvadeset godina se klackam između tehnologije, marketinga i preduzetništva. Savetovao sam najveće globalne brendove kada je digitalni nastup na lokalnom tržištu u pitanju. Danas i dalje savetujem neke globalne, ali i mnoge lokalne kompanije – kako male, tako i velike.
Više o IvanuNiz godina se bavi svim oblastima internet marketinga sa naglaskom na kopirajting, SEO i društvene mreže. Svoje iskustvo prenosi kroz predavanja vezana za različite oblasti internet marketinga fokusirajući se na praktičnu stranu koja je osnova uspešnog poslovanja.
Više o IvanuFotograf, videograf i petrolhead. Voli sve što ima točkove, a naročito Mazdu, kao i sve što ima elise, naročito ako ima i kameru. Govori tiho i nosi Nikon sa sobom.
Više o Vojislavu