2026 m. gegužės 19 d.

Dirbtinis intelektas bręsta: nuo haliucinacijų iki agentų

Analitinis esė apie dirbtinio intelekto amžių

Roman Z., rizikos kapitalo rinkos analitikas, Raison

Prieš ketverius metus ChatGPT tapo viešai prieinamas. Tuo metu visi turėjo du pagrindinius klausimus apie dirbtinį intelektą: kodėl jis taip dažnai klysta – ir ar jis mus pakeis? 2026 m. jau žinome atsakymus į abu.

Įžanga

Pastaraisiais metais žmonija gyvena technologinės revoliucijos laikotarpiu: dirbtinis intelektas įžengė į mūsų gyvenimus. Kaip ir daugelis ankstesnių technologijų, DI buvo sutiktas nevienareikšmiškai.

2022 m. ChatGPT tapo viešai prieinamas. Net pirmoji versija galėjo atsakyti į klausimus, rašyti kodą ir tekstus, padėti atliekant tyrimus. Visa tai dabar atrodo savaime suprantama – neuroniniai tinklai šias užduotis atlieka aukštu lygiu. Tačiau 2022 m. jo kompetencija kėlė daug skeptiškų nuomonių.

Iliustracija: ChatGPT (OpenAI)

To laikotarpio žiniasklaida gerai atspindi to meto dvilypumą. The New York Times ir The Guardian rašė apie tą patį: įspūdinga, kad mašina gali palaikyti pokalbį kaip žmogus. Tačiau ta pati mašina gali pateikti įtikinamą, bet visiškai klaidingą informaciją.

ChatGPT gerai susidorojo su paprastomis užduotimis, tačiau sunkiai sekėsi su sudėtingesnėmis. Tai ypač išryškėjo programavime: neuroninis tinklas sugeneruodavo tiek daug neteisingų sprendimų, kad Stack Overflow, didžiausias IT forumas pasaulyje, uždraudė skelbti DI sukurtus atsakymus. Vis dėlto potencialas buvo akivaizdus visiems, kurie stebėjo situaciją.

NYT rašė, kad galimos ChatGPT poveikio visuomenei pasekmės yra per plačios, kad tilptų į vieną straipsnį. Vieni teigė, kad tai – visų žinių darbuotojų profesijų pabaigos pradžia. Kiti manė, kad visa tai bus pamiršta per metus.

Praėjo ketveri metai. Abi stovyklos klydo, ir abi buvo teisios. Pažvelkime į tai plačiau.

1 skyrius. DI pasiekimai

Pagrindinė neuroninių tinklų kliūtis visada buvo išvesties kokybė. Ankstyvosios versijos kentėjo nuo „haliucinacijų“ – reiškinio, kai modelis sugeneruoja įtikinamai skambantį, bet faktiškai neteisingą tekstą.

Technologija nestovėjo vietoje. Nauji mokymo metodai, samprotavimo grandinės, švaresni duomenų rinkiniai, grįžtamojo ryšio ciklai su vartotojais ir kitais neuroniniais tinklais – visa tai lėmė didžiulę pažangą. Viešai prieinamas haliucinacijų reitingas rodo akivaizdų skirtumą tarp modelių kartų. GPT-o3-pro – to meto flagmanas – generuodavo apie 23 % haliucinacijų. ChatGPT 5.4-nano, dabartinės kartos mažesnis modelis, – 3,4 %. Jei anksčiau kas ketvirtas atsakymas turėdavo faktinių klaidų, dabar – tik vienas iš dvidešimt devynių.

Tuo pačiu metu buvo sprendžiama ir kita problema: sąveika su išoriniu pasauliu. 2022 m. buvo tik pokalbių langas. Jei reikėjo užklausti duomenų bazės, reikėjo pačiam mokėti SQL, susikurti duomenų bazės ryšį, suprasti schemą ir tiksliai paaiškinti užduotį neuroniniam tinklui. Laikas, sutaupytas DI rašant kodą, dažnai būdavo nereikšmingas.

Iliustracija: Claude (Anthropic)

Dabar įžengėme į agentinio DI erą. Atsirado tokie protokolai kaip MCP (Model Context Protocol – standartas, leidžiantis DI agentams jungtis prie išorinių paslaugų, duomenų bazių ir įrankių be žmogaus įsikišimo), o įmonės pertvarkė savo procesus ir programinę įrangą pagal integracijos galimybes. Rezultatas: verslo analitikui net nereikia žinoti, kas vyksta „po kapotu“. Jis tiesiog suformuluoja užklausą – o agentas surenka duomenis, atlieka preliminarią analizę, sudaro grafikus ir parengia pristatymą.

Tai labiausiai matyti programinės įrangos inžinerijoje. DI dabar gali savarankiškai analizuoti, redaguoti ir rašyti kodą visiems projektams, automatiškai kurdamas „pull request“ GitHub platformoje. Tai sukėlė netikėtą problemą: tokių užklausų dabar tiek daug, kad atvirojo kodo kūrėjai fiziškai nespėja jų visų peržiūrėti. Jeff Geerling, žinomas atvirojo kodo kūrėjas ir vieno populiariausių „YouTube“ kanalų apie infrastruktūrą ir DevOps autorius, išsamiai rašo apie šią problemą. Didelė dalis DI sugeneruotų „pull request“ yra nekokybiški: programavimas tapo prieinamas žmonėms, kurie nemoka tinkamai suformuluoti užduoties.

Vis dėlto haliucinacijų ekonominės pasekmės išlieka realios. Fourdots skaičiuoja nuostolius, patiriamus vien tik dėl DI faktų tikrinimo – ir skaičiai nėra menki. DI sugeneruoto kodo klaidų taisymas vis dar kainuoja valandas, kurios neturėjo būti prarastos.

DI vis dar reikia žmogaus, kuris apibrėžtų problemą. Tačiau kai parašomas kokybiškas užklausos tekstas, belieka stebėti, kaip agentas per kelias minutes atlieka tai, kam anksčiau inžinieriui prireikdavo valandų. Programuotojas-blogeris Teo.gg detaliai aiškina, kaip pasikeitė programinės įrangos kūrimas – rekomenduojame pradėti nuo 20 minutės.

Programavimas tapo prieinamas žmonėms, kurie nemoka tinkamai suformuluoti užduoties.

Išskirtinė istorija – saugumas. Anthropic paskelbė apie Claude Mythos, modelį, skirtą kodui ir kibernetiniam saugumui, tačiau jo viešai nepaleido. Pranešta, kad paleidimas bus atidėtas. Per Project Glasswing paaiškėjo, kad modelis toks efektyvus ieškant ir išnaudojant pažeidžiamumus, jog Anthropic nusprendė pirmiausia jį pristatyti tik patikimų įmonių grupei: joms reikia laiko apsaugoti savo infrastruktūrą, kol tomis pačiomis technikomis nepradės naudotis įsilaužėliai.

Beje, Stack Overflow dabar beveik užsidaro. Jį išstūmė neuroniniai tinklai.

2 skyrius. Mūsų nepakeis

Taigi DI tampa vis tikslesnis ir geriau sąveikauja su išoriniu pasauliu. Kada jis pradės atimti darbo vietas?

MIT neseniai atliko didelio masto tyrimą, kiek specialistų DI gali pakeisti. Užduotis pasirodė sudėtinga: darbo vietos labai skiriasi. Jei skaičiuotume tik tas pozicijas, kurias DI gali visiškai pakeisti, vaizdas stebėtinai nuosaikus – apie 2 % JAV darbo rinkos.

Tyrėjai žengė toliau. Naudodamiesi oficialiu JAV Darbo statistikos biuro registru, jie suskirstė darbo skelbimus pagal įgūdžius, atsižvelgdami į sudėtingumą ir paklausą. Tuomet sudarė sąrašą įgūdžių, kuriuos DI jau geba atlikti, ir palygino abu duomenų rinkinius.

Rezultatas buvo pavadintas Ledkalnio indeksu. Visiškai DI pakeičiamos darbo vietos – tik ledkalnio viršūnė. Įskaitant dalinį pakeitimą, iki 11 % darbo rinkos patenka į DI įtakos sritį. Straipsnio preprintą rasite ResearchGate, o Economics Explained aiškiai paaiškina tyrimo esmę.

Svarbu suprasti, kam tokie tyrimai iš tikrųjų skirti. Jie nėra skirti gąsdinti dėl nedarbo. Visi rinkos dalyviai turi suprasti, kur ir kaip juda DI. Būsimi absolventai – kad galėtų tikslingai rinktis studijų kryptis. Vadovai – ne tam, kad skubėtų atleisti darbuotojus, o kad DI diegtų apgalvotai, ten, kur jis iš tikrųjų stiprina komandą. Pačios DI įmonės – kad suprastų, kokioms užduotims ruošti savo modelius.

Visi rinkos dalyviai turi suprasti, kur ir kaip juda DI

Tyrimo išvada atitinka tai, kas jau kurį laiką tvyro ore: DI mūsų nepakeis, greičiau papildys. DI įgūdžių sąrašas nuolat plėsis, tačiau darbo vietų mažėjimas nebus proporcingas. Daug didesnė darbo dalis tiesiog puikiai papildoma neuroniniais tinklais: jie išlaisvina darbuotojus nuo rutinos ir leidžia per tą patį laiką nuveikti daugiau.

Technologija tobulėja, tik ne mūsų sąskaita

Straipsnio pradžioje išskyriau dvi 2022 m. dominavusias nuostatas: „DI nesusitvarko su užduotimis, nors potencialas akivaizdus“ ir „DI greitai pakeis biurų darbuotojus, laukia nedarbas“. Abi skamba pesimistiškai. Tačiau žvelgiant į jas kartu, 2026 m. kontekste – jos iš tiesų suteikia optimizmo.

DI mūsų nepakeis, greičiau papildys

Taip, DI pakeitė pasaulį – daugeliu aspektų, kurių neįmanoma sutalpinti į vieną straipsnį. Taip, jis veikia darbo rinką. Tačiau ne tiek pakeisdamas žmones, kiek juos papildydamas. Tai vis dar matyti įdarbinime: patyrę darbuotojai dabar susitvarko su didesniu darbo krūviu, o naujų darbuotojų poreikis mažėja. Tačiau DI – toli gražu ne vienintelė to priežastis, o jaunesni žmonės, kaip taisyklė, lengviau prisitaiko prie naujų technologijų.

Taip, DI vis dar netobulas. Svarbiausių sprendimų jam patikėti negalima. Tačiau jo galimybės sparčiai augs – tiek džiuginančiomis, tiek nerimą keliančiomis kryptimis.

Iliustracija: Gemini (Google)

Dvilypumas diskusijose apie DI niekur nedingo. Jis tiesiog subrendo. Nebejuokaujame apie neuroninius tinklus, kalbančius nesąmones. Dabar jie daro įtaką darbo rinkoms ir akcijų kainoms. Vienas žmogus su neuroniniu tinklu dabar gali per savaitę išspręsti daugiau svarbių užduočių nei bet kada anksčiau – ir tai tik pradžia.

Iliustracijas sukūrė trys skirtingi DI modeliai, naudojant tą patį užklausos tekstą, kad būtų galima palyginti, kaip kiekvienas interpretuoja tą pačią užduotį.

Šis straipsnis buvo parašytas pasitelkus Gemini ir Claude.

Ar šis straipsnis buvo naudingas?

876 peržiūros

DALINTIS: