Light snow -1.9 °C
C. 05.12
Klaudijs, Sabīne, Sarma
SEKO MUMS
Reklāma
Foto: Shutterstock

Ja tagad saņemat vēstuli svešvalodā vai atverat mājaslapu jums nesaprotamā valodā, tā vairs nav jānoliek malā.

Reklāma

To ātri vien var pārtulkot latviski. Divdesmit pirmā gadsimta trešajā desmitgadē diezin vai būs kāds, kurš nav vismaz dzirdējis par "Google Translate", "ChatGPT" vai "CoPilot" – mākslīgā intelekta sarunbotiem, kuri spēj gan sameklēt informāciju vispasaules tīmeklī, gan iztulkot tekstus no teju jebkuras pasaules valodas, gan pat, kā runā, palīdzot skolēniem un studentiem rakstīt esejas un projektus. Taču cik daudzi pamanījuši un pazīst mūsu pašu valodas tehnoloģiju platformā "Hugo.lv" mītošos virtuālos asistentus Zinti, Tomu, Signi un citus?

Gandrīz pirms pieciem gadiem Vita Vodinska, kura tobrīd bija Valsts kancelejas Tīmekļvietņu vienotās platformas projekta vadītāja, kādā seminārā poētiski – bet visai precīzi – salīdzināja valsts iestāžu mājaslapas ar ģimeni, kurā katrs ne tikai pērk un gatavo ēdienu atsevišķi no pārējiem, bet arī glabā to katrs savā ledusskapī. Iespējams, tagad jau aizmirsies, taču laikā, kad attīstījās internets, katra ministrija un tās padotības iestāde savu vietni patiesi attīstīja, rīkojot iekšējos iepirkumus, organizējot to tehnisko uzturēšanu un glabāšanu. Ir skaisti, ja iestādes mājaslapa atspoguļo tās savdabību, taču, kad runa ir par valsts pakalpojumiem, lietotāju ērtības tomēr vērtējamas augstāk. Navigācija dažādās retāk lietotās, bet nepieciešamās mājaslapās jau tāpat mēdz būt mulsinoša, īpaši gados vecākiem ļaudīm, kā arī cilvēkiem ar dažādiem funkcionāliem ierobežojumiem, kur nu vēl tad, ja burtiski katra izkārtota citādi un pat kontaktu sadaļa atrodas krasi atšķirīgās vietās.

2020. gadā noslēdzās teju divdesmit gadus ilgušais darbs pie valsts pārvaldes Tīmekļvietņu vienotās platformas ieviešanas. 

Tās gaitā ar dažādu Eiropas Savienības fondu palīdzību vairāki desmiti valsts pārvaldes iestāžu un Rīgas pašvaldība ieguva dizainiski vienotas, funkcionālas, pieejamības prasībām atbilstošas, un, kā sola izstrādātāji, drošas mājaslapas. Daļā no vairāk nekā 150 valsts iestāžu mājaslapām apakšējā labajā stūrītī ir ikoniņa ar zīmētu seju, uz kuras uzklikšķinot atveras teksts: "Es esmu iestādes X virtuālais asistents Y. Droši jautājiet, centīšos palīdzēt." Neuzkrītošā ikona ir pamanāmākais ambicioza valodas tehnoloģiju projekta simbols.

SIA "Tilde" valdes priekšsēdētājs Artūrs Vasiļevskis valodu tehnoloģiju uzņēmuma "Tilde" birojā prezentē mākslīgā intelekta risinājumus daudzvalodu digitālajai valdībai.

No "Valodu krasta" līdz "Hugo.lv"

Kultūras informācijas sistēmu centra direktora vietnieks digitālās attīstības jautājumos Jānis Ziediņš norāda, ka Latvijā valodu tehnoloģijas, pateicoties tādiem uzņēmumiem kā SIA "Tilde", var sacenties ar pasaules tehnoloģiju milžiem: "Mašīntulkošana – programmatūra, kas palīdz ātrāk un samērā labi iztulkot tekstus, pazīstama jau diezgan sen. Ap 2008. gadu radās ideja par nākamo soli – valodu intelekta tehnoloģiju centru "Valodu krasts" (šī projekta vietne joprojām ir aktīva un apskatāma. – Aut.), kas palīdzētu digitālajā vidē saglabāt un attīstīt latviešu valodu, kura nav prioritāte nevienam no lielajiem mašīntulkošanas modeļiem."

J. Ziediņš piebilst: finanšu krīzes laikā gadsimta pirmās desmitgades beigās šī ideja apstājusies, taču nav aizmirsta, un jau 2014. gadā izveidota pirmā platformas "Hugo.lv" versija. 

"Hugo.lv", kā lasāms tās mājaslapā, ir "Latvijas valsts pārvaldes valodas tehnoloģiju platforma, kas brīvi pieejama ikvienam Latvijas iedzīvotājam. Tā nodrošina automatizētu tulkošanu, runas atpazīšanu un runas sintēzi, kā arī dažādus rīkus daudzvalodu atbalstam e-pakalpojumos". Ugunskristības "Hugo.lv" piedzīvoja 2014. gadā, kad Latvija bija Eiropas Savienības prezidējošā valsts. Tobrīd tika piedāvāti tulkojumi no latviešu uz angļu valodu, kā arī atpakaļ, kas vēsturiski bijis spēcīgākais mašīntulkošanas pāris, tāpat arī uz krievu valodu un no tās. "Šo risinājumu prezidentūras laikā plaši izmantoja, Latvijas Nacionālajā bibliotēkā bija speciālas vietas, kur tulkot, rādītāji bija ļoti labi," piebilst J. Ziediņš.

Balstoties šajā pieredzē, pieņemts lēmums, ka jāievieš iespēja tulkot citās valodās, un šobrīd sarakstā ir visas ES oficiālās valodas, kā arī ukraiņu valoda. Turklāt šī "Hugo.lv" versija, kas darbojas kopš 2018. gada, jau balstīta neironu tīklā, līdzīgi kā milži – "ChatGPT" un citi. Protams, tekstu apjoms, kas izmantots latviešu versijas trenēšanā, ir par kārtu mazāks nekā tiem, atzīst J. Ziediņš, norādot, ka "Hugo.lv" izmantoti teksta rindu miljoni, kamēr lielajiem mākslīgā intelekta rīkiem teksta apjoms rēķināms rindu miljardos. 

Tomēr viņš norāda: "Vērtējums, kurš tulko labāk vai sliktāk, vienmēr būs subjektīvs." 

Vērtējot pēc savas pieredzes, varu teikt, ka cilvēkiem, kuri pieraduši lietot "Google Translate", pāreja uz "Hugo.lv" būs viegla: tiesa, tulkošana notiks mazliet lēnāk, toties rezultāts, īpaši tad, ja mērķa vai avotvaloda ir maza, bet teksts ne pārāk specifisks, būs kvalitatīvāks un uzticamāks. J. Ziediņš to skaidro ar faktu, ka "Hugo.lv" izstrādāta, domājot tieši par latviešu valodu, turklāt tā jaunākā versija savienota ar Eiropas Komisijas "eTranslation" pakalpojumu, kas uzlabo tulkojumu kvalitāti un precizitāti.

Reklāma
Reklāma

Par tulkojuma kvalitāti gan divas "Hugo.lv" lietotājas, kuras strādā valsts pārvaldē un nevēlējās nosaukt savu vārdu, sniedza krasi atšķirīgu viedokli. Viena no viņām, kuras darbojas ar kultūras mantojumu, atsūtīja vairākus diezgan nesenus tekstus. Tulkojums angļu valodā patiesi ir neveikls un redzams – tulkotājs neatpazīst daudzus latviešu īpašvārdus, cenšoties tos pārtulkot pēc saknes. Savukārt otra, kuras darbs pamatā saistīts ar juridiskiem tekstiem, slavēja, cik strauji attīstījusies tulkotāja funkcionalitāte, uzsverot, ka ikviens, kurš strādā ar "Hugo.lv", palīdz to apmācīt. Viņa norādīja – cilvēkam vēl aizvien jāpārlasa un jāpielabo jebkurš ar mašīntulkošanas programmu tulkots teksts.

Šādi izskatās projekta laikā papildinātā platforma "hugo.lv", kurā var bez maksas saņemt tulkojumus latviešu, visās ES oficiālajās valodās un vēl ukraiņu valodā.

Tomēr "Hugo.lv" ir diezgan būtiska priekšrocība – proti, atšķirībā no "Google Translate", "ChatGPT" un "CoPilot", tas nesaglabā tulkojamo tekstu. Tas īpaši svarīgi, ja runa par ierobežotas pieejamības dokumentiem. "Ir valsts iestādes, kurām aizliegts izmantot publiskos tulkotājus, līdz ar to nosedzam šo nepieciešamību. Protams, jebkurš interneta risinājums ir tik drošs, cik drošs tas var būt, ne jau velti interneta drošības konferencēs vienmēr atgādina – jautājums ir nevis par to, vai jūs uzlauzīs, bet gan kad," saka J. Ziediņš.

Var jautāt, vai vēl drošāk nebūtu izmantot tulkus – cilvēkus, kā tas darīts gadsimtiem ilgi? SIA "Tilde" biznesa attīstības direktors Kaspars Kauliņš uzskata – cilvēki nespētu nodrošināt visas mūsdienās nepieciešamās tulkošanas vajadzības: 

"Mašīntulkošanu izmanto visdažādāko dokumentu tulkošanā, tā palīdz ne vien tulkot dokumentus, 

bet, ja tehnoloģija integrēta saziņā – un īpaši valsts pārvaldei jādomā par starptautisko saziņu –, tad šīs tehnoloģijas var palīdzēt tūrismā, daudzvalodu pieredzes piedāvāšanā mūsu viesiem."

J. Ziediņš piebilst, ka 2008. gadā bijis pirmais straujais lēciens tulkošanas tehnoloģiju izmantošanā, savukārt otrs piedzīvots pavisam nesen, kovida laikā, kad "pēc rādītājiem skaidri varēja redzēt, kad ir lokdauns, kad cilvēki iet uz darbu vai skolu, kad neiet". Pēc pandēmijas beigām pieprasījumu līkne mazliet izlīdzinājusies, tomēr ar skaidri redzamu augšupejošu tendenci: gadā esot līdz pusmiljardam tulkošanas pieprasījumu.

Turklāt "Hugo.lv" ne tikai tulko, bet arī palīdz pārbaudīt tekstu pareizību latgaliešu rakstu valodā, nodrošina vieglās valodas sadaļu, kā arī sintezētās valodas pakalpojumus un runas atpazīšanas funkciju. Sintezētās valodas sadaļā lietotāji var izvēlēties starp trim versijām – sievietes, vīrieša un jaunieša balsi. Tās visas izklausās mehāniskas, taču pietiekami neitrālas.

Ar valodas atpazīšanas tehnoloģijas sadaļu ir sarežģītāk. K. Kauliņš norāda, ka ļoti populārs tās lietojums ir dažādu sēžu protokolu un kopsavilkumu veidošana, nākamo aktivitāšu plānošana. Tāpat šo tehnoloģiju iespējams izmantot publisko pasākumu transkribēšanai un subtitrēšanai, kas ir īpaši nozīmīga piekļūstamības kontekstā. Tomēr, piemēram, kvalitatīvi atšifrēt sarunu, kuras fonā ir cilvēka ausij netraucējoši, bet pastāvīgi trokšņi – kafijas automāta rūkoņa, mašīnu skaņas, attālas sarunas un tamlīdzīgi – "Hugo.lv" vēl nespēj.

Reklāma
Reklāma
Kultūras informācijas sistēmu centra projekta "Hugo.lv" vadītājs Jānis Ziediņš ar divreiz saņemtām (2019. un 2023. gadā) balvām "Platīna pele 2023" nominācijā "Valsts digitālā transformācija" rokās: "Tulkošanas tehnoloģiju izmantošanā pieprasījumu līkne ir ar skaidri redzamu augšupejošu tendenci: līdz pusmiljardam tulkošanas pieprasījumu gadā."

Garlaicīgs, bet uzticams?

Atzīstos: šad un tad mēdzu aicināt palīgā "CoPilot". Nē, ne lai radītu tekstus; drīzāk lai saprastu kādas frāzes kontekstu vai ātri savāktu apjomīgus datus. Man patīk arī sarakstē ar mākslīgo intelektu lietot pieklājības frāzes, sasveicināties un atvadīties – šajā saziņā patiesi var rasties ilūzija par cilvēcisku kontaktu. 

Taču jāņem vērā, ka līdzīgi cilvēkiem, arī mākslīgais intelekts mēdz gan kļūdīties, gan sameloties.

To nevar uz platformas "Hugo.lv" veidotie virtuālie asistenti, kurus jau pieminēju raksta sākumā un kuri "strādā" kopš 2020. gada nogales. Ne Valsts ieņēmumu dienesta (VID) Toms, ne e-paraksta Signe, ne Valsts kancelejas Zintis, ne kāds no pārējiem nav sarunu boti "ChatGPT" vai "CoPilot" izpratnē. Tie spēj atbildēt tikai uz ļoti konkrēti formulētiem, maksimāli vienkāršiem jautājumiem, un atbildēs nebūs nekādas individualitātes, bet gan pārsvarā saites uz likumiem, noteikumiem un skaidrojumiem vai kontaktiem. Izskaidrot likumus, noteikumus un informāciju, ja to pats nesaprotat, virtuālais asistents pagaidām vēl nespēs. Arī jautājumi jāformulē iespējami īsi, konkrēti un vienkārši, un pat tad varat saņemt atbildi, ka tas bijis pārāk sarežģīts.

Viens no spilgtākajiem virtuālo asistentu piemēriem ir VID, un, proti, visvairāk tieši 1. marta naktī, kad daudzi tūkstoši Latvijas iedzīvotāju vienlaikus cenšas iesniegt nodokļu deklarācijas. Tad VID virtuālajam asistentam Tomam tiekot uzdoti visdažādākie jautājumi, kas pārsvarā ir ļoti vienkārši – ko darīt, ja klients aizmirsis, kā pierakstīties elektroniskās deklarēšanās sistēmā, kā iesniegt ienākumu deklarāciju, kura poga kurā brīdī jāspiež.

Dažas iestādes šajā laikā arī atteikušās no sākotnējo virtuālo asistentu pakalpojumiem. Tā, piemēram, Uzņēmu reģistrs (UR) 2023. gada vasarā apturēja virtuālās asistentes Unas darbību. 

UR sabiedrisko attiecību speciāliste Agate Marta Šāvēja teic – tas izdarīts tādēļ, ka pieaugusi klientu konsultantu noslodze saistībā ar grozījumiem Komerclikumā. Tādēļ šie trīs klientu konsultanti, kas bija arī Unas treneri, atgriezās pie tradicionālās klientu konsultēšanas telefoniski. Pirms tam katru mēnesi Una veikusi vairāk nekā 400 sarunas, un šobrīd iestādē notiekot digitālā transformācija, tiekot apgūti jauni rīki, pētīts, kā iespējams attīstīt mākslīgo intelektu citā veidā.

Diemžēl, kaut gan tieši "Hugo.lv" iestāžu mājaslapām nodrošina arī tulkojumu vieglajā valodā, virtuālie asistenti sarežģītus tekstus vienkāršot nespēj. Iespējams, tāpat kā tulkošanas spraudņi valsts un pašvaldības iestāžu e-pastos, tas ir nākotnes jautājums. Tāpat, iespējams, virtuālie asistenti kādreiz spēs pieslēgties valsts iestāžu datubāzēm, lai pārbaudītu specifisku, tieši uz jautātāju attiecināmu informāciju. Taču šie risinājumi jāizsver, samērojot iespējamos ieguvumus un drošību, norāda J. Ziediņš.

Latvijā vai ārzemēs?

Interesanti, ka "Hugo.lv" patlaban "dzīvo" datu centrā Nīderlandē, kur iespējams nodrošināt tā ātrdarbībai nepieciešamās grafisko procesoru jaudas. J. Ziediņš uzsver – 

no drošības viedokļa nav lielas atšķirības, vai platforma izvietota Latvijā vai kādā citā ES un NATO dalībvalstī, un šo gadu laikā neesot konstatēti darbības pārrāvumi. 

Par tā pārcelšanu uz Latviju gan tiekot domāts un diskutēts, taču šādai rīcībai būtu kā ieguvumi, tā riski. Pie pēdējiem pieder arī tas, ka jaudīgu datu centru skaits un izvietojums Latvijā ir diezgan labi zināms. "Tādēļ, pat ja pārceļam platformu uz Latviju, jādomā par tās replikāciju," norāda J. Ziediņš. "Nebūs kritiski, ja apstāsies "Hugo.lv", taču tādā gadījumā arī citas sistēmas var darboties lēnāk."

Kāds man no tā labums?

Lāsma Gaitniece, žurnāliste, publiciste.

Lāsma Gaitniece, žurnāliste, publiciste: "Ja salīdzinu ar "Google Translate", tad noteikti "Hugo.lv" ir labāks, tas ir viennozīmīgi. Man ir vajadzīga angļu un krievu valoda – brālēns ir austrālietis, māsīca dzīvo Sanktpēterburgā, un vatsapa saziņā ar viņiem izmantoju "Hugo.lv" – protams, tie ir ikdienas teksti. Es gan arī vienmēr pārlasu rezultātu un reizēm jūtu, ka ir izmantots neīstais vārds. Tad mēģinu pateikt citādi, vienkāršāk, saīsināt teikumu. "Google Translate" tagad neesmu izmantojusi jau ļoti ilgi."

Agrita Sagalajeva, KISC projekta koordinatore.

Agrita Sagalajeva, KISC projekta koordinatore: "Kultūras informācijas sistēmu centrs jau pusgadu intensīvi iesaistīts liela mēroga Eiropas projektā "Bibliotēku tilti: trešo valstu valstspiederīgo integrācijas un iekļaušanas veicināšana Eiropā, izmantojot Bibliotēkas un vietējās partnerības". Šajā projektā ir liels dokumentu apjoms, pētījums par trešo valstu pilsoņu integrācijas pieredzi Latvijā, un šo dokumentu tulkošanai pieslēdzu "Hugo.lv". Protams, tulkojumi ir jāpārskata, taču esmu ļoti apmierināta ar to kvalitāti. Pašai iztulkot visu šo apjomu būtu ļoti sarežģīti."

Projekta rezultāti

  • Izstrādāta Latvijas e-pārvaldes mašīntulkošanas platforma, par pamatu izmantojot esošo e-pārvaldes mašīntulku HUGO.
  • Iedzīvotājiem nodrošināta bezmaksas informācijas tulkošana.
  • Pilnveidots publiskais pakalpojums "Publiskais mašīntulks" ("hugo.lv").
  • Pieejamo valodu skaits palielināts līdz 24 ES oficiālajām valodām.
  • Uzlaboti valodu korpusi un pielietota precīzāka publiskās pārvaldes terminoloģija.
  • Izstrādāts publiskais pakalpojums "Sapulču runas atpazinējs", automatizējot audioierakstu transkribēšanas procesu latviešu valodā.
  • Iedzīvotājiem ar redzes traucējumiem izstrādāts runas sintēzes pakalpojums (automatizēta teksta pārveide uz runu).
  • Izveidots specializēts mašīntulks publiskās pārvaldes iestādēm ar plašāku valodu korpusu un augstāku informācijas aizsardzības līmeni.
  • Izveidota tulkošanas atmiņa – datu krātuve tulkojamajiem un mašīntulkošanas risinājuma iztulkotajam tekstam, kā arī ieteiktajiem tulkojumu variantiem.

AVOTS: CFLA

Ieguldījums izaugsmei.

Eiropas Savienības finansēts. Paustie viedokļi un uzskati atspoguļo autora personīgos uzskatus un ne vienmēr sakrīt ar Eiropas Savienības vai Eiropas Komisijas viedokli. Ne Eiropas Savienība, ne Eiropas Komisija nenes atbildību par paustajiem uzskatiem. #ieguldījumsizaugsmē

Reklāma
Reklāma
Reklāma
LASI.LV galvenais redaktors Jānis Žilde.

Redaktora vēstkopa

Pieraksties vēstkopai un reizi nedēļā saņem padziļinātu LASI.LV galvenā redaktora ziņu, viedokļu un interviju apkopojumu.

Pieraksties šeit

Redaktora vēstkopa

Pieraksties vēstkopai un reizi nedēļā saņem padziļinātu LASI.LV galvenā redaktora ziņu, viedokļu un interviju apkopojumu.

Pieraksties šeit
PAR SVARĪGO
Reklāma