Latvijas pētnieki publicējuši pasaulē pirmo mākslīgā intelekta modeli, kurā līdzvērtīgi pārstāvētas latviešu un citas Eiropas valodas. Valodu atbalsta un drošības ziņā jaunais modelis sekmīgi konkurējot ar ASV un Ķīnas tehnoloģiju milžiem.

Reklāma

Atvērtā koda modelis "TildeOpen" ļauj veidot daudzveidīgus MI pakalpojumus, kas teicami darbosies arī latviešu un citās mazāk pārstāvētās valodās. Šis unikālais modelis, kura izveidi Eiropas Komisija uzticējusi Latvijas uzņēmumam "Tilde", ir brīvi pieejams jebkuram interesentam.

"TildeOpen" izstrāde kļuva iespējama pēc "Tildes" uzvaras Eiropas Komisijas konkursā "Mākslīgā intelekta lielais izaicinājums", kas ļāva 12 mēnešus izmantot jaudīgāko Eiropas superdatoru LUMI Somijā. Modeļa apmācībai tika atvēlēti divi miljoni superdatora stundu. Modeli radījusi "Tildes" pētniecības laboratorijas zinātnieku komanda ar deviņiem zinātņu doktoriem un plašu starptautisku pētniecības pieredzi.

Modelim "TildeOpen" ir 30 miljardi parametru, un tas ir apmācīts ar simtiem miljardu vārdu no visām Eiropas valodām. Latviešu valodas apmācībai izmantoti 29 miljardi vārdu, kas ir lielākais zināmais datu apjoms, kāds jebkad izmantots mākslīgā intelekta izstrādē. "Lietojot populāros mākslīgā intelekta modeļus latviešu valodā, redzam gramatiskas kļūdas un neveiklas frāzes, jo tie galvenokārt apmācīti angļu valodā. "TildeOpen" ir veidots pēc citiem principiem, lai visas Eiropas valodas tajā būtu līdzvērtīgas, tāpēc rezultāts ir daudz kvalitatīvāks," skaidro "Tildes" vadītājs Artūrs Vasiļevskis.

Pirmie testi liecina, ka latviešu valodā "TildeOpen" darbojas par 41% efektīvāk nekā populārais modelis "LLaMA-3" un par 24% labāk nekā "GPT-4o". 

Pielāgots tulkošanas uzdevumam, "TildeOpen" spēj tulkot tekstus būtiski labāk nekā salīdzināma izmēra "GPT-4.1" modeļi un strādā ne sliktāk par 60 reizes lielāko supermodeli, uz kā balstās "ChatGPT". 

Modelis izstrādāts saskaņā ar ES mākslīgā intelekta regulējumu un atbalsta visas 24 ES oficiālās valodas, kā arī ukraiņu un citas kandidātvalstu valodas. Atšķirībā no globālajiem modeļiem, kas parasti darbojas ASV vai Āzijas datu centros, "TildeOpen" var izvietot lokālos serveros vai Eiropas mākoņkrātuvēs, nodrošinot datu glabāšanu ES robežās saskaņā ar Eiropas datu aizsardzības standartiem.

"TildeOpen" ir brīvi pieejams platformā "Hugging Face", un to var izmantot valsts iestādes, uzņēmumi, zinātnieki un studenti, lai veidotu pielāgotus MI risinājumus – no informācijas apstrādes un klientu apkalpošanas līdz izglītības un kultūras projektiem. "Mūsu mērķis bija pierādīt, ka arī Latvijā iespējams radīt pasaules līmeņa mākslīgā intelekta tehnoloģijas. "TildeOpen" ir nozīmīgs solis pretī latviešu un citu mazāku valodu digitālajai līdztiesībai," uzsver Vasiļevskis.

Izvēlies savu soctīklu platformu, lai sekotu LASI.LV: Facebook, X, Bluesky, Draugiem vai arī Instagram. Pievienojies mūsu lasītāju pulkam, lai saņemtu īpaši tev atlasītu noderīgu, praktisku un aktuālu saturu. 

Tikai tagad -35% atlaide Gada abonementam. Kods: LASIAKCIJA. Akcijas cena 19,49 eur. 

Abonē ŠEIT

Pieraksties LASI.LV redaktora vēstkopai šeit.

Pieraksties vēstkopai un divas reizes nedēļā saņem padziļinātu LASI.LV galvenā redaktora aktuālo ziņu, kompetentu viedokļu un interesantāko interviju apkopojumu.

Ko tu saņemsi:

  • Daudzveidīgus komentārus un kompetentus Latvijas Mediju žurnālistu un autoru viedokļus par aktuālo
  • Ekspertu komentārus par dažādiem praktiskiem, noderīgiem tematiem
  • Aizraujošus materiālus par vēsturi, psiholoģiju, kultūru
  • Gata Šļūkas karikatūru
  • Tavā e-pasta kastītē katru ceturtdienu