Gadā laikā cer ierakstīt 1000 stundu teksta
Dziesmu un deju svētku nedēļā sociālās iniciatīvas "Balsu talka" organizatori aicināja Latvijas iedzīvotājus un jo īpaši svētku dalībniekus ziedot savu balsi jeb ierunāt piecus teikumus vietnē balsutalka.lv un tā sniegt savu ieguldījumu, lai mākslīgais intelekts ātrāk iemācītos "saprast" un komunicēt latviešu valodā. Iniciatīva nav beigusies, un šī gada laikā tās organizatoru mērķis ir savākt 1000 stundas ierunāta teksta.
"Lielākā daļa latviešu valodas runas datu, kas šobrīd pieejami, ko izmanto zinātniskās institūcijas un valodu tehnoloģiju uzņēmumi, nav brīvi pieejami, tas kavē plašākus pētījumus un inovācijas. Lai iegūtu pēc iespējas vairāk un daudzveidīgākus runas datus, nolēmām organizēt "Balsu talku"," skaidroja Auziņa.
Piedalīties aicināti dažāda vecuma cilvēki un ne tikai tie, kuriem latviešu valoda ir dzimtā – tekstu nolasīt aicināti arī tie, kuri latviešu valodu iemācījušies vēlāk dzīvē. Mājaslapā var redzēt, ka šobrīd ir ierunātas 127 stundas no 200 nepieciešamajām, pārbaudītas ir 62 no tām.
"Šobrīd norādītās nepieciešamās 200 stundas ir nākamais mērķis, bet principā gala mērķim limita nav – jo vairāk, jo labāk. Mēs vēlamies savākt 1000 stundas, ja tas būs izdarīts, situācija būs tāda, kā lielajām valodām – angļu vai vācu valodai," norādīja Dejus.
Datus latviešu valodas izpratnei varētu izmantot lielie pasaules uzņēmumi
Teksts, ko ierunāt, pašam nav jāmeklē un jādomā, mājaslapa iedos teikumu, kas jānolasa normālā balsī, kā runājam ierasti. Vēlams to pēc ieraksta pārbaudīt, vai nav kļūdu, vai kaut kas fonā neskan, vai nav sanācis pārteikties. Šādā gadījumā tekstu vajadzētu ierakstīt vēlreiz.
Visi ierakstītie teksti krājās datu bāzē un ir publiski pieejami, lai tos varētu izmantot gan pētnieki, gan tehnoloģiju uzņēmumi, kas grib attīstīt ar balsi darbināmus rīkus. Plānots, ka arī lielie pasaules uzņēmumi izmantos šos datus, lai dažādi rīki saprastu latviešu valodu un varētu tajā sazināties.
"Lai savāktu 1000 stundas, vajadzētu 10 000 cilvēku, kas katrs ierunā 100 tekstiņus. Šobrīd ir ap 2500 cilvēku, kas ir ierunājuši. Tas jau ir daudz, vairāk nekā igauņiem un lietuviešiem," norādīja Dejus.
Tekstu ierunāšana rada azartu
"Ja piecus teikumus ierunā, tu iekrīti azartā. Gribas vēl un vēl – paskatīšos, kas ir nākamajā teikumā, nākamajā lapā. Tā var būt kā spēle. Ja vēl atjaunos iespēju pārbaudīt tekstus, tad visu ierunāto var klausīties un mēģināt saklausīt kādu pazīstamu cilvēku. Arī teikumi ir ļoti dažādi un interesanti," piedalīties iniciatīvā mudināja Auziņa.
Vērtējot drošības riskus, Latvijas Atvērto tehnoloģiju asociācijas vadītājs, digitālās vides piekļūstamības eksperts Pēteris Jurčenko, norādīja, ka tie, piedaloties "Balsu talkā", ir visai nebūtiski, taču vienlaikus atzina, ka mūsdienās nevajadzētu paļauties tikai uz pazīstamu balsi vien.
"Ja tev zvana un drauga balss saka – ziedo, dod man naudu, vajag mēģināt autentificēt un pārliecināties, ka tas tiešām ir viņš. Vienlaikus par baidīšanos [piedalīties akcijā]. Tas balss daudzums, kas nepieciešams, lai uzģenerētu cita cilvēka balsi, nav vajadzīgs liels, un to var iegūt dažādos veidos, pat ja viņš nav ierunājis tekstu "Balsu talkā". Ir sociālie tīkli, var piezvanīt, parunāties pa telefonu. Ir pilns ar dažādiem veidiem, kā daudz vienkāršāk var tikt pie balss materiāla konkrētam cilvēkam, nekā mēģināt izvilināt un atrast starp "Balsu talkas" dalībniekiem," vērtēja Jurčenko.