«Hugo.lv»: Mašīntulkošanā kvalitāte uzlabojas, taču dzeju tulkot vēl nevarēs

Pievērs uzmanību – raksts publicēts pirms 6 gadiem.

Mašīntulkošanā jeb automātiski tulkoto tekstu kvalitāte arvien uzlabojas, taču dzeju tuvākajos gados šādi tulkot nevarēs, un šie mašīntulki cilvēkus tulkus arī neaizstās. To intervijā Latvijas Radio atzina mašīntulkošanas platformas "Hugo.lv" pilnveidošanas projekta vadītājs Jānis Ziediņš.

Pēc viņa teiktā, "Hugo.lv" atšķirība no "Google" un citiem lielajiem automātiskajiem tulkotājiem ir tā , ka spēj latviešu valodas tulkotāju tieši piemērot latviešu valodai, mūsu risinājumiem un vajadzībām.

"Jo lielajiem spēlētājiem mazās valodas ļoti reti interesē tādā padziļinātākā veidā. Jo latviešu valodā runā divi miljoni iedzīvotāji visā pasaulē, līdz ar to viņiem tas tirgus nešķiet tik interesants. Tāpēc mēs, "Hugo.lv", esam izveidojuši un, domāju, ar labiem rezultātiem," teica Ziediņš.

"Hugo.lv" pārstāvis: Mašīntulkošanā kvalitāte uzlabojas, bet dzeju vēl tulkot nevar
00:00 / 16:16
Lejuplādēt

Pēc viņa teiktā, mašīntulks nav domāts literāru tekstu tulkošanai un tuvākajos gados, piemēram, dzejas tekstus netulkos. "Mēs vienmēr sakām to, ka mašīntulks ir, lai ātri iepazītos ar informāciju.

Ja pāris gadus atpakaļ bieži vien bija tā, ka tekstu vispār pat neiztulkoja, tad tagad mašīntulki principā tulko visu tekstu un tā kvalitāte arvien uzlabojas," sacīja Ziediņš.

Jauno neirona tehnoloģiju ieviešana, lai mašīntulkam būtu "mazliet sava domāšana", prasa ļoti lielus resursus - gan tehnoloģiski, gan saturiski. "Tā kā tas vēl ir tikai tādā sākuma stadijā," sacīja "Hugo.lv". 

Viņš piekrita, ka pašlaik mašīntulks vairāk tiek izmantots, lai ātri un ar nelieliem resursiem saprastu, par ko tekstā citā valodā ir runa. Uz latviešu valodu ar mašīntulku tulkotie teksti pašlaik ir mazliet neveikli. Tāpēc ir nepieciešams "lielais latviešu valodas korpuss", kur vienā failā savākti teksti un sadalīti pa teikumiem.

Lielais korpuss, pēc Ziediņa teiktā, sadalās mazākos korpusos, piemēram, pa nozarēm. Piemēram, ir normatīvo aktu korpuss, kas vairāk domāts likumu tulkošanai. Plānots veidot speciālu kultūras jomas korpusu.

"Jo redzam to, ka mūsu kultūras digitālā informācija ir ļoti maz iztulkota citās valodās, piemēram, angļu valodā, jo tas prasa lielus līdzekļus.

Bet mēs jau esam veikuši testus un redzam, ka, izveidojot šādu speciālu korpusu, mēs varam padarīt savu kultūru pieejamu daudz, daudz plašāk un automātiski," atzina Ziediņš.

Šis projekts, pēc "Hugo.lv" pārstāvja teiktā, ļoti ieinteresējis Eiropas digitālo bibliotēku "Europeana". "Jo līdz šim neviena valsts īsti to vēl nav darījusi tādā veidā, ka tiek piedāvāti mašīntulka tulkoti teksti angļu valodā."

Jau ziņots, ka sestdien, 13 . maijā, tiek atzīmēta Valsts valodas diena. Tās mērķis - radošā un mūsdienīgā veidā svinēt to, ka mūsu valsts valoda ir latviešu valoda. Par latviešu valodas nozīmi mūsdienās runāts tiek daudz, it īpaši par latviešu valodu digitālajā vidē. Tur nozīmīgu lomu spēlē automātiskā tulkošana jeb mašīntulkošana.

Kļūda rakstā?

Iezīmējiet tekstu un spiediet Ctrl+Enter, lai nosūtītu labojamo teksta fragmentu redaktoram!

Iezīmējiet tekstu un spiediet uz Ziņot par kļūdu pogas, lai nosūtītu labojamo teksta fragmentu redaktoram!

Saistītie raksti

Vairāk

Svarīgākais šobrīd

Vairāk

Interesanti