AI-põhise masintõlke potentsiaal

Kui Google'i tõlge käivitati 2006. aastal – eesmärgiga kaotada globaalsed keelebarjäärid – see toetas ainult kahte keelt piiratud ennustavate algoritmidega. Kümme aastat hiljem, läbi 500 miljonit inimest kasutasid Google'i tõlget, tõlkides päevas üle 100 miljardi sõna 109 erinevasse keelde. Selline märkimisväärne hüpe automaattõlke vallas poleks olnud võimalik ilma kahe läbimurdelise tehnoloogiata: masintõlge (MT) ja tehisintellekt (AI).

Juhul, kui see jäi kahe silma vahele, on masintõlge tehisintellekti võimendamine, et tõlkida sisu automaatselt ühest keelest teise ilma inimese sisendile tuginemata. Tehisintellekt on masintõlketööstuse arengu keskmes.

Nüüd mõtlete kindlasti, milline on tehisintellekti roll masintõlgetes ja miks on sellel tõlketööstust nii häiriv potentsiaal? Tutvustame esmalt tehisintellekti rolli masintõlgetes.

Tehisintellekti roll masintõlkes

Kuigi tehisintellekt on olnud masintõlketööstuse arengu üks peamisi katalüsaatoreid, on oluline kõigepealt mõista, kus me praegu seisame. Tehisintellekt ja masintõlked on alles oma tehnoloogilises lapsekingades. Vaatamata märkimisväärsetele arengutele nõuab enamik masintõlkeid konteksti ja täpsuse osas inimliku järelevalve all. Seega ei asenda masinad niipea inimtõlkijaid. Teisest küljest aga ei suuda ükski inimtõlkija masintõlke kiirust ja läbilaskevõimet võrrelda.

Sellegipoolest pole tõlkemootorid kunagi olnud nii lähedal inimtõlkijate asendamisele, kuid on tänu kiiresti arenevale tehisintellekti valdkonnale siiski märkimisväärse koha saavutanud. Lihtsamalt öeldes aitab AI tõlkemootoritel saada targemaks, kogudes, analüüsides ja tõlgendades suuri andmekogumeid. Kuna keel areneb pidevalt, peavad tõlkemootorid pidevalt sammu pidama, et jõuda lähedale keeleüleste piiride kaotamisele. Niisiis, kuidas täpselt aitab tehisintellekt tõlkemootoritel pidevalt areneda?

Näiteks Google'i tõlge kasutab tehisintellekti ja süvaõpet, mida nimetatakse närvimasintõlketeks (NMT). See on masintõlkemeetod, mis kasutab tehisnärvivõrku, et ennustada sõnade jada tõenäosust. Seega õpivad AI-põhised tõlkemootorid lause sõna-sõnalt tõlkimise asemel selgeks tervete lausete tähenduse. Praeguseks on närvisüsteemi masintõlge masintõlgete jaoks kõige arenenum lähenemisviis, mis ületab grammatilise ja kontekstuaalse täpsuse poolest tunduvalt varasemaid reeglipõhiseid masintõlkemudeleid. See on sama tehnoloogia, mis annab teile telefoni sisestamisel täpsemaid soovitusi.

Sisuliselt on Google Translate'i AI-põhine närvivõrk võimeline sügavaks õppimiseks – täiustatud masinõppemeetodiks, mida kasutatakse ka isejuhtivates autodes ja näotuvastustehnoloogias. Masintõlke puhul kasutavad närvivõrgud miljoneid näiteid, et õppida ning aja jooksul täpsemaid ja loomulikumaid tõlkeid luua. Google'i närvivõrk tõlgib korraga terveid lauseid, mis on võimeline kodeerima lause semantikat, selle asemel et seda fraaside kaupa meelde jätta.

AI ja süvaõpe lõid tõlketööstuses paradigma muutuse, mille tulemuseks on kiiremad ja kulutõhusamad tõlked. Professionaalsed tõlkijad toetuvad üha enam masintõlketele, mis töötavad hästi teatud tüüpi tekstidega, mis nõuavad vähem teemateadmisi ja märkimisväärset järeltoimetamist. Vaatame nüüd tehisintellektil põhinevate masintõlgete mõningaid peamisi kasutusjuhtumeid ja seda, mis on tulevikus ees ootamas.

Tehisintellekt kaotab keelebarjääri

Neuraalsete masintõlkevõrkude edasiarendamisega lõid AI ja süvaõppe algoritmid arvukalt uusi automaatsete masintõlkete kasutusjuhtumeid. Selle tulemusena hakkasid paljud tööstused seda tehnoloogiat rakendama.

SDL valitsus – ülemaailmne keeletõlketehnoloogia uuendaja – kasutab oma masintõlkesüsteemi sotsiaalmeedia uudistevoogude reaalajas tõlkimiseks, et pakkuda valitsusele praktilisi teadmisi.

Tervishoiutööstus leidis kasu ka masintõlgetest, nagu Varikatus Rääkige rakendas selle esimese meditsiinitõlke rakenduse loomiseks. Canopy Speak väidab, et pakub tööstuses suurimat eeltõlgitud meditsiiniliste fraaside korpust. See võimaldab arstidel esitada oma mitte-ingliskeelsetele patsientidele küsimusi tekstist kõnesse tõlgete kaudu. Praegu pakub see ainult ühesuunalist suhtluskanalit.

Need on vaid kaks näidet ettevõtetest, kes toetuvad masintõlkele, kuid seda tehnoloogiat on kasutatud paljudes teistes tööstusharudes, sealhulgas e-kaubanduses, rahanduses, õigusvaldkonnas, tarkvaras ja tehnikas. The USA armee on isegi juurutanud võõrkeelte masintõlkesüsteemi mis pakub sõduritele masintõlkeid teksti ja kõne kaudu.

Kuigi tehisintellektil põhinevad masintõlked on juba kaotamas keeleüleseid keelebarjääre, on siiski vaja suuremat semantilist ja kontekstuaalset mõistmist. Järgmine tehisintellekti uuenduslaine toob tõenäoliselt kasutusele kohandatud terminoloogiasõnastikud, mida saab valida vastavalt tõlke tüübile. Kohandatud sõnastike taga on lootus, et need toovad suuremat täpsust tõlgete puhul, mis nõuavad suuremat teemateadmist. Tulevased närvivõrgud arendavad ka liikvel olevat masintõlkekoolitust, mis tähendab, et tõlkemootorid saavad tõlkeprotsessi ajal reaalajas õppida.

AIWORK on üks olulisemaid AI arendamisele pühendunud ettevõtteid. Selle plokiahelal põhinev tehisintellekti võrk ühendab tehisintellekti tõhususe inimekspertide resolutsiooniga, et luua andmekogumeid, mis muudavad tehisintellekti targemaks. AIWORKi avatud, rahvahulkade turg on spetsialiseerunud tehisintellekti masintranskriptsioonile, tõlkimisele ja veebivideote jaoks kvaliteetsete tehisintellekti metaandmete loomisele.

Viimased postitused külalisautorilt (Vaata kõiki)

Allikas: https://www.thecoinrepublic.com/2022/05/31/the-potential-of-ai-based-machine-translation-2/