Այսինքն, նկատի ունես անհատականացվա՞ծ: Էդ դեպքում պետք ա անընդհատ տարածքում մասնագետ պահել, ով տվյալ լեզվի լեզվակիր ա, պլյուս համակարգչային լեզվաբան: Էդ մասնագետը պիտի պատվիրատուի լեզուն սկզբում ուսումնասիրի, հենց իրա խոսքը ճանաչող համակարգ ստեղծի, ինչն էնքան էլ բարդ չի, եթե մենակ խոսքի ճանաչում ա պետք՝ հնչյունից բառի վերածում:
Որպեսզի համակարգը հարցը հասկանա (1) ու ադեկվատ պատասխան տա (2), հետևյալ փուլերով պիտի անցնի.
(1) հնչույթային->բառային-> իմաստային
(2) իմաստային -> բառային -> հնչույթային
Հիմա էս համակարգում հնչույթայինից բառային անցումն ամենահեշտն ա. ամեն լեզվի յուրաքանչյուր հնչույթ ունի մենակ իրան յուրահատուկ պարամետրեր, ինչն ակուստիկ սարքը գրանցում ա ու վերածում որոշակի միավորի (պարզության համար ասենք տառի): Էդ միավորների հավաքածուն էլ փնտրում ա գոյություն ունեցող բառարանում: Էս ամենը մի լեզվի համար մի քանի ամսվա գործ ա: Բայց հաշվի առնելով, որ հավանաբար տվյալ լեզվի լեզվակիր համակարգչային լեզվաբանն արդեն ունի իր լեզվի հնչույթային առանձնահատկությունները, կարա նույնիսկ ավելի կարճ լինի:
Հարցը բարդանում ա բառայինից իմաստայինի անցնելիս: Համակարգը պիտի հասկանա, թե էդ բառերի համակցությունն ինչ ա նշանակում: Դրա համար ինչքան շատ կոնտեքստ ունենա, էնքան լավ:
Հետո պիտի իր իմաստային մակարդակում հարմար պատասխան գտնի: Էստեղ statistic learning-ը բավական մեծ դեր ունի: Հետո պիտի իմաստը բառի վերածի: Սա էլ ա ահագին բարդ: Պիտի ընտրի ճիշտ բառեր տվյալ իմաստը լեզվի վերածելու համար: Նորից statistic learning: Բառից հնչույթի վերածումն էդքան դժվար չի, բայց էնքան լավը չի, ինչքան խոսքի ճանաչումը: Text to speech համակարգերից օգտվե՞լ ես: Ձայնը բավական ռոբոտային ա, շեշտերը, առոգանությունը և այլն ճիշտ տեղում չեն: Իհարկե, գնալով ավելի ա լավանում, բայց դեռ չի հասել բնականի:
Ամեն դեպքում, ոնց հասկացա վերջին գրառումներիցդ, դու ուզում ես իմաստային մակարդակը շրջանցել, բառայինից բառայինի անցնել՝ օգտվելով որոնողական համակարգերից: Սա անում են գուգլ-մուգլները: Բայց զրոյից ստեղծելն իմ պատկերացմամբ զահլա բան ա:
Էջանիշներ