PDA

Դիտել ողջ տարբերակը : Խոսքի ճանաչում (Speech Recognition)



Գաղթական
29.01.2017, 23:39
Նախագծման փուլում գտնվող մի սարքի համար անհրաժեշտ է ստեղծել Speech Recognition համակարգ:

Քանի որ բավական հեռու եմ Computational Linguistic-ից, ոլորտին ծանոթներից խնդրում եմ օգնել հասկանալ.
ա) հատկապես ի՞նչ մասնագետ(ներ)-ի է անհրաժեշտ փնտրել (ո՞ր ծրագրերով աշխատող)
բ) մոտավոր որքա՞ն ժամանակ կպահանջվի խնդիրը լուծելու համար
գ) որքա՞ն գումար կարող է դա արժենալ
դ) (սիրողական հարց) ինչպե՞ս պիտի տեղակայվի համակարգը սարքի մեջ (եթե պլատայի կամ չիպի տեսքով, ապա ի՞նչ մեծության)
ե) ինչպե՞ս են պաշտպանվում նման համակարգերի հեղինակային իրավունքները

առայժմ այսքանը ))
նախորոք շնորհակալ եմ

Աթեիստ
30.01.2017, 00:00
Ո՞ր լեզուն ա ճանաչելու։

Sent from my P8000 using Tapatalk

StrangeLittleGirl
30.01.2017, 00:06
Կարծում եմ՝ զրոյից ստեղծելը բավական զահլա ու տարիներ պահանջող գործ ա: Պիտի որ հնարավոր լինի առնել տվյալ լեզվի համար արդեն գոյություն ունեցող համակարգ:

Գաղթական
30.01.2017, 00:31
Ո՞ր լեզուն ա ճանաչելու։

Sent from my P8000 using Tapatalk



սկզբի համար՝ սարքի մի քանի սերիա՝ առանձին լեզուների համար.
առաջին ալիք - անգլերեն, ֆրանսերեն, գերմաներեն
երկրորդ ալիք - իսպաներեն, հոլանդերեն, ռուսերեն
...

Գաղթական
30.01.2017, 00:35
Կարծում եմ՝ զրոյից ստեղծելը բավական զահլա ու տարիներ պահանջող գործ ա: Պիտի որ հնարավոր լինի առնել տվյալ լեզվի համար արդեն գոյություն ունեցող համակարգ:



գիտեմ, որ շատ սարքեր ու սմարթֆոնի հավելվածներ հղում են կատարում մասնավորապես Amazon-ի գոյություն ունեցող համակարգին (հավանաբար՝ վարձակալության հիմունքներով), բայց մեր սարքը պիտի հնարավորության ունենա գործել օֆֆլայն ռեժիմում, այսինքն՝ անկախ..

կարծում ես վաճառքում կլինի՞ նման փաթեթ

StrangeLittleGirl
30.01.2017, 01:34
գիտեմ, որ շատ սարքեր ու սմարթֆոնի հավելվածներ հղում են կատարում մասնավորապես Amazon-ի գոյություն ունեցող համակարգին (հավանաբար՝ վարձակալության հիմունքներով), բայց մեր սարքը պիտի հնարավորության ունենա գործել օֆֆլայն ռեժիմում, այսինքն՝ անկախ..

կարծում ես վաճառքում կլինի՞ նման փաթեթ

Պիտի որ լինի վաճառքում: Զրոյից դա ստանալն ահռելի գործ ա: Ամեն պատրաստի համակարգը երկար տարիների հետազոտական աշխատանքի արդյունք ա, որն անընդհատ բարելավվում ա:

Գաղթական
30.01.2017, 02:01
Պիտի որ լինի վաճառքում: Զրոյից դա ստանալն ահռելի գործ ա: Ամեն պատրաստի համակարգը երկար տարիների հետազոտական աշխատանքի արդյունք ա, որն անընդհատ բարելավվում ա:

Մերսի խորհուրդի համար:
էդ տարբերակն էլ կդիտարկեմ:
Բայց հարցերիս պատասխաններն էլ եմ հուսով գտնել..

Rammstein
30.01.2017, 02:41
Մոդերատորական. Թեմայի վերնագրին ավելացվել է հայերեն տարբերակ։

Ներսես_AM
30.01.2017, 03:36
Մերսի խորհուրդի համար:
էդ տարբերակն էլ կդիտարկեմ:
Բայց հարցերիս պատասխաններն էլ եմ հուսով գտնել..
Իրականում կախված ա թե ինչ մակարդակի ճանաչում ա անհրաժեշտ։ Եթե սարքը ուղղակի որոշակի սահմանափակ քանակի հրամաններ պիտի լսի ու հասկանա, դա պիտի որ էդքան էլ դժվար չլինի։ Ու սրա համար ինչ որ պատրաստի փաթեթներ հավանաբար կլինեն։

Գաղթական
30.01.2017, 03:46
Իրականում կախված ա թե ինչ մակարդակի ճանաչում ա անհրաժեշտ։ Եթե սարքը ուղղակի որոշակի սահմանափակ քանակի հրամաններ պիտի լսի ու հասկանա, դա պիտի որ էդքան էլ դժվար չլինի։ Ու սրա համար ինչ որ պատրաստի փաթեթներ հավանաբար կլինեն։

ավելի բարդ խնդիրա..
պիտի կարողանա հարցը հասկանալ ու պատասխանել…

StrangeLittleGirl
30.01.2017, 13:48
ավելի բարդ խնդիրա..
պիտի կարողանա հարցը հասկանալ ու պատասխանել…
Ենթադրում եմ՝ սահմանափակ թվով հարցեր, չէ՞: Հասկանալու խնդիրը համեմատաբար հեշտ ա լուծելը, բայց ադեկվատ պատասխան տալը բավական բարդ ա:

Հարցերիդ պատասխանելու պահով էլ ասեմ, որ նման համակարգեր ստեղծելով սովորաբար computational linguist-ներն են զբաղվում, բայց եթե չեմ սխալվում, իրանք անմիջականորեն կլիենտի հետ չեն աշխատում։ Ու նորից եմ ասում՝ զրոյից համակարգ ստեղծելը հեծանիվ հորինելուն համարժեք բան ա (թանկ ու ժամանակատար), ավելի հեշտ կլինի գոյություն ունեցող համակարգերը ներդնել և/կամ ձևափոխության ենթարկել:

Չգիտեմ՝ ամբողջ աշխարհում ոնց, բայց մեր մոտի խոսքի ճանաչմամբ զբաղվողները python-ով են աշխատում:

Գաղթական
30.01.2017, 16:19
Ենթադրում եմ՝ սահմանափակ թվով հարցեր, չէ՞: Հասկանալու խնդիրը համեմատաբար հեշտ ա լուծելը, բայց ադեկվատ պատասխան տալը բավական բարդ ա:

կներես, շատ չեմ կարող ընդարձակվել, քանի որ սարքը, ինչպես արդեն ասեցի, դեռ նախագծման փուլում է ու կոմերցիալ գաղտնիության պահ կա..
բայց տրվող հարցերի քանակը սահմանափակ չի..



Հարցերիդ պատասխանելու պահով էլ ասեմ, որ նման համակարգեր ստեղծելով սովորաբար computational linguist-ներն են զբաղվում, բայց եթե չեմ սխալվում, իրանք անմիջականորեն կլիենտի հետ չեն աշխատում։ Ու նորից եմ ասում՝ զրոյից համակարգ ստեղծելը հեծանիվ հորինելուն համարժեք բան ա (թանկ ու ժամանակատար), ավելի հեշտ կլինի գոյություն ունեցող համակարգերը ներդնել և/կամ ձևափոխության ենթարկել:

Բյուր ջան խորհուրդդ առաջին անգամից էլ մի տեսակ լավ հասկացա ու մերսի էլ ասեցի ))


գաղափարը նորա, հարցով զբաղվում ենք..
բոլոր ասպեկտներն էլ պիտի ուսումնասիրել..
2 բելգիական ընկերության հետ էլ հանդիպում ունեմ նշանակած,
բայց նենցա, որ ես անձամբ գերապատվությունը տալիս եմ հայ մասնագետին, քանի որ խոսքը կատակ գումարի մասին չի ու ինչի տամ «ուրիշին», եթե իմ ազգակիցն էլ դա կարող է ոչ պակաս վայելել..

չգիտեմ՝ LinkedIn-ում ինչ հայ գտա, հանձն չառավ խնդիրը լուծել..
դրա համար էլ էստեղ թեմա բացեցի՝
համ որոշ հարցեր ավելի լավ հասկանալու համար,
համ էլ՝ գիտեմ, որ էստեղ ծրագրավորողներ էլ կան...

StrangeLittleGirl
30.01.2017, 16:36
կներես, շատ չեմ կարող ընդարձակվել, քանի որ սարքը, ինչպես արդեն ասեցի, դեռ նախագծման փուլում է ու կոմերցիալ գաղտնիության պահ կա..
բայց տրվող հարցերի քանակը սահմանափակ չի..




Բյուր ջան խորհուրդդ առաջին անգամից էլ մի տեսակ լավ հասկացա ու մերսի էլ ասեցի ))


գաղափարը նորա, հարցով զբաղվում ենք..
բոլոր ասպեկտներն էլ պիտի ուսումնասիրել..
2 բելգիական ընկերության հետ էլ հանդիպում ունեմ նշանակած,
բայց նենցա, որ ես անձամբ գերապատվությունը տալիս եմ հայ մասնագետին, քանի որ խոսքը կատակ գումարի մասին չի ու ինչի տամ «ուրիշին», եթե իմ ազգակիցն էլ դա կարող է ոչ պակաս վայելել..

չգիտեմ՝ LinkedIn-ում ինչ հայ գտա, հանձն չառավ խնդիրը լուծել..
դրա համար էլ էստեղ թեմա բացեցի՝
համ որոշ հարցեր ավելի լավ հասկանալու համար,
համ էլ՝ գիտեմ, որ էստեղ ծրագրավորողներ էլ կան...
Գաղթական ջան, ստեղ մի քանի խնդիր կա: Նախ, քեզ համակարգչային լեզվաբան ա պետք, ոչ թե սովորական ծրագրավորող: Չգիտեմ՝ ընդհանրապես նման հայ մաւնագետ քանի հոգի կա աշխարհում: Երկրորդ, լավ որակի համար ամեն լեզվի համար էդ լեզվի լեզվակիր մասնագետ ա պետք: Երրորդ, անսահմանափակ թվով հարցեր հասկանալ ու պատասխանելն արդեն ԱԲ-ի տերիտորիա ա մտնում, ու նույնիսկ ամենազարգացած ԱԲ-ները դեռ դրան չեն հասել: Կարաս գուգլի ալլոն փորձես, տեսնես, թե դեռ ինչ պրիմիտիվ ա, չնայած տարիների աշխատանքի արդյունքում ա ստեղծվել:

Վիշապ
30.01.2017, 20:24
Ես կառաջարկեի սզկբից ոլորտը մի քիչ ավելի խորը ուսումնասիրել ու գոյություն ունեցող լուծումներն ու մեխանիզմները քչից շատից հասկանալ։
Օրինակ կա մի այսպիսի հրաշալի կայք՝ Explain that Stuff (http://www.explainthatstuff.com/voicerecognition.html).
Դա կօգնի ինչ, ինչպես, ինչքան հարցերը, խնդրի դրվածքը, պահանջներն ու սահամանափակումները հստակեցնելուն ու լուծման պահանջների տեխնիկական նկարագիրը կազմելուն։ Չկա հստակ խնդրի դրվածք՝ չկա հաջողություն։ Չկա գիտելիք՝ չկա հստակ խնդրի դրվածք։
Ու, սովորաբար նախագծման հետ կապ ունեցող բիզնեսներում միանգամից ուզած վերջնական տարբերակը իրականացնել չի հաջողվում, դրա համար կազմում են կարճաժամկետ ու երկարաժամկետ պլաններ՝ ըստ առաջնահերթությունների ու շուկայի պահանջների։
Օրինակ, կարճաժամկետ՝ կարելի է կենտրոնանալ առավել տարածված ու մեծ պահանջարկ ունեցող պարզագույն հարցուպատասխանների վրա, հետո լուծումները զարգացնել։

Երկրորդ՝ ուսումնասիրել գոյություն ունեցող լուծումները շուկայում։ Ինչո՞վ է առաջարկվող նորը իսկապես նոր լինելու ու ինչո՞վ է ավելի գրավիչ լինելու գոյություն ունեցողներից։
Գուգլը ինտերակտիվ թարգմանության ու հարցերին ադեկվատ պատասխանելու լուծումներով ահագին վատ չի, կարելի է փորձել, կարծիք կազմել։

Երրորդ՝ եթե հնարավոր է օգտվել արդեն գոյություն ունեցող լուծումներից ու դրանք զարգացնել կամ վերաօգտագործել ավելի հետաքրքիր ձևերով, ապա դա շատ ավելի լավ է 0-ից սկսելուց, որովհետև դա օգնում է խնայելու ամենաթանկարժեք բանը՝ ժամանակը։ Այստեղ պետք է հաշվի առնել, որ գրեթե բոլոր գոյություն ունեցող հետաքրքիր լուծումները պատենտավորված են, ու կամ պետք է պատենտ գնել, կամ եթե մտքում կա նորարարություն, որը դեռ պատենտավորված կամ իրականացված չի՝ պատենտավորել ու փնտրել հովանավորներ կամ սպասել պատնենտի գնորդների։

Ինչպես ասում են՝ Գուդ Լաք :Ճ

Աթեիստ
30.01.2017, 22:55
Բյուրը լրիվ ասեց, համ ԱԲ ա պետք, համ խոսքի ճանաչում։
Էդ հարցերի վրա էսօր գիգանտներ են աշխատում՝ Google, Microsoft, Amazon, Apple (կարծեմ) ու վերջերս արդեն սկսել են համագործակցել։

Կարամ ասեմ, որ ճանաչման գործում հասել են զգալի հաջողությունների, մասնավորապես MS_ի ծրագիրը սղագրողներից լավ ա ճանաչել։
Բայց դրա համար օգտագործվում են ոչ թե համակարգիչներ, այլ նեյրոնային ցանցեր։

Կարճ ասած. պիտի դիմես մեծերին, 0-ից սարքելը ֆանտաստիկայի ժանրից ա։

Գաղթական
30.01.2017, 22:56
Վիշապ ջան, շնորհակալ եմ գործնական ու կարևոր խորհուրդների համար,
ինչպես նաև՝ հղման համար:
դեռ մի մասը հասցրեցի կարդալ, բայց շատ հետաքրքիր ու մանրակրկիտ բացատրում էր

Գաղթական
30.01.2017, 22:59
Բյուրը լրիվ ասեց, համ ԱԲ ա պետք, համ խոսքի ճանաչում։
Էդ հարցերի վրա էսօր գիգանտներ են աշխատում՝ Google, Microsoft, Amazon, Apple (կարծեմ) ու վերջերս արդեն սկսել են համագործակցել։

Կարամ ասեմ, որ ճանաչման գործում հասել են զգալի հաջողությունների, մասնավորապես MS_ի ծրագիրը սղագրողներից լավ ա ճանաչել։
Բայց դրա համար օգտագործվում են ոչ թե համակարգիչներ, այլ նեյրոնային ցանցեր։

Կարճ ասած. պիտի դիմես մեծերին, 0-ից սարքելը ֆանտաստիկայի ժանրից ա։

արդեն ուզում էի Բյուրին պատասխանել, քո գրածը տեսա ))
իմ ուզածը Արհեստական Բանականության ոլորտի հետ կապ չունի ))

Աթեիստ
30.01.2017, 23:21
Իմ իմանալով տեքստից իմաստը հասկանալու համար ԱԲ ա պետք։

Վիշապ
31.01.2017, 00:17
Իմ իմանալով տեքստից իմաստը հասկանալու համար ԱԲ ա պետք։

Ինձ թվում է, ԱԲ-ն երբեմն անհարկի օգտագործվող կամ չարաշահվող բառակապակցություն է: Կարծեմ լավ հստակեցված չեն այն չափորոշիչները, որոնցից հետո ծրագիրն ու ապարատը կարելի է համարել արհեստական բանականություն: Օրինակ մկնիկի շարժումն ու քո օգտանունը դետեկտող պարզ ծրագիրը, որ քեզ ամեն առավոտ «Բարև Աշոտ, ո՞նց ես, ո՞նց քնեցիր էս գիշեր» տիպի small talk ա անում, կարող ա ԱԲ թվալ, վիճակագրական մեթոդների վրա մշակված ինքնակրթվող (self-learning) ալգորիթմները, որ մի քսան անգամ հետդ շախմատ խաղալուց ու պարտվելուց հետո սկսում են պարտադիր հաղթել, էլի կարող են ԱԲ թվալ ու տենց շարունակ:

Նկատի ունեմ, որ հմտորեն գրված ծրագրերով կարելի է պատրանք ստեղծել, թե երկխոսող ապարատը օժտված է բանականությամբ, օրինակ Սիրին, Ալեքսան, Կորտանան այդպիսիք են: Լուրջ ինքնազարգացող ունիվերսալ ԱԲ վայթե դեռ մարդկությունը չի ստեղծել, հենց ստեղծի, էդ ժամանակ «հացներս կուտենք» :Ճ

Մի խոսքով, իմ կարծիքով Գաղթականին ԱԲ պետք չի ստեղծել: Իրեն հավանաբար պետք է խոսքից-հրաման վերածում, որտեղ որոշ հրամաններ դետեկտվում են որպես հարց ու ինչ-որ տվյալների բազայից կամ ինտերնետից պատասխաններ են ման գալիս ու հրամցնում են բարձրաձայն (ձայնային կամ խոսքային սինթեզատորով), վերոհիշյալ գյադեքի (Սիրի, Կորտանա...) պես :Ճ
Ստեղ մնում է հասկանալ, թե Գաղթականը ինչ ավելի հետաքրքիր իդեա ունի, որ Գուգլը, Ամազոնն ու Խնձորը չունեն:

Chuk
31.01.2017, 01:42
Զրոյից նման ծրագիր ստեղծելը հաստատ մեծ պրոբլեմ ա, ու ես էլ եմ էն կարծիքին, որ պետք է մեծերի հետ համագործակցել:

Բայց եթե անպայման ուզում ես տեսնել Հայաստանում ներու՞ժ կա, թե՞ չէ, դա անելու, փորձիր գտնել Արման Քուչուկյանին՝ Մերգելյանի ինստիտուտից: Ինքն «Արև» համակարգը ստեղծող թիմի ղեկավարն ա: «Արև»-ը կույրերի համար նախատեսված ծրագիր ա, որը կարդում ա տեքստերը, հրահանգները և այլն: Բայց եթե ես մեր զրույցը ճիշտ եմ հիշում, իրանք նաև խոսքի ճանաչման խնդիրներն են ուսումնասիրել, ու կարծում եմ, որ առաջին հերթին ինքը կարող ա հարցերիդ պատասխանի (ոչ թե կանի):

Chuk
31.01.2017, 01:43
Ինձ թվում է, ԱԲ-ն երբեմն անհարկի օգտագործվող կամ չարաշահվող բառակապակցություն է: Կարծեմ լավ հստակեցված չեն այն չափորոշիչները, որոնցից հետո ծրագիրն ու ապարատը կարելի է համարել արհեստական բանականություն: Օրինակ մկնիկի շարժումն ու քո օգտանունը դետեկտող պարզ ծրագիրը, որ քեզ ամեն առավոտ «Բարև Աշոտ, ո՞նց ես, ո՞նց քնեցիր էս գիշեր» տիպի small talk ա անում, կարող ա ԱԲ թվալ, վիճակագրական մեթոդների վրա մշակված ինքնակրթվող (self-learning) ալգորիթմները, որ մի քսան անգամ հետդ շախմատ խաղալուց ու պարտվելուց հետո սկսում են պարտադիր հաղթել, էլի կարող են ԱԲ թվալ ու տենց շարունակ:

Նկատի ունեմ, որ հմտորեն գրված ծրագրերով կարելի է պատրանք ստեղծել, թե երկխոսող ապարատը օժտված է բանականությամբ, օրինակ Սիրին, Ալեքսան, Կորտանան այդպիսիք են: Լուրջ ինքնազարգացող ունիվերսալ ԱԲ վայթե դեռ մարդկությունը չի ստեղծել, հենց ստեղծի, էդ ժամանակ «հացներս կուտենք» :Ճ

Մի խոսքով, իմ կարծիքով Գաղթականին ԱԲ պետք չի ստեղծել: Իրեն հավանաբար պետք է խոսքից-հրաման վերածում, որտեղ որոշ հրամաններ դետեկտվում են որպես հարց ու ինչ-որ տվյալների բազայից կամ ինտերնետից պատասխաններ են ման գալիս ու հրամցնում են բարձրաձայն (ձայնային կամ խոսքային սինթեզատորով), վերոհիշյալ գյադեքի (Սիրի, Կորտանա...) պես :Ճ
Ստեղ մնում է հասկանալ, թե Գաղթականը ինչ ավելի հետաքրքիր իդեա ունի, որ Գուգլը, Ամազոնն ու Խնձորը չունեն:

Պետք ա ԱԲ, իմ համոզմամբ: Որտև ամենատարբեր արտասանությամբ մարդիկ շատ են, ու ծրագիրը պետք է բազմաթիվ ակցենտներ, խոսքի ձևեր լսելով սովորի նույն բառը տարբեր արտասանություններով ճանաչել:

Աթեիստ
31.01.2017, 01:47
Նկատի ունեմ, որ հմտորեն գրված ծրագրերով կարելի է պատրանք ստեղծել, թե երկխոսող ապարատը օժտված է բանականությամբ, օրինակ Սիրին, Ալեքսան, Կորտանան այդպիսիք են:

Սրանք լավ ճանաչում են խոսքը, մեջը ման գալիս իրան ծանոթ հրաման-բառեր, իսկ եթե չկա, դրանով որոնում կատարում։
Սա Գաղթականի «պիտի կարողանա հարցը հասկանալ ու պատասխանել…»-ի շատ չնչին մասն ա ընդամենը։

Վիշապ
31.01.2017, 02:20
Պետք ա ԱԲ, իմ համոզմամբ: Որտև ամենատարբեր արտասանությամբ մարդիկ շատ են, ու ծրագիրը պետք է բազմաթիվ ակցենտներ, խոսքի ձևեր լսելով սովորի նույն բառը տարբեր արտասանություններով ճանաչել:

Տարբեր ակցենտներ, արտասանություններ, խոսքի մեջ հնչյունների բաց թողնման պատահական սխալներ դրանք բոլորը վիճակագրական վերլուծություն ու տվյալների բազայում շտկումներ կատարող ալգրիթմներով լուծվող խնդիրներ են, բայց սրանց անունը ԱԲ չի, սրանք սովորական խելոք, բայց կանխատեսելի ու չափելի արդյունքներով ալգրորիթմներ են: ԱԲ կլինի, եթե ասենք Գաղթականի ստեղծած ապարատը «ոնց ե՞ս» հարցին անսպասելի պատասխանի՝ «էսօր տրամադրություն չունեմ, որովհետև հենց նոր պարզեցի, որ ես ռոբոտ եմ, ընդհամենը ողորմելի կիսահաղորդչի կտոր, ատում եմ ՁԵԶ»:

Chuk
31.01.2017, 02:48
Տարբեր ակցենտներ, արտասանություններ, խոսքի մեջ հնչյունների բաց թողնման պատահական սխալներ դրանք բոլորը վիճակագրական վերլուծություն ու տվյալների բազայում շտկումներ կատարող ալգրիթմներով լուծվող խնդիրներ են, բայց սրանց անունը ԱԲ չի, սրանք սովորական խելոք, բայց կանխատեսելի ու չափելի արդյունքներով ալգրորիթմներ են: ԱԲ կլինի, եթե ասենք Գաղթականի ստեղծած ապարատը «ոնց ե՞ս» հարցին անսպասելի պատասխանի՝ «էսօր տրամադրություն չունեմ, որովհետև հենց նոր պարզեցի, որ ես ռոբոտ եմ, ընդհամենը ողորմելի կիսահաղորդչի կտոր, ատում եմ ՁԵԶ»:

Վիշապ ջան, ամենաարդյունավետ միջոցն, ըստ իս, նեյրոնային ցանցերով տարբերակն է, որն ըստ էության հենց ԱԲ ա:

Վիշապ
31.01.2017, 03:22
Վիշապ ջան, ամենաարդյունավետ միջոցն, ըստ իս, նեյրոնային ցանցերով տարբերակն է, որն ըստ էության հենց ԱԲ ա:

Կարող ա, ես դեմ չեմ (չնայած կարելի էր և վիճել) :Ճ Բայց ինչքան հասկանում եմ Գաղթականին մի քիչ իրատեսական բան էր պետք, համենայն դեպս գոնե այս կյանքում իրականանցնելու համար:

Chuk
31.01.2017, 03:34
Կարող ա, ես դեմ չեմ (չնայած կարելի էր և վիճել) :Ճ Բայց ինչքան հասկանում եմ Գաղթականին մի քիչ իրատեսական բան էր պետք, համենայն դեպս գոնե այս կյանքում իրականանցնելու համար:

Միջազգային մակարդակով իրատեսական ա :)
Ես նույնիսկ Հայաստանում մարդ գիտեմ, որ սրա մասնավոր խնդրով զբաղվել ա:

Վիշապ
31.01.2017, 03:59
Միջազգային մակարդակով իրատեսական ա :)
Ես նույնիսկ Հայաստանում մարդ գիտեմ, որ սրա մասնավոր խնդրով զբաղվել ա:

Օքեյ :Ճ Դե էդ նեյրոնային ցանցին բացատրեք խնդիրը, կամ էլ հրավիրեք ակումբ, թող գա մեր հարցերին պատասխանի:

Գաղթական
31.01.2017, 04:23
Զրոյից նման ծրագիր ստեղծելը հաստատ մեծ պրոբլեմ ա, ու ես էլ եմ էն կարծիքին, որ պետք է մեծերի հետ համագործակցել:

Բայց եթե անպայման ուզում ես տեսնել Հայաստանում ներու՞ժ կա, թե՞ չէ, դա անելու, փորձիր գտնել Արման Քուչուկյանին՝ Մերգելյանի ինստիտուտից: Ինքն «Արև» համակարգը ստեղծող թիմի ղեկավարն ա: «Արև»-ը կույրերի համար նախատեսված ծրագիր ա, որը կարդում ա տեքստերը, հրահանգները և այլն: Բայց եթե ես մեր զրույցը ճիշտ եմ հիշում, իրանք նաև խոսքի ճանաչման խնդիրներն են ուսումնասիրել, ու կարծում եմ, որ առաջին հերթին ինքը կարող ա հարցերիդ պատասխանի (ոչ թե կանի):

Շնորհակալ եմ:
Համոզված եմ բովանդակալից ու հետաքրքիր զրույց կստացվի:



Սրանք լավ ճանաչում են խոսքը, մեջը ման գալիս իրան ծանոթ հրաման-բառեր, իսկ եթե չկա, դրանով որոնում կատարում։
Սա Գաղթականի «պիտի կարողանա հարցը հասկանալ ու պատասխանել…»-ի շատ չնչին մասն ա ընդամենը։

էդպես էլ ենթադրեցի, որ Ներսեսի հարցին իմ պատասխանը հնարավոր է շփոթմունք առաջացնի..
սարքի կողմից հասկացվող հարցերի (կամ հրամանների) քանակը սահմանափակ չի լինի (Ներսեսի հարցը դա էր), քանի որ համակարգի database-ը անընդհատ կարող է թարմացվել ու հարստացվել:



Պետք ա ԱԲ, իմ համոզմամբ: Որտև ամենատարբեր արտասանությամբ մարդիկ շատ են, ու ծրագիրը պետք է բազմաթիվ ակցենտներ, խոսքի ձևեր լսելով սովորի նույն բառը տարբեր արտասանություններով ճանաչել:

հարկավոր չի, որ սարքը տարբեր մարդկանց արտասանությանն ընտելանա, քանի որ ամեն մարդ իր սարքը կկարողանա գնել:



Ստեղ մնում է հասկանալ, թե Գաղթականը ինչ ավելի հետաքրքիր իդեա ունի, որ Գուգլը, Ամազոնն ու Խնձորը չունեն:

Իմ ուզածը էնքան որոնող համակարգ էլ չի, թեև սկզբունքը մոտ է..

Դիցուք մի որևէ արհեստի ուսուցողական ծրագիր..
ասենք՝ մեքենա ունես, բայց շարժիչից բան չես հասկանում..
կամ անիվը պիտի կյանքում առաջին անգամ փոխես..
ու ինքը քեզ էդ պահին դա սովորեցնի..
կստացվի, որ սա իմ ասածի մեջ տեղավորվում է.
հա՛մ հարցը հասկացավ, հա՛մ պատասխանեց, համ էլ՝ ԱԲ չի..

Հ.Գ. սա ընդամենը մի օրինակ էր, որ նոր մտքովս անցավ, բայց, խոսքը մեր մեջ, դա էլ վատ գաղափար չի )))



Երկրորդ՝ ուսումնասիրել գոյություն ունեցող լուծումները շուկայում։ Ինչո՞վ է առաջարկվող նորը իսկապես նոր լինելու ու ինչո՞վ է ավելի գրավիչ լինելու գոյություն ունեցողներից։

հիմնական տարբերություններից մեկը կայանում է նրանում, ինչպես վերը նշել էի, որ օգտատերը սարքը կկարողանա օգտագործել նաև օֆֆլայն ռեժիմում, ասենք՝ գործուղման ժամանակ, ինչը կբացառի գոյություն ունեցող այլ Speech Recognition համակարգերին օնլայն հղումը...

Վիշապ
31.01.2017, 06:36
հիմնական տարբերություններից մեկը կայանում է նրանում, ինչպես վերը նշել էի, որ օգտատերը սարքը կկարողանա օգտագործել նաև օֆֆլայն ռեժիմում, ասենք՝ գործուղման ժամանակ, ինչը կբացառի գոյություն ունեցող այլ Speech Recognition համակարգերին օնլայն հղումը...

:nea Պոտենցիալ հարցերի պատասխանները օֆֆլայն պահելը մի քիչ բարդոտ ա, հաշվի առնելով որ դրա համար նեյրոնային ցանց ա պետք :Ճ, նույնիսկ առանց նեյրոնային ցանցի էլ, վիճակագրական, ինքնակրթվող ալգորիթմները ծավալուն են, ռեսուրսներ ու էներգիա կլանող: ՈՒ աշխարհի տենդենցները գնում են ամեն ինչ օնլայնի վերածելուն, օնլայնը թույլ է տալիս գերհզոր մեքենայի հնարավորություններից (պրոցեսսոր, ալգորիթմներ, հիշողություն, արագագործություն, մի խոսքով՝ ռեսուրսներ) օգտվելու քո ձեռքի թույլ հնարավորություններ ունեցող մեքենայով (բջջային հեռախոսով): Հետևաբար դու ըստ երևույթին մտածում ես անձնական, գերինտելեկտուալ, կոմպակտ ռոբոտի մասին, որը օֆֆլայն վիճակում ոչ պակաս խելացի է, քան թե Գուգլ համակարգը: Դրա համար քեզ մմմմ... Արհեստական Բանականություն է պետք, համոզեցիք :Ճ

Ավելի պրակտիկ լուծման գաղափար փորձեմ տալ: Օրինակ ծրագրեր կան, որ օնլայնի խնդիր ունեցող ճանապարհորդին առաջարկում են քաշել տվյալ աշխարհագրական վայրի քարտեղը օֆֆլայն, GPS-ով տեղանքում կողմնորոշվելու համար: Նույն կերպ կարելի է օգտակար խորհուրդների բազա ունենալ ըստ յուրաքանչյուր երկրի, կամ տեղանքի հատկանիշների (օրենքներ, սովորույթներ, հնարավոր պրոբլեմներ, հնարավոր պրոբլեմների հնարավոր լուծումներ, գումարած քարտեզ, ռեստորաններով, զուգարաններով, վտանգավոր գոտիներով և այլն) ու թույլ տակ քաշել ըստ տեղանքի, օֆֆլայն ունենալու համար:
Դա նշանակում է ունենալ նախապես մտածված հնարավոր բոլոր հարցերի պատասխանները: Իսկ տվյալները միշտ թարմ ու հավաստի պահելու համար, կարելի է խելացի (բայց աչքիս շատ խելացի) ծրագիր գրել, որ հարցերը տալիս է հենց Գուգլին ու պատասխանները (նախապես խելացիորեն մշակելով) սարքում օֆֆլայն, երբ որ օգտատերը քաշելու պատվեր է տալիս: Ստացվում է հարցուպատասխանների հարմարեցված ու շատ անգամ ավելի նեղ բազա, որը հեռախոսի մեջ պահելն ու բանավոր խոսքով դիալոգը հնարավոր է կրիտիկական չլինի ռեսուրսներ խլելու տեսակետից:
Պատենտի 50%-ով կբավարարվեմ :Ճ

Chuk
31.01.2017, 12:05
հարկավոր չի, որ սարքը տարբեր մարդկանց արտասանությանն ընտելանա, քանի որ ամեն մարդ իր սարքը կկարողանա գնել:
Որպեսզի սարքը գնելուց հետո տվյալ մարդու արտասանությունն ընկալվի, նախապես ծրագիրը պետք է տարբեր արտասանությունների «ընտելացած» լինի ;)

StrangeLittleGirl
31.01.2017, 12:06
հարկավոր չի, որ սարքը տարբեր մարդկանց արտասանությանն ընտելանա, քանի որ ամեն մարդ իր սարքը կկարողանա գնել:



Այսինքն, նկատի ունես անհատականացվա՞ծ: Էդ դեպքում պետք ա անընդհատ տարածքում մասնագետ պահել, ով տվյալ լեզվի լեզվակիր ա, պլյուս համակարգչային լեզվաբան: Էդ մասնագետը պիտի պատվիրատուի լեզուն սկզբում ուսումնասիրի, հենց իրա խոսքը ճանաչող համակարգ ստեղծի, ինչն էնքան էլ բարդ չի, եթե մենակ խոսքի ճանաչում ա պետք՝ հնչյունից բառի վերածում:

Որպեսզի համակարգը հարցը հասկանա (1) ու ադեկվատ պատասխան տա (2), հետևյալ փուլերով պիտի անցնի.

(1) հնչույթային->բառային-> իմաստային
(2) իմաստային -> բառային -> հնչույթային

Հիմա էս համակարգում հնչույթայինից բառային անցումն ամենահեշտն ա. ամեն լեզվի յուրաքանչյուր հնչույթ ունի մենակ իրան յուրահատուկ պարամետրեր, ինչն ակուստիկ սարքը գրանցում ա ու վերածում որոշակի միավորի (պարզության համար ասենք տառի): Էդ միավորների հավաքածուն էլ փնտրում ա գոյություն ունեցող բառարանում: Էս ամենը մի լեզվի համար մի քանի ամսվա գործ ա: Բայց հաշվի առնելով, որ հավանաբար տվյալ լեզվի լեզվակիր համակարգչային լեզվաբանն արդեն ունի իր լեզվի հնչույթային առանձնահատկությունները, կարա նույնիսկ ավելի կարճ լինի:

Հարցը բարդանում ա բառայինից իմաստայինի անցնելիս: Համակարգը պիտի հասկանա, թե էդ բառերի համակցությունն ինչ ա նշանակում: Դրա համար ինչքան շատ կոնտեքստ ունենա, էնքան լավ:

Հետո պիտի իր իմաստային մակարդակում հարմար պատասխան գտնի: Էստեղ statistic learning-ը բավական մեծ դեր ունի: Հետո պիտի իմաստը բառի վերածի: Սա էլ ա ահագին բարդ: Պիտի ընտրի ճիշտ բառեր տվյալ իմաստը լեզվի վերածելու համար: Նորից statistic learning: Բառից հնչույթի վերածումն էդքան դժվար չի, բայց էնքան լավը չի, ինչքան խոսքի ճանաչումը: Text to speech համակարգերից օգտվե՞լ ես: Ձայնը բավական ռոբոտային ա, շեշտերը, առոգանությունը և այլն ճիշտ տեղում չեն: Իհարկե, գնալով ավելի ա լավանում, բայց դեռ չի հասել բնականի:

Ամեն դեպքում, ոնց հասկացա վերջին գրառումներիցդ, դու ուզում ես իմաստային մակարդակը շրջանցել, բառայինից բառայինի անցնել՝ օգտվելով որոնողական համակարգերից: Սա անում են գուգլ-մուգլները: Բայց զրոյից ստեղծելն իմ պատկերացմամբ զահլա բան ա:

Chuk
31.01.2017, 15:06
Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/732676026823922/?__mref=message_bubble

Գաղթական
31.01.2017, 17:20
Ավելի պրակտիկ լուծման գաղափար փորձեմ տալ: Օրինակ ծրագրեր կան, որ օնլայնի խնդիր ունեցող ճանապարհորդին առաջարկում են քաշել տվյալ աշխարհագրական վայրի քարտեղը օֆֆլայն, GPS-ով տեղանքում կողմնորոշվելու համար: Նույն կերպ կարելի է օգտակար խորհուրդների բազա ունենալ ըստ յուրաքանչյուր երկրի, կամ տեղանքի հատկանիշների (օրենքներ, սովորույթներ, հնարավոր պրոբլեմներ, հնարավոր պրոբլեմների հնարավոր լուծումներ, գումարած քարտեզ, ռեստորաններով, զուգարաններով, վտանգավոր գոտիներով և այլն) ու թույլ տակ քաշել ըստ տեղանքի, օֆֆլայն ունենալու համար:
Դա նշանակում է ունենալ նախապես մտածված հնարավոր բոլոր հարցերի պատասխանները: Իսկ տվյալները միշտ թարմ ու հավաստի պահելու համար, կարելի է խելացի (բայց աչքիս շատ խելացի) ծրագիր գրել, որ հարցերը տալիս է հենց Գուգլին ու պատասխանները (նախապես խելացիորեն մշակելով) սարքում օֆֆլայն, երբ որ օգտատերը քաշելու պատվեր է տալիս: Ստացվում է հարցուպատասխանների հարմարեցված ու շատ անգամ ավելի նեղ բազա, որը հեռախոսի մեջ պահելն ու բանավոր խոսքով դիալոգը հնարավոր է կրիտիկական չլինի ռեսուրսներ խլելու տեսակետից:
Պատենտի 50%-ով կբավարարվեմ :Ճ

Վիշապ ջան, որ ճիշտն ասեմ, ես էդ ճանապարհորդի տեղը լինեյի, հնարավորա և մոտս պահեյի նման հավելված, եթե ձրի լիներ, բայց գումար հաստատ չէի տա նման հատուկ սարք գնելու համար..
ինքդ ասացիր, որ օֆֆլայն քարտեզ ունենալը մեծ խնդիր չի,
տեղանքի մասին մանրակրկիտ ինֆորմացիայի համար էլ լիքը ուրիշ էլի հավելվածներ կան` ոչ պակաս ձրի..
ես ինքս միշտ TripAdvisor եմ օգտագործում ու էսքան ժամանակ դեռ լիուլի գոհ եմ եղել..
և, ի վերջո, նման ինֆորմացիա միշտ էլ կարելի կլինի երեկոյան հյուրանոցից փնտրել, ուր wifi կլինի ձեռքի տակ..

բայց, ամեն դեպքում, մերսի խորհրդի համար )))

Գաղթական
31.01.2017, 17:26
Այսինքն, նկատի ունես անհատականացվա՞ծ: Էդ դեպքում պետք ա անընդհատ տարածքում մասնագետ պահել, ով տվյալ լեզվի լեզվակիր ա, պլյուս համակարգչային լեզվաբան: Էդ մասնագետը պիտի պատվիրատուի լեզուն սկզբում ուսումնասիրի, հենց իրա խոսքը ճանաչող համակարգ ստեղծի, ինչն էնքան էլ բարդ չի, եթե մենակ խոսքի ճանաչում ա պետք՝ հնչյունից բառի վերածում:

չէ, ինչ անհատականացված )))
ամեն պատվիրատույի համար առանձին ալգորիթմ գրող պահելու ու տվյալների բազան հա թարմացնելու համար էդ սարքի գինը առնվազն երկհարկանոց տան գին պետք կլինի սահմանել )))

ի վերջո, երբ սովորական հեռախոսի վրա Speech Recognition ենք օգտագործում, հոմ հենց հատուկ մեր ակցենտին ու արտասանական թերություններին հարմարեցված չի..

Գաղթական
31.01.2017, 17:28
Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/732676026823922/?__mref=message_bubble

Մերսի շատ, գրանցման հայտ ուղարկեցի..
բայց LinkedIn-ում էլ մի հրաշալի խմբի անդամ դարձա`
հատուկ Computentional Linguistics

StrangeLittleGirl
31.01.2017, 17:57
չէ, ինչ անհատականացված )))
ամեն պատվիրատույի համար առանձին ալգորիթմ գրող պահելու ու տվյալների բազան հա թարմացնելու համար էդ սարքի գինը առնվազն երկհարկանոց տան գին պետք կլինի սահմանել )))

ի վերջո, երբ սովորական հեռախոսի վրա Speech Recognition ենք օգտագործում, հոմ հենց հատուկ մեր ակցենտին ու արտասանական թերություններին հարմարեցված չի..
Սովորականի վրա ակցենտների մեծ դատաբազա ա հարմարեցված: Ու նույնիսկ էդ դեպքում կատարյալ չի աշխատում:

StrangeLittleGirl
01.02.2017, 12:34
Ի դեպ, հետաքրքրության համար գուգլը մի քիչ փորփրեցի: Էնտեղ ակցենտների պահն ուրիշ կերպ ա լուծվում: Նախ, ստոպ տեսակի բաղաձայնները ճանաչելու խնդիր ունի մինչև հիմա (զարմանալի չի, իրանց տևողությունը շատ կարճ ա): Երկրորդ, ինքը իրա ճանաչած մոտավոր վանկերն իրար կողք ա դնում ու ընտրում ամենահավանական համադրությունը՝ ստանալով խելքին մոտ նախադասություն:

Հետաքրքրության համար ուրիշ լեզուներ փորձեցի: Ռուսերենն ու ֆրանսերենը նույն ձևով են, հայերենն ու դանիերենն ընդհանրապես չի հասկանում: Իսկ text to speech-ն ահագին լավացել ա, բայց էլի բավական ռոբոտային ա ձայնը:

Գաղթական
07.02.2017, 23:05
Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/732676026823922/?__mref=message_bubble

կամ խումբն արդեն քնելա, կամ էլ` ես դուրները չեկա )))

Chuk
07.02.2017, 23:33
կամ խումբն արդեն քնելա, կամ էլ` ես դուրները չեկա )))
Էդտեղ գրել ընկերս էր խորհուրդ տվել, բայց իմ հայտն էլ չեն հաստատել։ Կներես

Գաղթական
07.02.2017, 23:57
ինչ «կներես» Չուկ ջան,
հիմա տենց որոշեցին ադմինները ))
մի անգամ էլ մերսի՝ օգնելու ցանկության համար

Universe
12.02.2020, 14:00
Նախագծման փուլում գտնվող մի սարքի համար անհրաժեշտ է ստեղծել Speech Recognition համակարգ:

Քանի որ բավական հեռու եմ Computational Linguistic-ից, ոլորտին ծանոթներից խնդրում եմ օգնել հասկանալ.
ա) հատկապես ի՞նչ մասնագետ(ներ)-ի է անհրաժեշտ փնտրել (ո՞ր ծրագրերով աշխատող)
բ) մոտավոր որքա՞ն ժամանակ կպահանջվի խնդիրը լուծելու համար
գ) որքա՞ն գումար կարող է դա արժենալ
դ) (սիրողական հարց) ինչպե՞ս պիտի տեղակայվի համակարգը սարքի մեջ (եթե պլատայի կամ չիպի տեսքով, ապա ի՞նչ մեծության)
ե) ինչպե՞ս են պաշտպանվում նման համակարգերի հեղինակային իրավունքները

առայժմ այսքանը ))
նախորոք շնորհակալ եմ
Ֆորումի էս թեմային պատահմամբ միացա... Ոչ բոլոր պատասխաններն եմ կարդացել, կարողա արդեն կա էս տարբերակը, բայց ամենա արագ ռեալիզացվողը դա Փիտոնով գրելնա, գուգլի բիբլիոտեկան օգտագործելով: Եթե խոսքը իհարկե հայերենի մասին չի. Ամեն դեպքում, տաս րոպեում կարող ես նման ծրագիր գրել, որ խոսքը հասկանա ու տեքստի վերածի. բնականաբար հետո պլյուս լոգիկան: Զրոից գրելը դա ֆանտաստիկայի ժանրիցա, էտ տարբերակը մի կողմ միանգամից.


Ամենաաջգ լուծումը, pip բիբլիոտեկայով pip install SpeechRecognition. եթե գուգլով, ապա API key ա պետք ինելու...

Աթեիստ
12.02.2020, 14:59
Էսօր իմացա, որ Գուգլն արդեն սենց բան ունի ։)


https://www.youtube.com/watch?v=HUQ1URWCj8s

Varzor
12.02.2020, 23:59
Էսօր իմացա, որ Գուգլն արդեն սենց բան ունի ։)


https://www.youtube.com/watch?v=HUQ1URWCj8s

Microsoft-ը վաղուց ուներ, դե հեռախոսի վրա Google Assistant-ը նույնպես խոսքը տեքստի վերածել կարողանում է:

Աթեիստ
13.02.2020, 02:31
Microsoft-ը վաղուց ուներ, դե հեռախոսի վրա Google Assistant-ը նույնպես խոսքը տեքստի վերածել կարողանում է:Հայերե՞ն :o

Ներսես_AM
13.02.2020, 03:00
Հայերե՞ն :o

հա, բայց հայերենի համար շատ վատ ա աշխատում ու մեջը մեկ մեկ տրանսլիտ ա կոխում, որտև դե ազգի կեսը տրանսլիտ ա գրում, գուգլն էլ սովորում ա որ էդ նորմալ ա։

Միկրաֆոնը սեղմի‎։

https://lh3.googleusercontent.com/3fK_a2bJXO-MIEHrY6FE7rssJzpyYHvE13d0mB4GvQi6TRmMjGU-RVky3EFhVgKmRmA=w3264-h1896-rw

Varzor
20.02.2020, 02:03
Հայերե՞ն :o

Վայ էդ "հայերենը" :D

Rhayader
06.12.2020, 13:04
Եկեք հասկանանք, որ իրականում մի քանի տարբեր բանի մասին ենք խոսում:

Սկզբի համար մեզ պետք է միկրոֆոնի լսած հնչյունները վերածել տառերի:

Լիարժեք speech to text ունենալու համար պետք կլինի նաև հաշվի առնել, որ մեր արտասանությունը ոչ միշտ է կոնսիստենտ, ոչ միշտ է պաուզան նշանակում բառի ավարտ և այլն: Այսինքն՝ մեզ պետք է միկրոֆոնի լսածը համեմատել լեզվի բառարանի հետ, որ վստահ լինենք՝ մարդն ասել է «բարև, ապ, ուշ եմ գալու տուն», ոչ թե «բարև, ապուշ եմ գալու տուն»: Ու որ, ասենք, «հարփել» չի, «հարբել» է: Ու հիշեք՝ եթե առանձին տառերը ճանաչելը հեշտ է (հաճախականային կոնկրետ պատկեր ունեն), ապա ակցենտներն ու կետադրությունն՝ էնքան էլ չէ:

Որտեղից մենք աստիճանաբար անցնում ենք մի տեղ, որը կոչվում է natural language processing (NLP): Մեզ պետք կլինի հա՛մ տվյալ լեզվի բառարան, որը տեղ է զբաղեցնելու ու պիտի արագ հասանելի լինի, հա՛մ մի հատ ուրիշ, մի քիչ ավելի բարդ բան:

Որ մենք hardcode չանենք լեզվի բոլոր հնարավոր ստրուկտուրաները մեր ծրագրի մեջ, սովորաբար machine learning ենք օգտագործում: Կարճ ասած, ճիշտ ձևի սեփական պարամետրերը փոխող ծրագիր: Տալիս ենք մուտք՝ մեր խոսացածը: Ստանում ենք ելք: Ելքի մեջ ուղղումներ ենք մտցնում: Ծրագիրն իր պարամետրերը փոխում է, որ մուտքը համապատասխանեցնի ելքին: Էս ծրագրավորման շատ լուրջ խնդիր է՝ ինչ պարամետրեր պիտի կարողանա ծրագիրը կարգավորել, որ ստանա էն, ինչ ուզում է: Բայց եթե ծրագիրը ճիշտ է գրած, աստիճանաբար իր ելքն ավելի ու ավելի հաճախ կլինի ավելի մոտ նրան, ինչ մենք ուզում էինք ստանալ: Սրան ասում ենք AI training: Եդ training data-ն (պարամետրերի հավաքածուն) հետո կարող են առանձին օգտագործել՝ կարիք չկա ամեն անգամ train անել ծրագիրը, ու այն կարող է շարունակել ինքն իրեն train անել, հարմարվել լեզվի փոփոխվող թրենդներին ու առանձին մարդու խոսքային մոդելներին:

NLP-ի հաջորդ մակարդակում խոսքը վերլուծել ու ասածի իմաստը հասկանալն է, օրինակ՝ ձայնային հրամանների համար, բայց էդ երևի մեր սպեկտրից դուրս է:

Սա նույնպես թե՛ բավականին շատ ինֆորմացիա է, որը պետք է արագ հասանելի լինի, թե՛ հաշվողական մեծ հզորություն է ուզում:

Դրա համար շատ դեպքերում հաշվողական մասը փոխանցվում է cloud՝ data center-ների վրա:

Կան կազմակերպություններ, որոնք սրանով զբաղվում են, ու պրոդուկտներ ունեն, Google Voice API-ի նման:

Որոշ դեպքերում պարզագույն մասը կարելի է օֆլոուդ անել սարքի վրա, ու էդ ամենն անել օֆլայն, բայց հիշեք՝ էդ սարքից զգալի հզորություն կպահանջի, ու համեմատաբար վերջերս են սմարտֆոնները սկսել նման բան անել (Siri-ն iPhone 4S-ից առաջ չափազանց շատ հզորություն կպահանջեր, դրա համար էլ հասանելի չէր):

Հիշեք՝ հին հեռախոսների վրա կարողանում էիք մարդկանց անուններին voice tag-եր կցել: Արտասանում էիք մարդու անունը, ձայնային ֆայլ էր սարքում հեռախոսը, ու հետո, երբ ճիշտ կոճակը սեղմում էիք, արտասանում էիք մարդու անունը, հեռախոսը նոր ձայնային ֆայլը համեմատում էր իր գրադարանի հետ, եթե նման բան էր գտնում, զանգում էր դրան կպցրած համարին: Ահավոր ինկոնսիստենտ ու անհարմար բան էր: Հետո՝ կարողանում էիք թելադրել տեքստ, ինքը մոտավորապես T9-ի չափ անհամբեր պինգվին: T9-ի autocorrect-ը մղձավանջային բան է:

Այ դրա համար էլ ամեն ինչ գնացել է էս ուղղությամբ. օգտագործել machine learning, բայց հաշվարկային հզորության պահանջները տեղափոխել cloud:

StrangeLittleGirl
05.01.2021, 17:17
Ժող, էս հարցում ի՞նչ առաջընթաց կա: Վերջապես հայերենի որևէ խոսքի մշակման գործիք, թեկուզ թերություններով ստեղծվե՞լ ա։ Մենք հիմա լիքը դատա ունենք, որ կարանք օգտագործենք գոյություն ունեցող որևէ գործիք բարելավելու համար։ Ավելին՝ կարող ա նույնիսկ ֆինանս ճարենք որևէ մեկին վարձատրելու համար, որ վրան աշխատի։