Խոսքի ճանաչում (Speech Recognition)

**StrangeLittleGirl** · 31.01.2017, 12:06

Գաղթական-ի խոսքերից

հարկավոր չի, որ սարքը տարբեր մարդկանց արտասանությանն ընտելանա, քանի որ ամեն մարդ իր սարքը կկարողանա գնել:

Այսինքն, նկատի ունես անհատականացվա՞ծ: Էդ դեպքում պետք ա անընդհատ տարածքում մասնագետ պահել, ով տվյալ լեզվի լեզվակիր ա, պլյուս համակարգչային լեզվաբան: Էդ մասնագետը պիտի պատվիրատուի լեզուն սկզբում ուսումնասիրի, հենց իրա խոսքը ճանաչող համակարգ ստեղծի, ինչն էնքան էլ բարդ չի, եթե մենակ խոսքի ճանաչում ա պետք՝ հնչյունից բառի վերածում:

Որպեսզի համակարգը հարցը հասկանա (1) ու ադեկվատ պատասխան տա (2), հետևյալ փուլերով պիտի անցնի.

(1) հնչույթային->բառային-> իմաստային
(2) իմաստային -> բառային -> հնչույթային

Հիմա էս համակարգում հնչույթայինից բառային անցումն ամենահեշտն ա. ամեն լեզվի յուրաքանչյուր հնչույթ ունի մենակ իրան յուրահատուկ պարամետրեր, ինչն ակուստիկ սարքը գրանցում ա ու վերածում որոշակի միավորի (պարզության համար ասենք տառի): Էդ միավորների հավաքածուն էլ փնտրում ա գոյություն ունեցող բառարանում: Էս ամենը մի լեզվի համար մի քանի ամսվա գործ ա: Բայց հաշվի առնելով, որ հավանաբար տվյալ լեզվի լեզվակիր համակարգչային լեզվաբանն արդեն ունի իր լեզվի հնչույթային առանձնահատկությունները, կարա նույնիսկ ավելի կարճ լինի:

Հարցը բարդանում ա բառայինից իմաստայինի անցնելիս: Համակարգը պիտի հասկանա, թե էդ բառերի համակցությունն ինչ ա նշանակում: Դրա համար ինչքան շատ կոնտեքստ ունենա, էնքան լավ:

Հետո պիտի իր իմաստային մակարդակում հարմար պատասխան գտնի: Էստեղ statistic learning-ը բավական մեծ դեր ունի: Հետո պիտի իմաստը բառի վերածի: Սա էլ ա ահագին բարդ: Պիտի ընտրի ճիշտ բառեր տվյալ իմաստը լեզվի վերածելու համար: Նորից statistic learning: Բառից հնչույթի վերածումն էդքան դժվար չի, բայց էնքան լավը չի, ինչքան խոսքի ճանաչումը: Text to speech համակարգերից օգտվե՞լ ես: Ձայնը բավական ռոբոտային ա, շեշտերը, առոգանությունը և այլն ճիշտ տեղում չեն: Իհարկե, գնալով ավելի ա լավանում, բայց դեռ չի հասել բնականի:

Ամեն դեպքում, ոնց հասկացա վերջին գրառումներիցդ, դու ուզում ես իմաստային մակարդակը շրջանցել, բառայինից բառայինի անցնել՝ օգտվելով որոնողական համակարգերից: Սա անում են գուգլ-մուգլները: Բայց զրոյից ստեղծելն իմ պատկերացմամբ զահլա բան ա:

**Chuk** · 31.01.2017, 15:06

Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/7326...message_bubble

**Գաղթական** · 31.01.2017, 17:20

Վիշապ-ի խոսքերից

Ավելի պրակտիկ լուծման գաղափար փորձեմ տալ: Օրինակ ծրագրեր կան, որ օնլայնի խնդիր ունեցող ճանապարհորդին առաջարկում են քաշել տվյալ աշխարհագրական վայրի քարտեղը օֆֆլայն, GPS-ով տեղանքում կողմնորոշվելու համար: Նույն կերպ կարելի է օգտակար խորհուրդների բազա ունենալ ըստ յուրաքանչյուր երկրի, կամ տեղանքի հատկանիշների (օրենքներ, սովորույթներ, հնարավոր պրոբլեմներ, հնարավոր պրոբլեմների հնարավոր լուծումներ, գումարած քարտեզ, ռեստորաններով, զուգարաններով, վտանգավոր գոտիներով և այլն) ու թույլ տակ քաշել ըստ տեղանքի, օֆֆլայն ունենալու համար:
Դա նշանակում է ունենալ նախապես մտածված հնարավոր բոլոր հարցերի պատասխանները: Իսկ տվյալները միշտ թարմ ու հավաստի պահելու համար, կարելի է խելացի (բայց աչքիս շատ խելացի) ծրագիր գրել, որ հարցերը տալիս է հենց Գուգլին ու պատասխանները (նախապես խելացիորեն մշակելով) սարքում օֆֆլայն, երբ որ օգտատերը քաշելու պատվեր է տալիս: Ստացվում է հարցուպատասխանների հարմարեցված ու շատ անգամ ավելի նեղ բազա, որը հեռախոսի մեջ պահելն ու բանավոր խոսքով դիալոգը հնարավոր է կրիտիկական չլինի ռեսուրսներ խլելու տեսակետից:
Պատենտի 50%-ով կբավարարվեմ :Ճ

Վիշապ ջան, որ ճիշտն ասեմ, ես էդ ճանապարհորդի տեղը լինեյի, հնարավորա և մոտս պահեյի նման հավելված, եթե ձրի լիներ, բայց գումար հաստատ չէի տա նման հատուկ սարք գնելու համար..
ինքդ ասացիր, որ օֆֆլայն քարտեզ ունենալը մեծ խնդիր չի,
տեղանքի մասին մանրակրկիտ ինֆորմացիայի համար էլ լիքը ուրիշ էլի հավելվածներ կան` ոչ պակաս ձրի..
ես ինքս միշտ TripAdvisor եմ օգտագործում ու էսքան ժամանակ դեռ լիուլի գոհ եմ եղել..
և, ի վերջո, նման ինֆորմացիա միշտ էլ կարելի կլինի երեկոյան հյուրանոցից փնտրել, ուր wifi կլինի ձեռքի տակ..

բայց, ամեն դեպքում, մերսի խորհրդի համար )))

**Գաղթական** · 31.01.2017, 17:26

StrangeLittleGirl-ի խոսքերից

Այսինքն, նկատի ունես անհատականացվա՞ծ: Էդ դեպքում պետք ա անընդհատ տարածքում մասնագետ պահել, ով տվյալ լեզվի լեզվակիր ա, պլյուս համակարգչային լեզվաբան: Էդ մասնագետը պիտի պատվիրատուի լեզուն սկզբում ուսումնասիրի, հենց իրա խոսքը ճանաչող համակարգ ստեղծի, ինչն էնքան էլ բարդ չի, եթե մենակ խոսքի ճանաչում ա պետք՝ հնչյունից բառի վերածում:

չէ, ինչ անհատականացված )))
ամեն պատվիրատույի համար առանձին ալգորիթմ գրող պահելու ու տվյալների բազան հա թարմացնելու համար էդ սարքի գինը առնվազն երկհարկանոց տան գին պետք կլինի սահմանել )))

ի վերջո, երբ սովորական հեռախոսի վրա Speech Recognition ենք օգտագործում, հոմ հենց հատուկ մեր ակցենտին ու արտասանական թերություններին հարմարեցված չի..

**Գաղթական** · 31.01.2017, 17:28

Chuk-ի խոսքերից

Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/7326...message_bubble

Մերսի շատ, գրանցման հայտ ուղարկեցի..
բայց LinkedIn-ում էլ մի հրաշալի խմբի անդամ դարձա`
հատուկ Computentional Linguistics

**StrangeLittleGirl** · 31.01.2017, 17:57

Գաղթական-ի խոսքերից

չէ, ինչ անհատականացված )))
ամեն պատվիրատույի համար առանձին ալգորիթմ գրող պահելու ու տվյալների բազան հա թարմացնելու համար էդ սարքի գինը առնվազն երկհարկանոց տան գին պետք կլինի սահմանել )))

ի վերջո, երբ սովորական հեռախոսի վրա Speech Recognition ենք օգտագործում, հոմ հենց հատուկ մեր ակցենտին ու արտասանական թերություններին հարմարեցված չի..

Սովորականի վրա ակցենտների մեծ դատաբազա ա հարմարեցված: Ու նույնիսկ էդ դեպքում կատարյալ չի աշխատում:

**StrangeLittleGirl** · 01.02.2017, 12:34

Ի դեպ, հետաքրքրության համար գուգլը մի քիչ փորփրեցի: Էնտեղ ակցենտների պահն ուրիշ կերպ ա լուծվում: Նախ, ստոպ տեսակի բաղաձայնները ճանաչելու խնդիր ունի մինչև հիմա (զարմանալի չի, իրանց տևողությունը շատ կարճ ա): Երկրորդ, ինքը իրա ճանաչած մոտավոր վանկերն իրար կողք ա դնում ու ընտրում ամենահավանական համադրությունը՝ ստանալով խելքին մոտ նախադասություն:

Հետաքրքրության համար ուրիշ լեզուներ փորձեցի: Ռուսերենն ու ֆրանսերենը նույն ձևով են, հայերենն ու դանիերենն ընդհանրապես չի հասկանում: Իսկ text to speech-ն ահագին լավացել ա, բայց էլի բավական ռոբոտային ա ձայնը:

**Գաղթական** · 07.02.2017, 23:05

Chuk-ի խոսքերից

Գաղթական ջան, մեկ էլ փորձիր ֆեյսբուքի այ էս խմբում հարցդ գրել. https://www.facebook.com/groups/7326...message_bubble

կամ խումբն արդեն քնելա, կամ էլ` ես դուրները չեկա )))

**Chuk** · 07.02.2017, 23:33

Գաղթական-ի խոսքերից

կամ խումբն արդեն քնելա, կամ էլ` ես դուրները չեկա )))

Էդտեղ գրել ընկերս էր խորհուրդ տվել, բայց իմ հայտն էլ չեն հաստատել։ Կներես

**Գաղթական** · 07.02.2017, 23:57

ինչ «կներես» Չուկ ջան,
հիմա տենց որոշեցին ադմինները ))
մի անգամ էլ մերսի՝ օգնելու ցանկության համար

**Universe** · 12.02.2020, 14:00

Գաղթական-ի խոսքերից

Նախագծման փուլում գտնվող մի սարքի համար անհրաժեշտ է ստեղծել Speech Recognition համակարգ:

Քանի որ բավական հեռու եմ Computational Linguistic-ից, ոլորտին ծանոթներից խնդրում եմ օգնել հասկանալ.
ա) հատկապես ի՞նչ մասնագետ(ներ)-ի է անհրաժեշտ փնտրել (ո՞ր ծրագրերով աշխատող)
բ) մոտավոր որքա՞ն ժամանակ կպահանջվի խնդիրը լուծելու համար
գ) որքա՞ն գումար կարող է դա արժենալ
դ) (սիրողական հարց) ինչպե՞ս պիտի տեղակայվի համակարգը սարքի մեջ (եթե պլատայի կամ չիպի տեսքով, ապա ի՞նչ մեծության)
ե) ինչպե՞ս են պաշտպանվում նման համակարգերի հեղինակային իրավունքները

առայժմ այսքանը ))
նախորոք շնորհակալ եմ

Ֆորումի էս թեմային պատահմամբ միացա... Ոչ բոլոր պատասխաններն եմ կարդացել, կարողա արդեն կա էս տարբերակը, բայց ամենա արագ ռեալիզացվողը դա Փիտոնով գրելնա, գուգլի բիբլիոտեկան օգտագործելով: Եթե խոսքը իհարկե հայերենի մասին չի. Ամեն դեպքում, տաս րոպեում կարող ես նման ծրագիր գրել, որ խոսքը հասկանա ու տեքստի վերածի. բնականաբար հետո պլյուս լոգիկան: Զրոից գրելը դա ֆանտաստիկայի ժանրիցա, էտ տարբերակը մի կողմ միանգամից.

Ամենաաջգ լուծումը, pip բիբլիոտեկայով pip install SpeechRecognition. եթե գուգլով, ապա API key ա պետք ինելու...

**Աթեիստ** · 12.02.2020, 14:59

Էսօր իմացա, որ Գուգլն արդեն սենց բան ունի ։)

**Varzor** · 12.02.2020, 23:59

Աթեիստ-ի խոսքերից

Էսօր իմացա, որ Գուգլն արդեն սենց բան ունի ։)

Microsoft-ը վաղուց ուներ, դե հեռախոսի վրա Google Assistant-ը նույնպես խոսքը տեքստի վերածել կարողանում է:

**Աթեիստ** · 13.02.2020, 02:31

Varzor-ի խոսքերից

Microsoft-ը վաղուց ուներ, դե հեռախոսի վրա Google Assistant-ը նույնպես խոսքը տեքստի վերածել կարողանում է:

Հայերե՞ն

**Ներսես_AM** · 13.02.2020, 03:00

Աթեիստ-ի խոսքերից

Հայերե՞ն

հա, բայց հայերենի համար շատ վատ ա աշխատում ու մեջը մեկ մեկ տրանսլիտ ա կոխում, որտև դե ազգի կեսը տրանսլիտ ա գրում, գուգլն էլ սովորում ա որ էդ նորմալ ա։

Միկրաֆոնը սեղմի‎։

User Tag List

Թեմա: Խոսքի ճանաչում (Speech Recognition)

Թեմայի գործիքներ

Պատկերման եղանակ

Գրառմանը 1 հոգի շնորհակալություն է հայտնել.

Գրառմանը 2 հոգի շնորհակալություն են հայտնել.

Գրառմանը 1 հոգի շնորհակալություն է հայտնել.

Գրառմանը 1 հոգի շնորհակալություն է հայտնել.

Գրառմանը 2 հոգի շնորհակալություն են հայտնել.

Գրառմանը 3 հոգի շնորհակալություն են հայտնել.

Թեմայի մասին

Այս թեման նայող անդամներ

Համանման թեմաներ

Խոսքի ազատություն

Արքայի ճառը / The King’s Speech / Король говорит!

Կապ խոսքի մասը

Սերը սեռ չի՞ ճանաչում։

Խոսքի ուժը

Էջանիշներ

Էջանիշներ

Ձեր իրավունքները բաժնում