User Tag List

Էջ 4 4-ից ԱռաջինԱռաջին 1234
Ցույց են տրվում 46 համարից մինչև 48 համարի արդյունքները՝ ընդհանուր 48 հատից

Թեմա: Խոսքի ճանաչում (Speech Recognition)

  1. #46
    Կեցցե թագավորը Varzor-ի ավատար
    Գրանցման ամսաթիվ
    16.03.2009
    Հասցե
    Երկիր մոլորակ, ՀՀ ք. Երևան
    Տարիք
    39
    Գրառումներ
    7,444
    Mentioned
    12 Post(s)
    Tagged
    0 Thread(s)
    Մեջբերում Աթեիստ-ի խոսքերից Նայել գրառումը
    Հայերե՞ն
    Վայ էդ "հայերենը"
    Լոխ մունք ենք, մնացածը` լոխ են...

  2. #47
    Exterminate Rhayader-ի ավատար
    Գրանցման ամսաթիվ
    20.09.2006
    Հասցե
    Մակոնդո
    Տարիք
    34
    Գրառումներ
    6,277
    Բլոգի գրառումներ
    21
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    Եկեք հասկանանք, որ իրականում մի քանի տարբեր բանի մասին ենք խոսում:

    Սկզբի համար մեզ պետք է միկրոֆոնի լսած հնչյունները վերածել տառերի:

    Լիարժեք speech to text ունենալու համար պետք կլինի նաև հաշվի առնել, որ մեր արտասանությունը ոչ միշտ է կոնսիստենտ, ոչ միշտ է պաուզան նշանակում բառի ավարտ և այլն: Այսինքն՝ մեզ պետք է միկրոֆոնի լսածը համեմատել լեզվի բառարանի հետ, որ վստահ լինենք՝ մարդն ասել է «բարև, ապ, ուշ եմ գալու տուն», ոչ թե «բարև, ապուշ եմ գալու տուն»: Ու որ, ասենք, «հարփել» չի, «հարբել» է: Ու հիշեք՝ եթե առանձին տառերը ճանաչելը հեշտ է (հաճախականային կոնկրետ պատկեր ունեն), ապա ակցենտներն ու կետադրությունն՝ էնքան էլ չէ:

    Որտեղից մենք աստիճանաբար անցնում ենք մի տեղ, որը կոչվում է natural language processing (NLP): Մեզ պետք կլինի հա՛մ տվյալ լեզվի բառարան, որը տեղ է զբաղեցնելու ու պիտի արագ հասանելի լինի, հա՛մ մի հատ ուրիշ, մի քիչ ավելի բարդ բան:

    Որ մենք hardcode չանենք լեզվի բոլոր հնարավոր ստրուկտուրաները մեր ծրագրի մեջ, սովորաբար machine learning ենք օգտագործում: Կարճ ասած, ճիշտ ձևի սեփական պարամետրերը փոխող ծրագիր: Տալիս ենք մուտք՝ մեր խոսացածը: Ստանում ենք ելք: Ելքի մեջ ուղղումներ ենք մտցնում: Ծրագիրն իր պարամետրերը փոխում է, որ մուտքը համապատասխանեցնի ելքին: Էս ծրագրավորման շատ լուրջ խնդիր է՝ ինչ պարամետրեր պիտի կարողանա ծրագիրը կարգավորել, որ ստանա էն, ինչ ուզում է: Բայց եթե ծրագիրը ճիշտ է գրած, աստիճանաբար իր ելքն ավելի ու ավելի հաճախ կլինի ավելի մոտ նրան, ինչ մենք ուզում էինք ստանալ: Սրան ասում ենք AI training: Եդ training data-ն (պարամետրերի հավաքածուն) հետո կարող են առանձին օգտագործել՝ կարիք չկա ամեն անգամ train անել ծրագիրը, ու այն կարող է շարունակել ինքն իրեն train անել, հարմարվել լեզվի փոփոխվող թրենդներին ու առանձին մարդու խոսքային մոդելներին:

    NLP-ի հաջորդ մակարդակում խոսքը վերլուծել ու ասածի իմաստը հասկանալն է, օրինակ՝ ձայնային հրամանների համար, բայց էդ երևի մեր սպեկտրից դուրս է:

    Սա նույնպես թե՛ բավականին շատ ինֆորմացիա է, որը պետք է արագ հասանելի լինի, թե՛ հաշվողական մեծ հզորություն է ուզում:

    Դրա համար շատ դեպքերում հաշվողական մասը փոխանցվում է cloud՝ data center-ների վրա:

    Կան կազմակերպություններ, որոնք սրանով զբաղվում են, ու պրոդուկտներ ունեն, Google Voice API-ի նման:

    Որոշ դեպքերում պարզագույն մասը կարելի է օֆլոուդ անել սարքի վրա, ու էդ ամենն անել օֆլայն, բայց հիշեք՝ էդ սարքից զգալի հզորություն կպահանջի, ու համեմատաբար վերջերս են սմարտֆոնները սկսել նման բան անել (Siri-ն iPhone 4S-ից առաջ չափազանց շատ հզորություն կպահանջեր, դրա համար էլ հասանելի չէր):

    Հիշեք՝ հին հեռախոսների վրա կարողանում էիք մարդկանց անուններին voice tag-եր կցել: Արտասանում էիք մարդու անունը, ձայնային ֆայլ էր սարքում հեռախոսը, ու հետո, երբ ճիշտ կոճակը սեղմում էիք, արտասանում էիք մարդու անունը, հեռախոսը նոր ձայնային ֆայլը համեմատում էր իր գրադարանի հետ, եթե նման բան էր գտնում, զանգում էր դրան կպցրած համարին: Ահավոր ինկոնսիստենտ ու անհարմար բան էր: Հետո՝ կարողանում էիք թելադրել տեքստ, ինքը մոտավորապես T9-ի չափ անհամբեր պինգվին: T9-ի autocorrect-ը մղձավանջային բան է:

    Այ դրա համար էլ ամեն ինչ գնացել է էս ուղղությամբ. օգտագործել machine learning, բայց հաշվարկային հզորության պահանջները տեղափոխել cloud:
    "Sir, do you have a moment to talk about our lords and saviors the Daleks?"

    Voice of the Nightingale - իմ բլոգը

  3. Գրառմանը 1 հոգի շնորհակալություն է հայտնել.

    Աթեիստ (06.12.2020)

  4. #48
    Պատվավոր անդամ
    StrangeLittleGirl-ի ավատար
    Գրանցման ամսաթիվ
    18.03.2006
    Հասցե
    Կոպենհագեն
    Գրառումներ
    24,244
    Բլոգի գրառումներ
    18
    Mentioned
    37 Post(s)
    Tagged
    0 Thread(s)
    Ժող, էս հարցում ի՞նչ առաջընթաց կա: Վերջապես հայերենի որևէ խոսքի մշակման գործիք, թեկուզ թերություններով ստեղծվե՞լ ա։ Մենք հիմա լիքը դատա ունենք, որ կարանք օգտագործենք գոյություն ունեցող որևէ գործիք բարելավելու համար։ Ավելին՝ կարող ա նույնիսկ ֆինանս ճարենք որևէ մեկին վարձատրելու համար, որ վրան աշխատի։

Էջ 4 4-ից ԱռաջինԱռաջին 1234

Թեմայի մասին

Այս թեման նայող անդամներ

Այս պահին թեմայում են 2 հոգի. (0 անդամ և 2 հյուր)

Համանման թեմաներ

  1. Գրառումներ: 22
    Վերջինը: 07.07.2011, 23:56
  2. Խոսքի ազատություն
    Հեղինակ՝ Tig, բաժին` Քաղաքականություն
    Գրառումներ: 14
    Վերջինը: 13.01.2011, 23:16
  3. Կապ խոսքի մասը
    Հեղինակ՝ Tanamasi, բաժին` Հայերեն
    Գրառումներ: 26
    Վերջինը: 20.11.2009, 02:58
  4. Սերը սեռ չի՞ ճանաչում։
    Հեղինակ՝ Moon, բաժին` Սեր, զգացմունքներ, ռոմանտիկա
    Գրառումներ: 234
    Վերջինը: 01.07.2008, 01:33
  5. Խոսքի ուժը
    Հեղինակ՝ Մելիք, բաժին` Հոգեբանություն և փիլիսոփայություն
    Գրառումներ: 15
    Վերջինը: 12.03.2008, 00:55

Էջանիշներ

Էջանիշներ

Ձեր իրավունքները բաժնում

  • Դուք չեք կարող նոր թեմաներ ստեղծել
  • Դուք չեք կարող պատասխանել
  • Դուք չեք կարող կցորդներ տեղադրել
  • Դուք չեք կարող խմբագրել ձեր գրառումները
  •