User Tag List

Էջ 1 2-ից 12 ՎերջինըՎերջինը
Ցույց են տրվում 1 համարից մինչև 15 համարի արդյունքները՝ ընդհանուր 25 հատից

Թեմա: Ansi to Unicode

  1. #1
    Սկսնակ անդամ
    Գրանցման ամսաթիվ
    27.01.2007
    Գրառումներ
    35
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Ansi to Unicode

    Բարի լույս,

    ANSI to Unicode կովերտացիայի դեպքում առկա ծրագրերում (օրինակ՝ Armenian Unicode Converter ) հիմնականում ճիշտ չի փոխակերվում ANSI-ում եղած չակերտները «» Unicode-ում դրա փոխարեն հայտնվում է ստորակետ կամ փոքրատառ ե, խնդիրներ կան միջակետը հետ և այլն։
    Որոշ ծրագրերում կան կովերտացիայի MAP-ը օգտագործողի կողմից փոխելու հնարավորություն (օրինակ KDWIN, սակայն այն սկզբունքորեն չեմ օգտագործում քանի որ հնարավոր չէ անջատել լեզուները)։
    Կհուշեք արդյոք այլ ծրագրեր, որտեղ ինչպես Armenian Unicode Converter -ում կոնվերտացիան կատարվում է առանձին պատուհանում, (Word-ից դուրս), սակայն ունի նաև կոնվերտացիայի MAP-ը փոխելու հնարավորություն։
    Կամ ինչպես KDWIN-ից հանել լեզուները ու թողնել միայն կոնվերտացիայի հնարավորությունը։
    Շնորհակալ եմ
    Վերջին խմբագրող՝ Chuk: 11.11.2008, 17:22: Պատճառ: Անձնական տվյալների հեռացում

  2. #2
    Մշտական անդամ Xelgen-ի ավատար
    Գրանցման ամսաթիվ
    17.10.2008
    Հասցե
    Երևան
    Գրառումներ
    344
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Իսկ ինչնե՞ք ուզում փոխակերպել։
    Եթե ՄՍ Օֆիսի դոկ/քլս-ները, բավականին հաջող են Թարումենի մակորսները, կարող եք նաև թուլբարի վրա հանել, որ ձեռքի տակ լինեն։
    http://fonts.tarumian.am/index_programs.php

  3. #3
    Պապա x3 Աթեիստ-ի ավատար
    Գրանցման ամսաթիվ
    26.05.2007
    Հասցե
    Հայաստան
    Տարիք
    45
    Գրառումներ
    8,706
    Mentioned
    49 Post(s)
    Tagged
    1 Thread(s)

    Re. Ansi to Unicode

    Անցյալ գիշեր եմ գրել:

    Կոդ:
    Sub Normal2Unicode()
    '
    ' Normal2Unicode
    ' Created by A†eis†
    '
    Ss = Selection.Start
    Se = Selection.End
    If Se - Ss < 0 Then End
    For i = Ss To Se - 1
    
    Selection.Start = i
    Selection.End = i + 1
    tar = Selection
    If AscW(tar) = 164 Or AscW(tar) = 165 Then GoTo 10
    If AscW(tar) = 167 Then Selection = chr(171)
    If AscW(tar) = 166 Then Selection = chr(187): GoTo 10
    If tar = chr(187) Then Call unicode_stugum: GoTo 10 ' Pakogh chakerti Yev YE tari problem
    If AscW(tar) = 168 Then Selection = ChrW(1415) 'yev tar@
    If AscW(tar) = 177 Then Selection = ChrW(1374) ' harcakan nshan
    If AscW(tar) < 178 Or AscW(tar) > 253 Then GoTo 10
    If AscW(tar) / 2 = AscW(tar) \ 2 Then Selection = ChrW(1328 + (AscW(tar) - 176) / 2)
    If AscW(tar) / 2 <> AscW(tar) \ 2 Then Selection = ChrW(1376 + (AscW(tar) - 177) / 2)
    
    10: Next i
    Selection.Start = Ss
    Selection.End = Se
    Selection.Font.Name = "tahoma armenian"
    End Sub
    
    Sub unicode_stugum() 
    '
    ' Normal2Unicode
    ' Created by A†eis†
    ' Yete hajord tar@ ASCII -e nshanakum e da YE tarn e
    '
    ascii = False
    HinSel = Selection.Start
    Selection.Start = HinSel + 1
    Selection.End = HinSel + 2
    If AscW(Selection) < 1000 And AscW(Selection) <> 32 And AscW(Selection) <> 13 Then ascii = True
    Selection.Start = HinSel
    Selection.End = HinSel + 1
    If ascii Then Selection = ChrW(1381)
    End Sub
    Էականորեն տարբերվում է Թարումյանի տարբերակից և մոտեցումով և ծավալով:
    Չակերտների հարցը լուծված է (մասամբ), միջակետը չեմ ստուգել:
    Սպասում եմ Ձեր կարծիքներին և գտած վրիպակներին:
    artak.am De gustibus et coloribus non est disputandum.

  4. #4
    Սկսնակ անդամ
    Գրանցման ամսաթիվ
    27.01.2007
    Գրառումներ
    35
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Շնորհակալ եմ արձագանքելու համար,
    սակայն ամբողջ խնդիրը նրանում էր, որ WORD-ում աշխատելը իմ դեպքում այդքան էլ հարմար չէր։
    Անհրաժեշտ էր առանձին ու անկախ պատուհանով աշխատող մի ծրագիր, որտեղ պետք կլիներ ասենք Quark-ից բերել տեքստերն ու փոխակերպել։
    Հարգանքով՝
    Մարատ

  5. #5
    Պապա x3 Աթեիստ-ի ավատար
    Գրանցման ամսաթիվ
    26.05.2007
    Հասցե
    Հայաստան
    Տարիք
    45
    Գրառումներ
    8,706
    Mentioned
    49 Post(s)
    Tagged
    1 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Marat-ի խոսքերից Նայել գրառումը
    Շնորհակալ եմ արձագանքելու համար,
    սակայն ամբողջ խնդիրը նրանում էր, որ WORD-ում աշխատելը իմ դեպքում այդքան էլ հարմար չէր։
    Անհրաժեշտ էր առանձին ու անկախ պատուհանով աշխատող մի ծրագիր, որտեղ պետք կլիներ ասենք Quark-ից բերել տեքստերն ու փոխակերպել։
    Հարգանքով՝
    Մարատ
    Կարող եմ և նման բան գրել (նախորոք նշիր թե սրա ինչը դուրդ չի գալիս ), բայց Word-ի տարբերակն այնքանով է հարմար, որ պահում է տեքստի ֆորմատը:
    artak.am De gustibus et coloribus non est disputandum.

  6. #6
    Սկսնակ անդամ
    Գրանցման ամսաթիվ
    27.01.2007
    Գրառումներ
    35
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Աթեիստ-ի խոսքերից Նայել գրառումը
    Կարող եմ և նման բան գրել (նախորոք նշիր թե սրա ինչը դուրդ չի գալիս ), բայց Word-ի տարբերակն այնքանով է հարմար, որ պահում է տեքստի ֆորմատը:
    Այդ ծրագրում, ինչպես արդեն ասվել է, դեպի Unicode ճիշտ չեն փոխակերպվում որոշ տառեր ու նշաններ (չակերտ, միջակետ) և այլն։ Բացի այդ, հայկական ANSI տառատեսակները նույնպես միասնական ստանդարտով չեն, կան որոնք ունեն «և», կան, որոնք չունեն, հետո տարբեր են -, բազմակետի, միջակետի և այլն տեղերը։ Տիպիկ համամետություն Թարումյան ArialAM-ը ասենք DALLAK կամ ArialArmenian, TimesArmenian-ի հետ։ Ինքներդ կհամոզվեք։ Հիմա եթե լինի փոխակերպման MAP-ը ըստ օգտվողի հայեցողության փոխելու հնարավորություն, ապա կախված տառատեսակից նա ինքը կարող է շտկել բոլոր թերությունները։
    Իսկ կոնկրետ իմ դեպքում, կա հատուկ պատվիրված ANSI տառատեսակ, որը շատ ավելի խառն է քան վերոնշյալները։ Իսկ անհրաժեշտ է գոնե 95%-անոց ճիշտ դեպի Unicode փոխակերպում։ Կան դեպքեր, երբ Word-ի ֆորմատը էլ կարևոր չէ, ավելի հեշտ է փոխակերպել ու հետո ֆորմատավորել։
    Հուսամ փաստարկները բավարար համոզիչ էին «Կարող եմ և նման բան գրել»-ը նախաձեռնելու համար։ Ես պատրաստ եմ աջակցել ինչով կկարողանամ։
    Հարգանքով
    Մարատ

  7. #7
    Սկսնակ անդամ
    Գրանցման ամսաթիվ
    27.01.2007
    Գրառումներ
    35
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Աթեիստ-ի խոսքերից Նայել գրառումը
    Անցյալ գիշեր եմ գրել:

    Կոդ:
    Sub Normal2Unicode()
    '
    ' Normal2Unicode
    ' Created by A†eis†
    '
    Ss = Selection.Start
    Se = Selection.End
    If Se - Ss < 0 Then End
    For i = Ss To Se - 1
    
    Selection.Start = i
    Selection.End = i + 1
    tar = Selection
    If AscW(tar) = 164 Or AscW(tar) = 165 Then GoTo 10
    If AscW(tar) = 167 Then Selection = chr(171)
    If AscW(tar) = 166 Then Selection = chr(187): GoTo 10
    If tar = chr(187) Then Call unicode_stugum: GoTo 10 ' Pakogh chakerti Yev YE tari problem
    If AscW(tar) = 168 Then Selection = ChrW(1415) 'yev tar@
    If AscW(tar) = 177 Then Selection = ChrW(1374) ' harcakan nshan
    If AscW(tar) < 178 Or AscW(tar) > 253 Then GoTo 10
    If AscW(tar) / 2 = AscW(tar) \ 2 Then Selection = ChrW(1328 + (AscW(tar) - 176) / 2)
    If AscW(tar) / 2 <> AscW(tar) \ 2 Then Selection = ChrW(1376 + (AscW(tar) - 177) / 2)
    
    10: Next i
    Selection.Start = Ss
    Selection.End = Se
    Selection.Font.Name = "tahoma armenian"
    End Sub
    
    Sub unicode_stugum() 
    '
    ' Normal2Unicode
    ' Created by A†eis†
    ' Yete hajord tar@ ASCII -e nshanakum e da YE tarn e
    '
    ascii = False
    HinSel = Selection.Start
    Selection.Start = HinSel + 1
    Selection.End = HinSel + 2
    If AscW(Selection) < 1000 And AscW(Selection) <> 32 And AscW(Selection) <> 13 Then ascii = True
    Selection.Start = HinSel
    Selection.End = HinSel + 1
    If ascii Then Selection = ChrW(1381)
    End Sub
    Էականորեն տարբերվում է Թարումյանի տարբերակից և մոտեցումով և ծավալով:
    Չակերտների հարցը լուծված է (մասամբ), միջակետը չեմ ստուգել:
    Սպասում եմ Ձեր կարծիքներին և գտած վրիպակներին:
    Բառավերջի ե-ն դարձնում է փակող չակերտ,
    ճիշտ չի փոխակերպում հետևյալ նշանները՝
    բացականչական նշան, բութ, շեշտ, միջակետ, բազմակետ ենթամնա, բաժանման գծիկ

  8. #8
    Հայաստան! Egern.net-ի ավատար
    Գրանցման ամսաթիվ
    23.03.2006
    Հասցե
    Երևանյան լճի հարևանությամբ
    Տարիք
    32
    Գրառումներ
    1,091
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Marat-ի խոսքերից Նայել գրառումը
    Բառավերջի ե-ն դարձնում է փակող չակերտ,
    ճիշտ չի փոխակերպում հետևյալ նշանները՝
    բացականչական նշան, բութ, շեշտ, միջակետ, բազմակետ ենթամնա, բաժանման գծիկ
    Մարատ ջան !

    Ես Ձեզ PMով բացատրեցի, թե ինչումն է այդ ե-ի պրոբլեմը....

  9. #9
    Մշտական անդամ Xelgen-ի ավատար
    Գրանցման ամսաթիվ
    17.10.2008
    Հասցե
    Երևան
    Գրառումներ
    344
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Ոչ մի տարբերակը ասյտեղ բերված չեմ ստուգել, կներեք ժամանակ չկա։
    Պարզապես մեկ խնդրանք, մինչև դռայվեր/փոխարկիչ գրելը նայեք պաշտոնական ստանդարտին։
    http://www.unicode.org/charts/

    Մի կես տարի առաջ մեկ նախագծի համար 10-ից ավելի փոխարկիչ/դռայվեր էի նայում և 10-ից 2-ն էին որ կորրեկտ անում էին դա։ Օրինակ հայերեն վեջակետի փոխարեն լատիներեն երկուկետ էին դնում։ Եթե «էկրանի վրա ամեն ինչ նորմալ է երևում» դա դեռ չի նշանակում, որ ծրագիրը կորրեկտ աշխատում է։ Իսկ երբ անհրաժեշտություն կառաջանա տեսքը մեքենայական անալիզի ենթարկել, սեմանտիկ-վեբում օգտագործել այդ կիսահայերեն-կիսաանգլերեն տեքստը շատ անիմաստ գլխացավանք է առաջացնում։

  10. #10
    Մշտական անդամ Xelgen-ի ավատար
    Գրանցման ամսաթիվ
    17.10.2008
    Հասցե
    Երևան
    Գրառումներ
    344
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մի քիչ էլ «յազվայություն» անեմ՝
    Normal2Unicode ետ ARMSCII-ն է նորմա՞լ։

    Ինքը հակասում է հենց ASCII ստանդարտին և տառերի մի մասը գնտվում են այնտեղ որտեղ իրավունք չունեն գտվելու՝ համակարգային/ծառայողական նշաններ և այլն։ Նույն հայտնի «գ» տառի խնդիրը։
    Եթե օրինակ կարելի է միանշանակ հասկնալ որ մուտքը իրականցվում է ասենք թե կիռիլիկ cp-1251-ով ապա ARMSCII դեպքում դա հնարավոր չի, պետք է հատուկ անալիզի ենթարկել ընդհուպ մինչև փոքր նեյրոնային ցանցեր, որ հասկանաս որ անգլերեն չի հավաքվում տեքստը այլ հայերեն։

  11. #11
    Մշտական անդամ Սահակ-ի ավատար
    Գրանցման ամսաթիվ
    22.03.2006
    Հասցե
    ԱՄՆ
    Տարիք
    44
    Գրառումներ
    477
    Բլոգի գրառումներ
    29
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Քանի խոսք ա բացվել Յունիկոդ փոխարկիչների մասին, մի բան էլ ես ասեմ։ Հայերեն միջակետը Յունիկոդում U+2024 համարի տակ ա կոդավորված։

  12. #12
    Սկսնակ անդամ
    Գրանցման ամսաթիվ
    27.01.2007
    Գրառումներ
    35
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Սահակ-ի խոսքերից Նայել գրառումը
    Քանի խոսք ա բացվել Յունիկոդ փոխարկիչների մասին, մի բան էլ ես ասեմ։ Հայերեն միջակետը Յունիկոդում U+2024 համարի տակ ա կոդավորված։
    Միջակետը U+2024-ի համար «մտածված է», սակայն դեռ ստանդարդիզացված չէ, ինչքան ես եմ տեղյակ, համենայն դեպս միջազգայնորեն. Յունիկոդ 5.1-ում դեռ հայերեն միջակետն և լատինական վերջակետը համընկնում են, ինչը խնդիրներ է առաջացնում օրինակ Word-ում հայերեն Յունիկոդ տեքստ հավաքելիս, երբ միջակետից հետո ավտոմատ մեծատառ է սարքում, քանի դեռ այդ ֆունկիցան չես անջատել։ Ահա թե ինչու է U+2024-ի տարբերակը մտածված։
    Սա արդեն պետական խնդիր է և միայն պետական մակարդակով կարծում եմ կարելի է հետամուտ լինել խնդրի լուծմանը։
    Այնուամենայնիվ, դեռ բաց է մնում «նորմալ» կամ «ընդունելի» առանձին պատուհանով փոխարկիչ գտնելու ցանկությունը։

  13. #13
    Հայաստան! Egern.net-ի ավատար
    Գրանցման ամսաթիվ
    23.03.2006
    Հասցե
    Երևանյան լճի հարևանությամբ
    Տարիք
    32
    Գրառումներ
    1,091
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    ե-ի հետ կապված.
    Սովորական ֆոնտերում (այդ թվում` Յունիկոդ) Latin-1 բաժնում 0xAB կոդին (տասական համակարգում` 171) համապատասխանում է բացվող չակերտը, իսկ 0xBB կոդին (187) փակվող չակերտը: Յունիկոդից ANSI փոխակերպման ժամանակ այդ սիմվոլները (ինչպես ամբողջ Latin-1-ը և ոչ միայն) չեն փոխակերպվում` մնում են նույնը: Իսկ "հայերեն" ֆոնտերում, մասնավորապես ասենք Arial LatArm-ում 0xAB-ին համապատասխանում է ստորակետը, իսկ 0xBB-ին` ե փոքրատառը:

    Հիմա Յունիկոդի մասին.
    Իմ կոնվերտերը գրելուց ես հիմնվել եմ Arial Unicode ֆոնտի վրա: Այդ ֆոնտում հայերենի բաժնում չակերտները գտնվում են 0x0559 և 0x055A համարների տակ: Էդ պատճառով երբ որ AUC-ում ANSI-ով գրում եք չակերտներ (0xA7 և 0xA6) կոնվերտերը փոխակերպում է 559 և 55A: Եվ հակառակը: Այսինքն` այս ֆոնտով աշխատելուց խնդիրներ չկան:

    Խնդիրը կայանում է նրանում, որ Յունիկոդում 559 և 55A կոդերի համար սահմանված են այլ սիմվոլներ` մասնավորապես Modifier Letter Left Half Ring և Armenian Apostrophe: Այդ պատճառով երբ որ AUC-ով կոնվերտ արված տեքստը նայում եք այլ Յունիկոդ ֆոնտով (օրինակ` Sylfaen կամ ասենք Tahoma Armenian), չակերտների փոխարեն երևում են ապաթարցի նման սիմվոլներ:

    Իսկ չակերտներ որպես այդպիսին Յունիկոդի հայերեն բաժնում սահմանված չեն: Հավանաբար նախատեսված է օգտագործել Latin-1-ում գտնվող AB և BB սիմվոլները, որոնք պատահականորեն "վերադրվում են" Հայերեն ANSI ֆոնտերում ստորակետի ու ե տառի հետ...

  14. #14
    Մշտական անդամ Սահակ-ի ավատար
    Գրանցման ամսաթիվ
    22.03.2006
    Հասցե
    ԱՄՆ
    Տարիք
    44
    Գրառումներ
    477
    Բլոգի գրառումներ
    29
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Մեջբերում Marat-ի խոսքերից Նայել գրառումը
    Միջակետը U+2024-ի համար «մտածված է», սակայն դեռ ստանդարդիզացված չէ, ինչքան ես եմ տեղյակ, համենայն դեպս միջազգայնորեն. Յունիկոդ 5.1-ում դեռ հայերեն միջակետն և լատինական վերջակետը համընկնում են, ինչը խնդիրներ է առաջացնում օրինակ Word-ում հայերեն Յունիկոդ տեքստ հավաքելիս, երբ միջակետից հետո ավտոմատ մեծատառ է սարքում, քանի դեռ այդ ֆունկիցան չես անջատել։ Ահա թե ինչու է U+2024-ի տարբերակը մտածված։
    Սա արդեն պետական խնդիր է և միայն պետական մակարդակով կարծում եմ կարելի է հետամուտ լինել խնդրի լուծմանը։
    Այնուամենայնիվ, դեռ բաց է մնում «նորմալ» կամ «ընդունելի» առանձին պատուհանով փոխարկիչ գտնելու ցանկությունը։
    Մարատ ջան,
    U+2024 արդեն վաղուց ընդունված է Յունիկոդի կողմից։
    Խնդրեմ կարդա պաշտոնական Յունիկոդ ստանդարդի հայերենին վերաբերվող մասը՝ http://www.unicode.org/versions/Unicode5.0.0/ch07.pdf
    Մեջբերում եմ հենց այդ ստանդարտից՝ "A shorter stop functioning like the semicolon is called mijaket; it is represented by U+2024 . one dot leader ."

    Սա շատ վաղուց էր ընդունված, և Լինուքսում հայերեն ստեղնաշարը U+2024 է օգտագործում միջակետի համար։

  15. #15
    Հայաստան! Egern.net-ի ավատար
    Գրանցման ամսաթիվ
    23.03.2006
    Հասցե
    Երևանյան լճի հարևանությամբ
    Տարիք
    32
    Գրառումներ
    1,091
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)

    Re. Ansi to Unicode

    Դրել եմ կոնվերտերի օնլայն տարբերակը` http://egern.net/auc.htm

    Կա նաև "օֆլայն" տարբերակ` .hta ֆորմատով http://egern.net/auc.zip

  16. Գրառմանը 1 հոգի շնորհակալություն է հայտնել.

    SDes77 (15.10.2009)

Էջ 1 2-ից 12 ՎերջինըՎերջինը

Թեմայի մասին

Այս թեման նայող անդամներ

Այս պահին թեմայում են 1 հոգի. (0 անդամ և 1 հյուր)

Համանման թեմաներ

  1. Յունիկոդ vs. ANSI
    Հեղինակ՝ Rammstein, բաժին` Համակարգիչ
    Գրառումներ: 10
    Վերջինը: 05.07.2010, 15:53
  2. Նոր Unicode Converter
    Հեղինակ՝ Edgar Marukyan, բաժին` Համակարգչային ծրագրեր
    Գրառումներ: 13
    Վերջինը: 05.12.2009, 15:13
  3. Unicode-ով տեքստ հավաքելը VB 6.0
    Հեղինակ՝ Arthur26, բաժին` Ծրագրավորում
    Գրառումներ: 7
    Վերջինը: 10.11.2008, 00:36

Էջանիշներ

Էջանիշներ

Ձեր իրավունքները բաժնում

  • Դուք չեք կարող նոր թեմաներ ստեղծել
  • Դուք չեք կարող պատասխանել
  • Դուք չեք կարող կցորդներ տեղադրել
  • Դուք չեք կարող խմբագրել ձեր գրառումները
  •