PDA

Դիտել ողջ տարբերակը : Նոր Unicode Converter



Edgar Marukyan
17.12.2007, 09:34
Ձեզ եմ ներկայացնում Armenian Smart Converter ծրագիրը, որը հնարավորություն է ընձեռնում վերարտադրել Microsoft Word (.doc) ծրագրով ստեղծած փաստաթղթերը` դարձնելով նոր միջազգային UNICODE ստանդարտին համապատասխան, ընդ որում նույնությամբ պահպանելով փաստաթղթի ամբողջ ձևավորումը…
Ծրագրի ցուցադրական վարկածը կարող եք անվճար ձեռք բերել http://www.unicode.am/ վեբ կայքից:

Հիդրոգեն
04.12.2009, 21:56
Այսինքն Phonetic-ը վեր ա ածում Unicode-ի(ստեղ «՞» որտե՞ղ դնեմ)? Բայց դրա համար ծրագիր պետք չի - բավական ա համապատասխան սկրիպտ կազմել:

Chuk
04.12.2009, 22:49
Այսինքն Phonetic-ը վեր ա ածում Unicode-ի(ստեղ «՞» որտե՞ղ դնեմ)?
Այս միտքը, ճիշտն ասած անգրագիտություն է:
Որովհետև մի դեպքում գործ ունենք տառատեսակների կոդավորման հետ, մյուս դեպքում գործ ունենք ստեղնաշարային դասավորության հետ:

Phonetic-ը ստեղնաշարային դասավորություն է, պարզ կերպով կարող եմ սահմանել այսպես. սրանով սահմանվում է, թե ստեղնաշարի որ ստեղնին տվյալ լեզվի այբուբենի որ տառն է համապատասխանում: Phonetic դասավորությունները սովորաբար հիմնվում են ստեղնաշարի ամերիկյան դասավորության վրա և տվյալ ստեղնին համապատասխանացնում ստեղնաշարային հայտնի դասավորությամբ տվյալ տառին հնչյունով մոտ տառը, օրինակ A-ին Ա, T-ին Տ և այլն:

Կան նաև այլ դասավորություններ, օրինակ typewriter (հայերեն՝ գրամեքենային) դասավորություններ, որոնք որպես կանոն լավ մշակված դասավորություններ են, հաշվի են առնում տվյալ լեզվի առանձնահատկությունները, դասավորված են այնպես, որ մեքենագրելիս հաճախ հանդիպող տառերն, օրինակ, լինեն ուժեր ցուցամատի հարվածի տակ, այլ ոչ թե թույլ ճկույթի: Օրինակ իմ կիրառած դասավորությունը գրամեքենային է, ես այն կոչում եմ հին գրամեքենային, ունի այս տեսքը.

՝ ճ ջ ժ ձ յ ռ ր ց է ղ - _
փ բ ս մ ո ւ կ ը թ ծ օ ֆ
վ գ ե ա ն ի տ հ պ ; և
դ չ զ լ ք խ շ , .

Իսկ այ Յունիկոդը տառատեսակների կոդավորում է: Ի՞նչ է սա նշանակում: Տառատեսակը պատկերացնենք աղյուսակի տեսքով, որտեղ ամեն կոդին մի տառ է համապատասխանում: Այդ համապատասխանության կանոնը հենց կոդավորումն է:

Հնարավորինս պարզ լեզվով եմ գրելու. այսպես, հին ֆոնտերում այդ աղյուսակը կազմված էր 256 տողից (8 բիտանոց էին, 2-ի 8 աստիճան տող): Օրինակ 65-ից 90 տեղերը նախատեսված էին լատիներեն A-ից Z տառերի համար, 97-ից 122 տողերը a-ից z տառերի համար, և այլն: Այս կոդավորումը կոչվում է ASCII կոդավորում, ու ունի իր մասնավոր դեպքերը: Այդպիսիքից է ArmSCII-8 կոդավորումը, որում 161-ից 256 դաշտերը նախատեսված են հայերեն տառերի ու այլ գրանշանների, այդ թվում կետադրական նշանների համար: Բնական է, որ այսպիսի կոդավորումը չի թույլատրում մեկ տառատեսակում պահել բոլոր լեզուների տառերի, և օրինակ Windows-1251 կոդավորմամբ ֆոնտերում ռուսերեն տառերի համար կիրառվում են ճիշտ նույն տողերը, ինչ ArmSCII-8-ում հայերենի համար:

Այս խնդիրը լուծելու համար ներմուծվեց նոր կոդավորում Unicode: Կան 16 բիտանոց ու 32 բիտանոց Unicode տառատեսակներ՝ համապատասխանաբար 2-ի 16 աստիճան (65536) և 2-ի 32 աստիճան (4294967296) տողերով: Տողերի քանակը հնարավորություն է տալիս ամեն լեզվի համար առանձնացնել որոշակի տիրույթ ու մի ֆոնտի մեջ պահել բոլոր լեզուների, այբուբենների տառերը: Մասնավորապես հայերեն տառերի համար առանձնացված է 1329-ից 1417 և որոշ այլ տողեր, ռուսերենի համար՝ 1025-ից 1119 և որոշ այլ տողեր:

ArmSCII-8 կոդավորմամբ տառատեսակի հայտնի օրինակներ են Arial Armenian-ը և Arial AM-ը:

Unicode կոդավորմամբ տառատեսակների հայտնի օրինակներ են Arial Unicode-ը և Sylfaen-ը:

Բնականաբար, եթե հայերեն տեքստը գրված է ArmSCII-8 կոդավորմամբ, ապա այն նայել Unicode կոդավորմամբ ֆոնտով, օրինակ Sylfaen-ով չի ստացվի, որովհետև համապատասխան տողերում լրիվ այլ սիմվոլներ, գրանշաններ են:

Փոխարկումը վերաբերվում է կոդավորումներին: Այսինքն պետք է փոխվեն տեքստի մեջ տառերի կոդերը: Եթե Ա տառի կոդը ArmSCII-8-ում 178 է, իսկ Unicode-ում 1329-ը, ապա պետք է 178-ը փոխել 1329-ում (նկատենք, որ փաստաթղթերում պահվում են տառերի կոդերը, իսկ արդեն տառատեսակը տվյալ կոդի համար նկարում է համապատասխան տողում պատկերված նկարը, գրանշանը):

Հասանք փոխարկիչներին. անշուշտ նման փոխարկումների համար կարելի է գրել script և նման բազում script-եր կգտնեք ինտերնետում (օրինակ՝ http://hayeren.am/?p=Convertor և http://egern.net/auc.htm ): Բայց հաճախ ավելի հարմար են դրա համար առանձին նախատեսված ծրագրերը, որոնք, օրինակ, կարելի է կիրառել ինտերնետ չեղած ժամանակ, կամ ավելի ճկունները անմիջապես անհրաժեշտ ծրագրի (Microsoft Word, Adobe InDesign և այլն) մեջ:

Rammstein
05.12.2009, 02:05
Ես օգտագործում եմ Arlex Text Converter-ը, որը ոչ միայն փոխում է ANSI-ն Յունիկոդի ու հակառակը, այլեւ դասական ուղղագրությունը բոլշեւիկյանի եւ հակառակը: :)

Հիդրոգեն
05.12.2009, 03:06
ASCII և Phonetic հասկացությունները մոտս հոմանիշների կարգավիճակ էին ձեռք բերել, որտև երբ նոր էի ֆոնտերի հետ ծանոթանում, ուշադրությունս գրավել էին Kdwin-ի Armenian Phoenetic և Armenian Phoenetic Unicode դասավորվածությունները: Ըտեղից սխալ եզրակացություն էի արել, որ մեկը հին տարբերակի ֆոնտերով ստեղնաշարն է ակտիվացնում, իսկ մյուսը նորը՝ յունիկոդը:

... անշուշտ նման փոխարկումների համար կարելի է գրել script և նման բազում script-եր կգտնեք ինտերնետում (օրինակ՝ http://hayeren.am/?p=Convertor և http://egern.net/auc.htm ): Բայց հաճախ ավելի հարմար են դրա համար առանձին նախատեսված ծրագրերը, որոնք, օրինակ, կարելի է կիրառել ինտերնետ չեղած ժամանակ, կամ ավելի ճկունները անմիջապես անհրաժեշտ ծրագրի (Microsoft Word, Adobe InDesign և այլն) մեջ:
Ես հենց վերջի տարբերակի մասին էլ հարցնում էի: Իսկ ավելի կոնկրետ՝ MS Word-ի համար գրած սկրիպտի մասին էի ասում: Մասնավորապես, կցված մեկը ես մոտավորապես տարի առաջ քաշել էի մի հայկական ֆորումից, հասցեն դժվար հիշեմ, բայց ավելի շատ ծրագրավորողների վրա էր ուղղված, ու թեթևակի ճշտգրտումներ մցրել նրա մեջ, քանի որ բնօրինակը որոշ տառեր միևնույնն է սխալ էր փոխակերպում: Հնարավոր է, այդ փոփոխություններ մցնելից ես հենց ստեղ էլ օգնության թեմա եմ բացել, բայց համոզված չեմ:
լրացում: սկրիպտը ստեղ գցեցի http://ifolder.ru/15315977

Chuk
05.12.2009, 03:15
Հնարավոր է, որ սրա հետ ես.


Armenian Text Converter
ծրագիրը նախատեսված է MS Word ծրագրում տարատեսակ կոդավորմամբ տեքստերը այլ կոդավորումների փոխարկելու համար (ArmSCII<>Unicode, ArmSCII<>ArmStandart, ArmStandart<>Unicode, Cyrilic-1251<>Unicode):

Պաշտոնական կայք (http://dm-lab.sci.am/)
Հղումը Network.am կայքում (http://network.am/More/ArmenianTextConverter)

Բայց ճիշտն ասած չհասկացա, թե հարցն ի՞նչ էր :oy

Հիդրոգեն
05.12.2009, 03:26
Բայց ճիշտն ասած չհասկացա, թե հարցն ի՞նչ էր :oy
Հարցը առանձին ծրագիր հիմնելու նպատակահարմարության մասին էր, երբ կարելի է նույն գործողությունները կատարել եզակի սկրիպտի միջոցով: Միտքը բացեմ, որ իմաստը պարզ լինի: Եթե դու ստիպված ես աշխատել օտար համակարգչի վրա և ունես միայն խիստ սահմանափակված user-account, ապա ծրագրի վրա հիմնվելը կարող ժամանակի կորստով անդրադառնալ: Հաշվի ենք առնում պայմաններ, որոնք մեջ մտնում է ինտերնետի բացակայությունը: Իսկ սկրիպտն աշխատացնելու համար արդեն ավելի շատ հնարավորություններ ունես: Դժվար Word-ի մեջ դա փակված լինի:

Chuk
05.12.2009, 03:41
Հարցը առանձին ծրագիր հիմնելու նպատակահարմարության մասին էր, երբ կարելի է նույն գործողությունները կատարել եզակի սկրիպտի միջոցով: Միտքը բացեմ, որ իմաստը պարզ լինի: Եթե դու ստիպված ես աշխատել օտար համակարգչի վրա և ունես միայն խիստ սահմանափակված user-account, ապա ծրագրի վրա հիմնվելը կարող ժամանակի կորստով անդրադառնալ: Հաշվի ենք առնում պայմաններ, որոնք մեջ մտնում է ինտերնետի բացակայությունը: Իսկ սկրիպտն աշխատացնելու համար արդեն ավելի շատ հնարավորություններ ունես: Դժվար Word-ի մեջ դա փակված լինի:

Իսկ եթե դու Word-ով չե՞ս աշխատում, օրինակ, ինչպես որ ես Word-ով չեմ աշխատում:
Իսկ եթե ընտրել ես Word-ին համարժեք ծրագիրն ասենք OpenOffice փաթեթի՞ց:
Կամ կիրառում ես կոնկրետ ուղղվածությամբ պրոֆեսիոնալ ծրագրեր, ինչպիսիք են Quark XPress-ը, Adobe InDesign-ը, Adobe PageMaker-ը.. իսկ եթե դու ունես տեքստ, որը քեզ պետք է կայքիդ մեջ օգտագործելու համար ասենք Adobe Dreamweaverum դնելու համար, կամ ինչ-որ վեբ բրոուզերի համապատասխան միջավայրում, կայքում: Իսկ եթե քեզ էդ տեքստը փոխարկել է պետք նամակով ուղարկելու համար ասենք Mozilla Thunderbird ծրագրով: Վերջապես հասկանանք, որ Microsoft Word ծրագիրը ստանդարտ չի, որը պարտադիր պետք է լինի ամեն համակարգչի մեջ, լինելու դեպքում անպայման հարմար լինի, հարմար լինելու դեպքում անպայման կիրառվի:

Իսկ ամեն ծրագրի համար առանձին script գրելը մեղմ ասած այնքան էլ դյուրին գործ չի, էլ չասած, որ կան ծրագրեր, որոնք դրա հնարավորությունն ուղղակի չեն տալիս: Այլ կերպ ասած առանձին ծրագրի դերն ու նշանակությունը պետք չի թերագնահատել, չնայած որ անշուշտ կլինեն առանձին դեպքեր, երբ Word-ի script-ն անհամեմատ ավելի հարմար կլինի առանձին ծրագրից:

Chuk
05.12.2009, 04:16
Ձեզ եմ ներկայացնում Armenian Smart Converter ծրագիրը, որը հնարավորություն է ընձեռնում վերարտադրել Microsoft Word (.doc) ծրագրով ստեղծած փաստաթղթերը

Նոր միայն կարդացի ծրագրի՝ առաջին գրառման մեջ արված նկարագրությունը և հասկացա հարցի պատճառը:
Ճիշտն ասած ես խոսում էի ընդհանրապես առաձին փոխարկիչ ծրագրերի գոյության մասին, այլ ոչ թե կոնկրետ այս մեկի: Կոնկրետ այս ծրագրի մասին հստակ ձևավորած կարծիք չունեմ, քանի որ փորձել եմ շուտ, քիչ եմ փորձարկել, ու միայն կարող եմ արձանագրել, որ եղել է դեպք, երբ error հաղորդագրություն է բերել՝ փոխարկումը չանելով:
Բայց ծրագրի նկարագրությունը, պիտի ասեմ, սպառիչ չի գրած: Որովհետև ծրագիրը ոչ միայն Ms Word-ի .doc փաստաթղթերն է ունակ փոխարկել, այլև պարզ տեսքտային փաստաթղթերը (.txt), ինչպես նաև html փաստաթղթերը (.htm, .html): Այսինքն իր կիրառումը փոքր ինչ ավելի լայն է ու դուրս է գալիս միայն Word-ի հետ աշխատելու տիրույթից:

Հիդրոգեն
05.12.2009, 04:22
... կիրառում ես կոնկրետ ուղղվածությամբ պրոֆեսիոնալ ծրագրեր, ինչպիսիք են Quark XPress-ը, Adobe InDesign-ը, Adobe PageMaker-ը.. իսկ եթե դու ունես տեքստ, որը քեզ պետք է կայքիդ մեջ օգտագործելու համար ասենք Adobe Dreamweaverum դնելու համար, կամ ինչ-որ վեբ բրոուզերի համապատասխան միջավայրում, կայքում: Իսկ եթե քեզ էդ տեքստը փոխարկել է պետք նամակով ուղարկելու համար ասենք Mozilla Thunderbird ծրագրով:
Քո նշված բոլոր ծրագրերը, իհարկե, արժի մցնել հաշվարկների մեջ, բայց ի սկզբանե խոսքը գնում էր հենց Word-ի ոլորտում աշխատելու մասին: Նայիր թեմայի առաջին գրառումը - ընդեղ Word-ից բացի ծրագի՞ր ես տեսնում:


Վերջապես հասկանանք, որ Microsoft Word ծրագիրը ստանդարտ չի, որը պարտադիր պետք է լինի ամեն համակարգչի մեջ, լինելու դեպքում անպայման հարմար լինի, հարմար լինելու դեպքում անպայման կիրառվի:
Իսկ նման բան ես ընդհանրապես չեմ ասել:

Հիդրոգեն
05.12.2009, 04:28
Ճիշտն ասած ես խոսում էի ընդհանրապես առաձին փոխարկիչ ծրագրերի գոյության մասին, այլ ոչ թե կոնկրետ այս մեկի:
Մարդկանց լուրջ խնդիրներից մեկն էն ա, որ անընդհատ տարբեր լեզուներով են խոսում, բայց մտածում են, որ հասկանում են միմյանց:
Իսկ ծրագիրը չկիրառելու պահով եթե լրիվ ազնիվ լինեմ, ապա հարցը մենակ պրակտիկ հարմարությունը չի, պարզապես հայերեն լեզվի հետ աշխատող գտածս գրեթե բոլոր ծրագրերը կամ վատ են աշխատել(մոտավորապես ինչպես դու թվարկեցիր), կամ շատ քիչ ֆունկցիաներ են կատարել, նրանք համակարգում հիմնելու համար: Վաղը թարմ գլխով քո նշածը կփորձեմ, միգուցե վերջապես գտնեմ ինչ որ ինձ պետք է:

Chuk
05.12.2009, 04:33
Մարդկանց լուրջ խնդիրներից մեկն էն ա, որ անընդհատ տարբեր լեզուներով են խոսում, բայց մտածում են, որ հասկանում են միմյանց:
Կարևորը, որ ի վերջո հասկանում են:
Կատարյալ աշխատող ծրագիր չես գտնի: Համառոտ ասեմ, թե ինչու:

Խնդիրն այն է, որ թեև մշակվել էր որոշակի ստանդարտ, բայց այդ ստանդարտից տառատեսակներ մշակողներից շատերը շեղվում էին, արդյունքում տառատեսակներից մեկում «և» տառը մի կոդի տակ է, մյուսում՝ ուրիշ կոդի տակ, մեկում չակերտը մի կոդի տակ է, մյուսում՝ ուրիշի տակ: Ու էս փոխարկիչներից ամեն մեկը տառատեսակներից մեկի հիման վրա ա անում, ու քո ձեռքին կարող ա լինի փոքր ինչ տարբերվող կոդավորմամբ տեքստ, որը չփոխարկվի:

Լուծումը բարդ ալգորիթմներով ծրագրեր գրելն է, որը հաշվտ կառնի բոլոր առկա կոդավորումները, հետո տեքստը կվերլուծի ու կորոշի, թե կոնկրետ որ ձևով է փոխարկելու: Ես այդպիսի ծրագիր դեռ չեմ տեսել ու չեմ էլ կարծում, որ կտեսնեմ:

հ.գ. իրականում ուշադիր լինելու դեպքում կնկատես, որ թեև թեմայի առաջին գրառումը չէի կարդացել, բայց իրականում քո հարցին պատասխանել եմ, թե ինչու է իմաստավորված նաև հենց այս փոխարկչի գոյությունը:

_DEATH_
05.12.2009, 11:40
Ժող մի բան հարցնեմ, որ ծրագրով unicode սարքեմ ու որ տառատեսակը ընտրեմ, որ word-ի բառարանի հետ համընկնի ու «և» տառի հետ պռոբլեմ չլինի, թե չէ Sylfaen-ով տեսքտը հավաքում եմ, «և»-ը նորմալ երևում ա, բայց ինչքան «և»-ով բառ կա կարմիրով տակը նշում ա, յանի ուղագրական սխալ կա: Խոսքը 2007-ի LIP փաթեթի բառարանի մասին ա:

Ռուֆուս
05.12.2009, 15:13
Մոդերատորական: Թեման տեղափոխվում է «Համակարգչային ծրագրեր» բաժին: