Ուրբաթ, 29. 03. 2024

spot_img

Սկսած Է Արեւմտահայերէն TTS եւ STT Գործիքներուն Կառուցումը

Շնորհակալ Նախաձեռնութիւն

Հանրային Նախաձեռնութիւն Ի Խնդիր Թուային Յառաջդիմութեան

Հանրային նախաձեռնութեան մը հիմքին վրայ ձեռնարկուած է արեւմտահայերէնի ձայնային հիմնադարանին ձեւաւորումին, որուն հիմքին վրայ պիտի կառուցուին երկու կարեւոր թուային գործիքներ՝ արեւմտահայերէնի Speech-to-Text եւ Text-to-Speech․
Սոյն շնորհակալ աշխատանքին՝ Ազգային արագացման հանրային նախաձեռնութեան ծրագրի համակարգողն է ծանօթ ազգային նուիրեալ գործիչ՝ Վարդան Թաշճեան 
Ստորեւ կը ներկայացուի մեր լեզուին համար նշեալ գործիքներու նշանակութեան եւ անհատներու մասնակցութեան ձեւին մասին գրութիւն մը՝ հրատարակութեան խնդրանքով։
Պրն. Թաշճեան արդարացիօրէն կը շեշտէ, թէ սոյն նախաձեռնութեան մասին մամլոյ միջոցով հանրութիւնը տեղեկացնելը պիտի օգնէ ինչպէս գործին, նոյնպէս եւ արեւմտահայերէնի թուային յառաջդիմութեան շուրջ գիտակցութեան տարածման։ Ան  նախապէս շնորհակալութիւն յայտնելով ու լայն մասնակցութիւն ակնկալելով,  կ՛աւելցնէ ըսելով, թէ ապագային, ամբողջական մշակումէն եւ լայն կիրարկութեան մէջ դրուելէն ետք, այս գործիքները մեծապէս պիտի նպաստեն նաեւ արհեստագիտական այս դարուն մէջ հայ մամուլի յառաջդիմութեան։ Ծրագրին համակարգող մեր բարեկամը իր խօսքը կ՛եզրափակէ հաստատելով, որ մենք միասնաբար կրնանք արդիականացնել արեւմտահայ լեզուի հաղորդակցութեան եւ զարգացման միջոցները եւ այդպիսով նպաստել ամբողջ աշխարհի մէջ հայ մշակոյթի յառաջդիմութեան։
Իրապէս շնորհակալ նախաձեռնութիւն մը,  մեր ազգին դիմագրաւած այս մռայլ օրերուն ընդհանրապէս, եւ մասնաւորապէս ազգային արժէք հանդիսացող արեւմտահայերէնի գոյատեւման ի խնդիր:  
                                                                       Խմբ.

Սկսած է արեւմտահայերէն խօսքի ճանաչման (Automated Speech Recognition կամ Speech-to-Text) եւ խօսքի սինեթզի (Text-to-Speech) շարժիչներուն կառուցումը, որուն մասնակցելու հրաւիրուած են արեւմտահայերէն խօսող մարդիկ առանց որեւէ խտրութեան։

Այս շարժիչները չափազանց մեծ կարեւորութիւն պիտի ունենան մեր ապրած թուային դարաշրջանին մէջ արեւմտահայերէնի կենսունակութեան, օգտագործման եւ տարածման համար եւ կոչուած են ըլլալու շատ կարեւոր իրագործումներ անոր թուային յառաջդիմութեան մէջ։

STT․ ինչ է այն

Automated Speech Recognition (ARS) կամ Speech-to-Text (STT) շարժիչները համակարգչային ծրագիր-գործիքներ են, որոնք հնարաւորութիւն կու տան ճանչնալու որեւէ լեզուի բանաւոր խօսքը եւ զայն “կը թարգմանեն”, կը վերածեն թեքսթի՝ համակարգչային լեզուագիտութեան միջոցով։ Համաշխարհային փորձառութեան մէջ STT-ը առաւելաբար կը կիրարկուի բանաւոր խօսքի միջոցով պետական, առեւտրական, ֆինանսական, առողջապահական, մշակութային եւ հանրային այլ կառոյցներու հետ մարդոց յարաբերութիւնները ինքնագործ դարձնելուն մէջ։

TTS․ ինչ է այն

Ձայնի սինթեզի (TTS) շարժիչը ելեկտրոնային թեքսթերը կը վերափոխէ դիւրութեամբ հասկնալի ձայնային հաղորդագրութեան: TTS-ը կրնայ օգտագործուիլ կայքէջերու յօդուածներ, հեռախօսի վրայ ստացուած նամակներ, գիրքեր եւ ուսուցողական նիւթեր կարդալու համար: Անիկա շատ պիտանի գործիք մըն է տեսողական խնդիրներ ունեցող, տարեց կամ գրաճանաչութեան հետ կապուած դժուարութիւններ ունեցող մարդոց համար։

Աշխարհը եւ մենք

Այս արհեստագիտութեան մէջ հսկայական յառաջդիմութիւն արձանագրուած է աշխարհի մեծ թէ փոքր գրեթէ բոլոր լեզուներուն մէջ․ ժամանակն է, որ արեւմտահայերէնը միանայ անոնց։

Արեւմտահայերէնի պարագային, այս գործիքներուն նշանակութիւնը մեծ է յատկապէս կրթութեան, ստեղծագործական գործունէութեան, մշակութային ժառանգութեան պահպանման եւ փոխանցման , ուսման եւ ժամանցի ոլորտներուն մէջ։

Հիմնադարանը

Արեւմտահայերէնին համար թուային այս եւ այլ գործիքներ մշակելու նպատակով անհրաժեշտ է ձեւաւորել արեւմտահայերէնի բանաւոր եւ գրաւոր խօսքի գորբուս՝ հիմնադարան ․ աշխատանք մը, որ կրնայ իրականանալ մասնակցութեամբը արեւմտահայերէն խօսող 80-140 տարբեր մարդոց, որոնք պէտք է կատարեն որոշակի ծաւալի արեւմտահայերէն թեքսթերու ձայնագրութիւններ։

Հիմնադարանը ըստ էութեան բանաւոր եւ գրաւոր խօսքի անհրաժեշտ այն Data կեդրոնն է, առանց որուն խօսք անգամ չի կրնար ըլլալ TTS- ի, STT-ի եւ այդ շրջանակի թուային այլ գործիքներու կառուցման մասին։

Կամաւորներ կոչուած են ձեւաւորելու թուային դարաշրջանի արեւմտահայերէնի գործիքներու մշակման համար անհրաժեշտ գրա-ձայնային ատաղձի շտեմարանը եւ այդ  հիմքին վրայ մասնակցելու արեւմտահայերէնի TTS եւ STT առաջին շարժիչներու կառուցման։

ԻՆՉՊԷՍ ՄԱՍՆԱԿՑԻԼ․ ՁԱՅՆԱԳՐԵԼ

Հիմնադարանը ձեւաւորելու համար, ընդամէնը անհրաժեշտ է մուտք գործել հետեւեալ կայքը՝ https://arm.ican24.net/hyw , ընտրել որեւէ թեքսթ եւ  ձայնագրել զայն համակարգիչի կամ բջիջային հեռախօսի օգնութեամբ: Միջինը կը պահանջուի 15֊20 վայրկեան: Եթէ տարբեր պատճառներով չկարենաք կամ չհասցուցիք ձայնագրել ամբողջ թեքսթը մէկ անգամով, կրնաք ատիկա ընել աւելի ուշ․ համակարգը պիտի «ճանչնայ» ձեզ։ Անիկա պիտի պահպանէ նաեւ բոլոր այն մասնակի կամ ամբողջական ձայնագրութիւնները, որոնք դուք կրցած էիք վերբեռնել (upload) նախորդ անգամներուն:

Թեքսթերը

Որպէս սկիզբ, ձայնագրութեան համար մեր կայքին մէջ տեղադրուած են մօտ 160 տարբեր թեքսթ-պարբերութիւններ, առնուած պոլսահայ-ֆրանսահայ անուանի հրապարագիր Շաւարշ Միսաքեանի գրութիւններէն։ Ընտրութիւնը կատարուած է միայն ու միայն հաշուի առնելով Միսաքեանի լեզուին յատկութիւնները՝ դասական, կուռ եւ պարզ։ Հետագային համալրում պիտի կատարուի այլ հեղինակներէ։ Եթէ դուք կը նախընտրէք ձայնագրել ձեր սեփական թեքսթերը, ապա կրնաք ընել ատիկա կայքին մէջ, ուր կայ համապատասխան բաժին մը ատոր համար։ Նոյն տեղը կրնաք վերբեռնել ձեր մօտ եղած այլ ձայնագրութիւններ, անոնց թեքսթերով։

Նշաձողը

Ծրագիրին կատարման համար տարբեր ձայնագրողներու նուազագոյն շեմը 80-ն է․ 140 տարբեր ձայնագրողներու պարագային, խօսքին ճանաչումը մօտիկ կ՛ըլլայ կատարեալին, իսկ աւելին արդէն կ՛ապահովէ միանշանակ ճանաչում բոլոր պարագաներուն: Ընդհանուրը, կարիքը կայ մօտ 500 ժամ ձայնագրութեան՝ լաւագոյն արդիւնքին համար։

ՊԱՏՄԱԿԱՆ ԳՐԱՆՑՈՒՄ

Ձայնագրութիւններուն կատարման համար կայքին մէջ գրանցումը անհրաժեշտ է մասնակիցներու նոյնականացման (identification) համար: Մասնակիցներուն անուն֊ազգանունները պիտի գրուին արեւմտահայերէն խօսքի ճանաչման առաջին գործիքը մշակողներու ցուցակին մէջ՝ որպէս պատմական փաստի արձանագրութիւն:

Կազմակերպութիւնը

Արեւմտահայերէնի հիմնադարանին ձեւաւորումը եւ անոր հիմքին վրայ առաջին հերթին արեւմտահայերէն խօսքի ճանաչման գործիքին մշակումը կ՛իրականացուի Հայաստանի մէջ սկսած Ազգային արագացման հանրային նախաձեռնութեան շրջանակին մէջ, անկախ՝ պետական-կառավարական կառոյցներէն։ Նախաձեռնութիւնը արդէն իսկ արձանագրած է լուրջ յաջողութիւններ՝ արեւելահայերէն արուեստական ձայնի սինթեզի (Text to Speech), խօսքի ճանաչման (Automatic Speech Recognition) եւ մեքենայական թարգմանութեան (Neural Machine Translation) մշակումի ոլորտներուն մէջ։

Հրաւէր

Սիրելի բարեկամներ,

Լայն կիրարկութեան TTS-ի եւ STT-ի մշակումն ու գործարկումը կրթութեան եւ մշակոյթի նոր ձեւերու առանցքային գործիքներ են արհեստագիտական այս դարուն մէջ: Այս արհեստագիտութեան շնորհիւ համակարգչային թէ բջիջային յաւելուածներ, գործիքներ եւ տարբեր սարքեր պիտի կրնան իրական ժամանակի մէջ ընդօրինակել Արեւմտահայերէն ձայնային հոսքերը` անոնց թեքսթերը արտադրելու եւ անոնց հիման վրայ գործելու համար, ինչպէս նաեւ կատարեն հակառակ ուղղութեան գործողութիւնը՝ մեծ ճշգրտութեամբ թեքսթերու ձայնային «թարգմանութիւնը»։

Մասնակցելով այս նախաձեռնութեան, դուք կը ձեւաւորէք թուային դարաշրջանի Արեւմտահայերէնի գործիքներու մշակման համար ատաղձի ամենակարեւոր եւ անփոխարինելի շտեմարանը՝ հիմնադարանը, դուռը լայն բանալով անոր հիմքին վրայ թափ առնելիք թուային յառաջդիմութեան առջեւ, առանց որուն արեւմտահայերէնի կենդանութիւնն ու կենսունակութիւնը դժուար պիտի ըլլայ պատկերացնել շուտով։

Որպէս այս գործին մասնակիցներ, դուք պիտի ստանաք մշակուելիք TTS եւ ASR գործիքներէն անվճար օգտուելու իրաւունք (արեւելահայերէն եւ արեւմտահայերէն տարբերակներով) ։ Ձեր նշած ելեկտրոնային հասցէներով պիտի ուղարկուին համապատասխան ցուցումներ, թէ ինչպէս կրնաք օգտուիլ այդ գործիքներէն, անոնց լիակատար պատրաստութենէն յետոյ:

Արեւմտահայերէն Text-to Speech շարժիչին կառուցման ուղղութեամբ արդէն կան որոշակի արդիւնքներ։ Այդ մասին պատկերացում մը ստանալու համար այցելեցէք՝ https://www.facebook.com/westernarmenian.digital/posts/106635928637102

Ծրագրին վերաբերող նորութիւններուն համար այցելել FB Արեւմտահայերէնի թուային յառաջդիմութիւն էջը՝ www.facebook.com/westernarmenian.digital/

spot_img

ՆՄԱՆ ՆԻՒԹԵՐ

spot_img
spot_img

ՎԵՐՋԻՆ ՅԱՒԵԼՈՒՄՆԵՐ

spot_img

Զօրակցիր Զարթօնք Օրաթերթին