Компьютер хэлд орж байна
Хэл яриа гэдэг хүмүүсийн харилцаанд санаа бодлоо илэрхийлэх, мэдээлэл солилцох хамгийн тохиромжтой хэлбэр юм. Ийм төрлийн системүүд техник, технологи өндөр хөгжсөн орнуудад эрчимтэй нэвтэрч, өөр өөрийн төрөлх хэлний ярианы дохиог судлан боловсруулалт хийх замаар тухайн хэлний ярианы технологийн системүүдийг боловсруулан ашиглаж байгаа аж.
Тэгвэл ШУТИС-ийн ХМТС-ийн багш Б.Сүхбат “Монгол хэлний ярианы дифон синтезийн системийн судалгаа ба боловсруулалт” сэдвээр ШУТИС-ийн ректор, доктор, профессор Б.Дамдинсүрэнгийн удирдлага дор докторын зэрэг хамгаалжээ. Ярианы синтез гэдэг нь хүний яриаг зохиомлоор үүсгэх процесс аж. Сүүлийн үед компьютерийн тооцоолох хүчин чадал эрс нэмэгдсэнтэй холбоотойгоор нэгтгэх зарчимд суурилсан синтезийн арга эрчимтэй хөгжиж байгаа бөгөөд энэ нь нэгж сонгох синтез, дифон синтез, тусгайлан сонгож авсан үгийн сан бүхий синтез гэсэн гурван үндсэн чиг хандлага дээр тулгуурлан хөгждөг байна.
Эдгээр технологиудаас манай эрдэмтэд дифон синтезийн аргыг сонгон монгол хэлний ярианы дифон синтезийн системийг амжилттай ашигласнаар компьютер монгол хэлээр ярьж эхлээд байгаа юм байна.
Энэ системийг ашиглан компьютерийн санах ойд байгаа бүх бичвэрийг яриагаар гаргах бүрэн боломжтой учраас сурч боловсрохоос эхлээд аль ч чиглэлээр хэрэглээ өндөр юм. Хамгийн наад захын жишээ хэлэхэд хараагүй хүмүүс компьютероороо дамжуулан бүх төрлийн мэдээлэл авах боломжтой гэсэн үг. Одоо тус сургуулийн хэсэг эрдэмтэд яриа таних системийг судалж байгаа гэнэ.
“Бусад улсын туршлагаас харахад нууцлагдсан марковын загварыг болон уг загварыг хиймэл оюуны аргатай хамт ашиглан яриа таних системийг бүтээж байна. Бид нууцлагдсан марковын загварыг ашиглан монгол хэлний яриа таних системийг хийж байгаа. Нууцлагдсан марковын загварын гол зарчим нь хүний ярианаас авиануудын нууцлагдсан марковын загварыг үүсгэж, яриа танилтад ашигладаг. Яриа танилтад хэрэглэгдэх монгол хэлний ярианы сангаа бид 6000 гаруй үг агуулсан өгүүлбэрүүдийг 10 хүнээр өгүүлбэр бүрийг 10 удаа давтан хэлүүлэх замаар бүрдүүлнэ. Одоо давхардсан тоогоор 60.000 гаруй үгтэй ярианы санг бүрдүүлэн, яриа танилтын туршилтыг хийж байна. Яриа танилт 90 гаруй хувьтай байгаа” хэмээн доктор Б.Сүхбат хэллээ.
Л.Батцэнгэл


HMM буюу Hidden Markov Model, нууцлагдсан гэж орчуулах нь жаахан тохиромжгүй юмаа, Далд гэвэл зүгээр байх.