Спорт

Ұлттық сөздік қор: қазақ тілі жасанды интеллектке бейімделеді

Mar 4, 2025 IDOPRESS

ПОДЕЛИТЬСЯ

Қазақстанда Қазақ тілінің ұлттық сөздік қорын құру жоспарланып отыр. Тиісті жобаны Ғылым және жоғары білім министрлігі әзірледі,- деп хабарлайды Tengrinews.kz тілшісі.

Құжатқа сәйкес,ұлттық сөздік қоры академиялық және аударма сөздіктер,Қазақ тілінің ұлттық корпусы,терминологиялық база және әртүрлі форматтағы деректер жиынтығын қамтитын дата-сеттер негізінде қалыптастырылады.

"Жобаның маңызды аспектісі – Қазақ тілінің ұлттық сөздік қоры ашық қолжетімді мемлекеттік ақпараттық жүйе болатыны. Бұл оны білім беру және ғылыми мақсаттарда,сондай-ақ қазақ тілін өңдеу технологияларын дамыту үшін барынша тиімді пайдалануға мүмкіндік береді",– делінген құжатта.

Қазіргі ережелерде мынадай негізгі ұғымдар пайдаланылады:

Генерация – деректер мен алдын ала белгіленген ережелер негізінде жаңа контентті (мәтін,сурет,дыбыс) автоматты түрде жасау процесі;

Жасанды интеллект (ЖИ) модельдері – қазақ тіліндегі деректерді өңдеу технологиялары мен алгоритмдерін түрлі жүйелерге,қосымшаларға немесе платформаларға енгізу процесі.

Ұлттық сөздік қорын қалыптастырудың мақсаттары:

Қазақ тілін мәдени құндылық ретінде сақтау,қорғау және дамыту;

Мемлекеттік тіл мәртебесін нығайту;

Қазақ тілінің барлық қолдану салаларын қамтитын ресурстарды жинақтау;

Қолданыстағы лексикалық құрамды жүйелеу,цифрландыру және генерациялау;

Қазақ тілін жасанды интеллектке және заманауи технологияларға бейімдеу;

Тілдік деректерді өңдеу үдерістерін автоматтандыру.

Жоба "Ашық НҚА" порталында 2025 жылдың 19 наурызына дейін қоғамдық талқылау үшін орналастырылған.