Қазақ тілінің автоматтандырылған маркерлік корпусын әзірлеу

Авторы

  • З.А. Маханова М.О.Әуезов атындағы ОҚМУ
  • П.А. Кожабекова М.О.Әуезов атындағы ОҚМУ
  • М.А. Сейтжаппар М.О.Әуезов атындағы ОҚМУ
  • Н.Е. Сабит М.О.Әуезов атындағы ОҚМУ

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.51301/vest.su.2021.v143.i1.06

Ключевые слова:

корпус, маркерленген корпус, лингвистика, корпустық лингвистика, корпустық технология, токенизация, лемматизация.

Аннотация

Мақала қазақ тілін технологиялармен жақындастыру туралы. Себебі болашақта бізді қоршаған барлық дүниелер технологиялармен тығыз байланыста болмақ. Күнделікті қолданыстағы жаңа сөздер, қалыптасып жатқан жаңа қызметтік лауазымдар айтылып отырған трансформацияның жаршысы секілді. Ақпараттық технологиялар және интернеттің үдере дамуы қоғам мүшелері арасындағы коммуникациялық байланысты арттыруда. Бұл өз кезегінде жоғары көлем­ді сандық ақпараттың топтастырылуы мен жинақталуына себеп болды. Іс жүзінде, ақпарат алмасу тек қана технологиялық байланыс қана емес, сонымен бірге күрделі лингвистикалық құбылыс. Адамдардың лингвалды құралдарды, тілді пайдалануы, сөз тіркестері мен сөзді қолдануы, мәліметтердің құрылымдық ортасын түсінуі сияқты мәселелер лингвистика білімінің мәнді саласына айналып, лингвистика мен компьютер ғылымының тоғысқан жерінде компьютерлік лингвистика пәндік аймағы пайда болды.

Загрузки

Опубликован

2021-02-28

Как цитировать

Маханова, З. ., Кожабекова, П. ., Сейтжаппар, М. ., & Сабит , Н. . (2021). Қазақ тілінің автоматтандырылған маркерлік корпусын әзірлеу. Engineering Journal of Satbayev University, 143(1), 36–39. https://doi.org/10.51301/vest.su.2021.v143.i1.06

Выпуск

Раздел

Физика-математикалық ғылымдар