Қазақ тілінің автоматтандырылған маркерлік корпусын әзірлеу
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.51301/vest.su.2021.v143.i1.06Ключевые слова:
корпус, маркерленген корпус, лингвистика, корпустық лингвистика, корпустық технология, токенизация, лемматизация.Аннотация
Мақала қазақ тілін технологиялармен жақындастыру туралы. Себебі болашақта бізді қоршаған барлық дүниелер технологиялармен тығыз байланыста болмақ. Күнделікті қолданыстағы жаңа сөздер, қалыптасып жатқан жаңа қызметтік лауазымдар айтылып отырған трансформацияның жаршысы секілді. Ақпараттық технологиялар және интернеттің үдере дамуы қоғам мүшелері арасындағы коммуникациялық байланысты арттыруда. Бұл өз кезегінде жоғары көлемді сандық ақпараттың топтастырылуы мен жинақталуына себеп болды. Іс жүзінде, ақпарат алмасу тек қана технологиялық байланыс қана емес, сонымен бірге күрделі лингвистикалық құбылыс. Адамдардың лингвалды құралдарды, тілді пайдалануы, сөз тіркестері мен сөзді қолдануы, мәліметтердің құрылымдық ортасын түсінуі сияқты мәселелер лингвистика білімінің мәнді саласына айналып, лингвистика мен компьютер ғылымының тоғысқан жерінде компьютерлік лингвистика пәндік аймағы пайда болды.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2021 VESTNIK KAZNRTU
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>