Разработка автоматизированного маркерного корпуса казахского языка
DOI:
https://doi.org/10.51301/vest.su.2021.v143.i1.06Ключевые слова:
корпус, маркированный корпус, лингвистика, корпусная лингвистика, корпусная технология, токенизация, лемматизация.Аннотация
Cтатья о сближении казахского языка с технологиями. Потому что в будущем все окружающие нас мир будут тесно связаны с технологиями. Как будто новые слова в повседневной жизни, новые формируемые служебные должности-это вестник трансформации. Информационные технологии и процессное развитие интернета увеличивают коммуникационные связи между членами общества. Это, в свою очередь, послужило поводом для консолидации и накопления высокоразвитой цифровой информации. На самом деле, обмен информацией не только технологическая связь, но и сложное лингвистическое явление. Такие проблемы, как использование людьми лингвальных средств, языка, употребление словосочетаний, понимание структурной среды данных, стали существенной сферой лингвистических знаний, в сочетании с лингвистикой и компьютерной наукой возникла предметная зона компьютерной лингвистики.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2021 Вестник Satbayev University
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>