Разработка модели и программного решения задачи определения неизвестных слов при постредактировании машинного перевода
DOI:
https://doi.org/10.51301/vest.su.2021.v143.i1.08Ключевые слова:
машинный перевод, NLTK, мморфологический анализ, неизвестные слова, постредактирование машинного перевода.Аннотация
Машинный перевод - это технология последовательного перевода текстов с одного языка на другой компьютерной программой. В результате машинного перевода всегда есть определенные недостатки, которые можно решить постредактированием. Постредактирование - человеческая обработка текста после машинного перевода. Сегодня многие поставщики языковых услуг активно развивают это направление, разрабатывая методы обучения редакторов и методы постредактирования. В работе представлен обзор современных проблем систем машинного перевода. В данной работе рассматривается задача определения неизвестных слов при постредактировании машинного перевода для казахского языка. Проведен анализ существующих методов нахождения неизвестных слов при постредактировании машинного перевода. Представлены модель определения неизвестных слов при постредактировании машинного перевода для англо-казахского и русско-казахского языка, ппрактические результаты и программная реализация.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2021 Вестник Satbayev University
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>