Разработка модели и программного решения задачи определения неизвестных слов при постредактировании машинного перевода

Авторы

  • Д.Р. Рахимова Казахский национальный университет им.аль-Фараби
  • Н.М. Пазылхан Казахский национальный университет им.аль-Фараби
  • A.A. Кульжанова Казахский национальный университет им.аль-Фараби
  • Ж.Г. Ален Казахский национальный университет им.аль-Фараби

DOI:

https://doi.org/10.51301/vest.su.2021.v143.i1.08

Ключевые слова:

машинный перевод, NLTK, мморфологический анализ, неизвестные слова, постредактирование машинного перевода.

Аннотация

Машинный перевод - это технология последовательного перевода текстов с одного языка на другой компьютерной программой. В результате машинного перевода всегда есть определенные недостатки, которые можно решить постредактированием. Постредактирование - человеческая обработка текста после машинного перевода. Сегодня многие поставщики языковых услуг активно развивают это направление, разрабатывая методы обучения редакторов и методы постредактирования. В работе представлен  обзор современных проблем систем машинного перевода. В данной работе рассматривается задача определения неизвестных слов при постредактировании машинного перевода для казахского языка. Проведен анализ    существующих методов      нахождения неизвестных слов при постредактировании машинного перевода. Представлены модель определения  неизвестных слов при постредактировании машинного перевода для англо-казахского и русско-казахского языка, ппрактические результаты и  программная реализация.

Загрузки

Опубликован

2021-02-28

Как цитировать

Рахимова, Д. ., Пазылхан, Н. ., Кульжанова A. ., & Ален , Ж. . . . (2021). Разработка модели и программного решения задачи определения неизвестных слов при постредактировании машинного перевода. Engineering Journal of Satbayev University, 143(1), 46–53. https://doi.org/10.51301/vest.su.2021.v143.i1.08

Выпуск

Раздел

Физико-математические науки