Синтаксические связи глазами машины

Все чаще натыкаемся на мнение что машинный перевод не позволяет переводить длинные связанные тексты, но с отдельными короткими фразами справляется нормально. Особенно если включить здравый смысл.

Но все не так просто. Начнем с того, что «здравый смысл» у всех разный. Машинные переводчики предполагают, что вы скармливаете им грамматически верную фразу, с правильными синтаксическими связями. Допустим, вы хотите перевести объявление о том, что в помещении будет проводиться санитарная уборка в течение десяти минут. В принципе, по-русски фраза «Санитарная уборка 10 мин.» звучит не идеально, но нормально и понятно. Но переводчик-то думает, что там все согласовано, следовательно, слово «уборка» предполагает конструкции «уборка чего?» а тот факт, что десять записано числом — добавляет неразберихи. То есть для того же Google Translate эта фраза выглядит как «Санитарная уборка десяти минут». И именно этот вариант он переводит, а значит закономерно вставляет ненужный предлог.

поделиться

комментарии
или войдите, чтобы оставлять комментарии