Локализация и качество языка

В последнее время люди жалуются на падение качества языка (на самом деле, они жалуются на это уже десятилетиями – или даже веками!). Я должен признать, что разделяю это мнение: я из того поколения, которое учили ценить умение хорошо писать, и я всё ещё ужасаюсь при виде явных ошибок, таких как использование “it’s” вместо “its” или путаница с ‘their’, ‘there’ и ‘they’re’. (И ещё больше я ужасаюсь, когда сам допускаю ошибки, что случается, увы, чаще, чем мне хотелось бы).

А что с поколением моего сына? Всё по-другому. Грамматика, правописание и пунктуация для них не так важны – важно только то, понимают ли их другие, а они других. Моему сыну 25 лет (как летит время!), и за ним уже идёт следующее поколение, которое ещё меньше озабочено способностью «хорошо» писать; фактически это новое поколение настолько привыкло видеть плохое письмо, что его представители вообще почти не замечают ошибок. И это создаёт замкнутый круг: люди растут, окружённые плохо написанными текстами, поэтому они и сами начинают писать плохо, что в свою очередь усугубляет проблему. Я слышал, что это называют «загаживанием языка».


Почему это происходит?

Лёгкость публикации: в старые времена цена публикации какого-либо контента: типографский набор, измельчение древесины и изготовление бумаги, печать текста на этой бумаге, переплёт, доставка в магазин и продажа – была огромной. По этой причине большинство публиковавшегося материала было тщательно отредактировано и откорректировано – возможности легко всё исправить не было. Так что если вы читали печатную продукцию, такую как книги, журналы и газеты, то вы обычно имели дело с правильной грамматикой, орфографией и пунктуацией. А поскольку большая часть того, что люди читали, была написана правильно (даже если и не всегда хорошо), много читавшие люди обычно приучались и писать грамотно. А сейчас кто угодно может создать и опубликовать любой текст – без редактирования и корректуры. Результат этого именно таков, какого и следовало ожидать.

Неформальное общение: электронная переписка, СМС сообщения, Twitter – все они заточены на высокую скорость, а когда люди спешат, качество обычно страдает.

Контент, сгенерированный машиной: он включает в себя контент, созданный компьютерами, например Сгенерированный Машиной поддерживающий контент, созданный посредством соединения частей пользовательского трафика по определённым проблемам, а также контент Машинного Перевода (МП). Сгенерированный Машиной контент, и особенно МП-контент, как мы, специалисты в области локализации, знаем, часто имеет очень низкое качество.


Что это значит для Локализации?

Работая в локализационном бизнесе сам, я хотел бы рассмотреть эту проблему в связи с её влиянием на локализацию. В некотором смысле это «загаживание» работает против нас: в конце концов, мусор на входе – мусор на выходе, и если исходное содержание написано плохо, то переводчикам труднее сделать хорошую работу, люди они или машины. Но в то же время это может работать и на нас, особенно когда речь идёт о Машинном Переводе, в котором есть несколько моментов, делающих даже «сырой» МП более приемлемым:

Усовершенствования Машинного Перевода: качество МП постоянно улучшалось на протяжении последних 50 лет (да, он существует уже столько времени!). Значительные усовершенствования, такие как статистический МП, а теперь и нейронный МП, происходят примерно каждые десять лет. До идеального человеческого качества машинному переводу, безусловно, ещё далеко, и так будет продолжаться ещё долго, но качество постоянно улучшается.

Ожидания пользователей: Хорошая новость для Машинного Перевода заключается в том, что вследствие «загаживания» языка уровень ожиданий снизился и люди с большей готовностью принимают «сырой» МП с его недостатками. Несмотря на проблемы качества, всё больше людей пользуются веб-сервисами машинного перевода, такими как Google Translate, Bing Translator и т.д., чтобы читать и писать тексты на других языках. Как и в случае СМС сообщений, о которых написано выше, пользователи более сосредоточены на содержании, чем на форме: они готовы терпеть ошибки до тех пор, пока сохраняется возможность понять содержание или хотя бы уловить его суть. Это оказывается справедливым даже для таких стран, как Япония и Франция, где уровень требований к качеству языка был традиционно высоким. Как показано на диаграмме ниже, мы уже перешли рубеж, за которым «сырой» МП приемлем для некоторых типов контента (обратите внимание, что данная диаграмма имеет чисто иллюстративный характер и не основывается на статистически достоверных данных).


Безусловно, уровень требований остаётся высоким для юридических документов, маркетингового контента и, конечно, для вашей собственной персональной страницы. Однако планка снижается для многих других типов контента, особенно для таких, как контент поддержки клиентов (для чего многие компании уже давно используют МП) или блоги и другие неформальные тексты. Фактически график можно перерисовать следующим образом:



Есть ли ещё надежда на высокое качество языка?

Поскольку качество сгенерированного машиной и переведённого машиной контента улучшается, а редакторские и корректорские инструменты совершенствуются и широко распространяются, качество всего контента в целом будет улучшаться до тех пор, пока мы не достигнем уровня профессионально отредактированных и откорректированных книг и журналов. А по мере исчезновения плохого качества письма люди привыкнут видеть хорошо написанные тексты, и это приведёт к тому, что качество неотредактированной человеческой речи снова станет повышаться (я попытался показать это на графиках выше).

Итак, я действительно думаю, что «загаживание» языка замедлится и обратится вспять (хм, тут возникает неприятный сантехнический образ!). К счастью, это не значит, что языки перестанут развиваться. И это одно из свойств, которые делают их такими увлекательными – и такими трудными для перевода!

Источник

поделиться

комментарии
или войдите, чтобы оставлять комментарии

Б.Д. Вадхва: "Никогда не откладывайте свое счастье."

2016-11-23

Знакомство с переводчиком

Сегодня у нас в гостях Б.Д. Вадхва, переводчик из Индии. Внушительный профессиональный стаж (более 30 лет) заставляет прислушаться к его словам. Наша беседа будет интересна как профессиональным переводчикам, так и другим читателям, которые хотят почерпнуть немного буддистской мудрости.