Что нельзя отдавать в машинный перевод

Популярность машинного перевода с постредактирование за рубежом и в России

В последние годы во всем мире наблюдается устойчивая тенденция к росту популярности машинного перевода среди заказчиков перевода. Чем это вызвано?

1) Огромные объемы: объемы текстов, которые надо переводить, растут, и вот количество хороших переводчиков и редакторов за этим ростом не поспевает.

2) Бюджеты не выдерживают: с ростом объемов перевода заказчикам приходится платить за него все больше и больше. И не любой бюджет это выдержит. Поэтому клиенты и думают, как бы получить перевод, но чтобы не платить за него много.

А что в России? По нашим наблюдениям, в России пока бытует устойчивое негативное отношение к машинному переводу даже с постредактированием. Только крупные компании, которые заказывают переводы постоянно, начинают понимать выгоды машинного перевода с постредактированием и постепенно все больше им пользоваться.

 

Машинный перевод с постредактированием = ручной перевод средненьким переводчиком

Но по нашим наблюдениям, машинный перевод с постредактированием на самом деле очень мало чем отличается от ручного перевода обычным средненьким переводчиком.  К сожалению, большинство переводчиков переводят дословно, «как есть», не особо утруждаясь выверкой терминологии, стилистической корректурой, а порой и вообще хоть какой-то проверкой своего перевода.

Так что можно смело утверждать, что машинный перевод с постредактированием по качеству будет идентичен ручному переводу обычным среднестатистическим переводчиком.   

Однако с машинным переводом есть одна проблема. Не все тексты стоить переводить машиной. Тексты бывают простыми и сложными. И сложные тексты с массой терминологии и сложными конструкциями машина может не осилить. В итоге редактору придется не просто слегка править машинный перевод, а полностью переводить с нуля, что не вписывается в услугу машинного перевода с постредактированием.

Если клиент все равно настаивает на машинном переводе такого сложного текста, то рискует получить малочитаемый перевод, и при этом не сможет предъявить претензию бюро переводов. Ведь в услугу постредактирования не входит выверка терминологии, полноценная редактура и корректура. Редактор лишь подправит окончания и немного порядок слов, чтобы текст в целом звучал понятно.

 

Тексты, пригодные и не пригодные для машинного перевода

Ниже мы приводим примеры текстов, которые стоит и не стоит отдавать в машинный перевод с постредактированием.

Такие тексты можно отдавать в машинный перевод с постредактированием. 

Оригинал Машинный перевод Постредактирование
The aim is to guarantee that once the installation has been completed, the equipment can be managed remotely and there is no need to return to the equipment location.  Цель состоит в том, чтобы гарантировать, что после завершения установки, оборудование можно управлять удаленно, и нет необходимости возвращаться к месту оборудования.  Цель состоит в том, чтобы гарантировать, что после завершения установки оборудованием можно будет управлять удаленно, и нет необходимости возвращаться к месту установки оборудования. 
The egress data rate of each queue and each port can be limited. This process is called traffic shaping. The difference between shaping and the application of bandwidth profiles in policing is that with shaping, packets are not dropped immediately but kept in a buffer (egress queue) and may be sent at a later moment, if the queue is not full already.  Скорость передачи данных выход каждой очереди и каждый порт может быть ограничено. Этот процесс называется формирования трафика. Разница между формирование и применение профилей пропускной способности в полиции что с формирование, пакеты, не удаляются немедленно, но хранится в буфере (выход очереди) и могут быть отправлены в позднее время, если очередь уже не полный.  Скорость передачи данных на выходе с каждой очереди и каждого порта можно ограничить. Этот процесс называется формированием трафика. Разница между формированием и применением профилей пропускной способности в регулировании состоит в том, что при формировании пакеты не отбрасываются немедленно, а хранятся в буфере (очередь на выход) и могут быть отправлены в более позднее время, если очередь еще не заполнена. 
Customers use Blue Box Cloud Dedicated to combine the performance and cost management benefits of private cloud with the ease of provisioning and operations support of public cloud. Клиенты используют Blue Box Cloud Выделенный объединить преимущества производительности и управления затратами частного облака с легкостью инициализации и операций поддержку общественного облака.  Клиенты используют Blue Box Cloud Dedicated, чтобы объединить преимущества производительности и управления затратами частного облака с легкостью инициализации и поддержки операций общественного облака. 

Почему такие тексты подходят для машинного перевода?

Текст связный, без нагромождений атрибутов, в нем отсутствуют специальные термины. Поэтому его достаточно просто немного отредактировать (падежи, время, пунктуация).

В таких текстах машина способна определить причины и следствия, что за чем идет. Количество терминов небольшое и не требует глубокой проработки. Поэтому редактор может привести машинный перевод в надлежащий вид, исправив падежи, термины, части речи, число, без необходимости прибегать к полноценному переводу.

Благодаря обычному, неосложненному порядку слов, машина может понятно перевести такой текст и даже практически успешно выделить непереводимые элементы. А редактор уже приводит текст в надлежащий вид, не прибегая при этом к сложным перестановкам или полноценному переводу, что полностью соответствует объему предоставляемого пакета услуг.

Тексты, которые не годятся для машинного перевода с постредактированием. 

Оригинал Машинный перевод Постредактирование
ACCEED 1416 supports symmetrical PSD Masks (Power Spectrum Density) with TC-PAM 16 and TC-PAM 32 Modulation (Trellis Coded Pulse Amplitude Modulation). ТВЕРЖДЕНИЯ 1416 поддерживает симметричные PSD маски (плотность мощности спектра) с TC-PAM 16 и 32 TC-PAM модуляции (шпалеры кодированная пульс амплитудная модуляция).  ACCEED 1416  поддерживает симметричные PSD-маски (плотность спектра мощности) с модуляцией TC-PAM 16 и TC-PAM 32 (Trellis Coded Pulse Amplitude Modulation). 
CoS (.1p bit) remarking in the ingress policing stage is always executed on the primary VLAN tag. CoS (.1p бит), ремарки в полиции стадии входа всегда выполняется в основном теге VLAN.  Перемаркировка CoS (бит .1p) на этапе регулирования на входе всегда выполняется на первичном теге VLAN. 
Fault propagation (e.g. AIS/RDI, Dying Gasp…), link-, port- and service level-alarms together with extensive localization tools such as continuity check, linktrace and loopback allow to quickly locate faults and re-establish the service in case of failures.  Распространения ошибок (AIS/ЦНИОКР, умирает вздох…), ссылка-, порт — и обслуживания уровня сигнализация вместе с обширной локализации, инструменты, такие как проверить непрерывность, linktrace и loopback позволяют быстро находить ошибки и повторно установить службы в случае сбоев.  Аварийные сигналы распространения ошибок (AIS/RDI, Dying Gasp…), соединения, портов и уровня обслуживания, вместе с обширными инструментами локализации, такими как проверка непрерывности, linktrace и loopback, позволяют быстро находить ошибки и восстанавливать услуги в случае сбоев. 

 

Почему такие тексты не подходят?

Терминология слишком сложна и построена по законам английского языка, т.е. атрибуты ставятся друг перед другом, а понимать их нужно в обратном порядке и значительно переставлять слова в русском языке. Машина этого делать не умеет. А заказ машинного перевода с редактированием не подразумевает значительную проработку терминов редактором, поэтому он вынужден оставлять сложные термины на языке оригинала.

Машина не справляется с порядком слов и специальными терминами, поэтому приходится не редактировать, а переводить сегмент с нуля, чтобы он был более-менее понятен читателю. Однако такая работа и поиск терминов не входят в услугу по машинному переводу.

 

Заключение

Тексты, которые можно отдавать в машинный перевод, должны:

1) иметь простую структуру;

2) не содержать спецтерминов или содержать их очень мало.

 

Машинный перевод с постредактированием в SinoTranslation

Принимая текст в машинный перевод, мы прежде всего оцениваем его структуру и наличие специальной терминологии. Если выясняется, что текст не очень подходит для машинного перевода, мы информируем заказчика, объясняем причину и даже делаем бесплатно пробную страницу перевода. Если качество перевода клиента все же устраивает, мы берем текст в работу. Если нет — предлагаем клиенту стандартный тариф.

Вам нужно перевести текст, но не можете позволить себе стандартную цену за качественный ручной перевод? Попробуйте бесплатно страницу машинного перевода с постредактированием и оцените, подойдет ли вам качество.

 

Комментарии (5)

Очень полезная статья, особенно пригодиться начинающим переводчикам! Спасибо!

«Сюда относятся такие среднеазиатские страны, как Азербайджан…» — вторая строчка в «Описании ситуации». Без комментариев.

    Спасибо, за заметили. Исправили.

Прочитал следующее на страничке «Немного фактов о китайском языке и переводе с китайского»:

4. Россия и Украина — страны, для которых обозначения не нашлось, и подбирались иероглифы, максимально похожие по звучанию: Россия — 俄罗斯 [элосы], Украина — 乌克兰 [укэлáнь].

Насчет Украины написано правильно, 乌克兰 [укэлáнь] – это просто транскрипция. Какого-либо иероглифа, отражающего представление китайцев об Украине, «для обозначения не нашлось».

А вот насчет России. Может быть, стоит изучить историю вопроса? Почитать о том, названия каких стран китайцы писали с добавлением «уважительного» иероглифа 国. Вспомнить значение иероглифа 俄 (подсказка: «быстрые перемены», «стремительные изменения»). А также поинтересоваться следующим: когда и почему 俄国 [沙皇俄国] китайцы переименовали в 俄罗斯 [苏俄 ,俄罗斯联邦]; когда появилась 韩国 вместо 朝鲜 [南朝 и 北朝]; и, обязательно, «классику жанра» о 日本 и 日本国.

    Что касается России, то «стремительные изменения» тут совершенно ни при чем. Это просто транскрипция «России», начинается с «э» только потому, что в китайском нет буквы «р», и 国 не имеет никакого отношения к «уважению» — это просто «страна», которую они добавляют ко всем странам.

Оставить комментарий

Имя (обязательно)
Email (обязательно)

5 × 2 =

Комментарий (обязательно)

Вы можете использовать эти HTML теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Рассчитать стоимость

Кроме заверений.
Заверениями не занимаемся!

Ваше Имя:

Телефон:

Email:

С языка

На язык

Ваше сообщение:

Приложить файл :

Приложить файл :

ЗАКРЫТЬ
Задайте свой вопрос здесь

 

ЗАКРЫТЬ