CAT-инструменты: новые технологии на службе переводчика. Что такое CAT-средства

Translation memory (переводческая память, накопители переводов) – программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи – одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы – модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

Электронные словари

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе – узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

Программы для распознавания текста

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

Программы для подсчета статистики

Translator’s Abacus бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount – платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт:

AfterScan – программа для автоматической проверки и коррекции исходного текста. Обнаруживает и исправляет опечатки, ошибки, отсутствующие пробелы, ошибки при распознавании текста. Сайт:

В современном мире переводчики почти ушли от рукописного перевода и повсеместно используют системы автоматизации (Computer-Assisted Translation tools, в народе просто «кошки»). Всё чаще работодатели хотят видеть переводчика, владеющего навыками работы с CAT-инструментами , что делает их еще более популярными и необходимыми для дальнейшей работы.

«Перевод с помощью компьютера» или «автоматизированный перевод» не следует отождествлять с машинным переводом, когда вы вводите текст на одном языке, нажимаете кнопку и получаете его перевод: автоматизированный перевод – более широкое понятие.

CAT-инструменты включают в себя различные лингвистические ресурсы, например: базы Translation Memory – базы памяти переводов, которые содержат ранее переведенные сегменты текста (словосочетания и предложения). Они создаются и пополняются на основе пар параллельных текстов. Другой важный ресурс – глоссарии, которые содержат термины и понятия, принятые в той или иной компании (либо утвержденные для определенной группы проектов).

Большинство CAT-инструментов являются настольными программами, то есть устанавливаются на один компьютер, и воспользоваться программой можно только на нём. Если вы захотите переводить на другом компьютере – нужна отдельная лицензия или еще какие-нибудь ухищрения.

Беспрекословный лидер среди программ автоматизированного перевода – SDL Trados. Также известными и распространенными настольными версиями являются: STAR Transit NXT, Deja Vu X, MemoQ . Далее приводится краткое описание данных программ.

Trados – система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory.

Transit NXT – программа для создания, просмотра и редактирования проектов для переводов и других связанных с переводом и локализаций операций, выпускается компанией STAR AG с 2008 года. На данный момент существует только версия для платформы Windows.

Déjà Vu / Дежа Вю – проприетарная система испанской компании Atril Language Engineering. Существуют различные версии для переводчиковфрилансеров и переводческих отделов и агентств.

Программа MemoQ была разработана в Венгрии еще в 2005 году и с тех пор постоянно обновляется. Сегодня это один из самых популярных продуктов на рынке систем (сред) автоматизированного перевода.

В мире развитых интернет-технологий и возможности удаленной работы получили широкое распространение online-версии CAT-программ . Есть несколько критериев для выбора программы: работа с различными форматами (конвертация и поддержка другими сервисами), добавление и редактирование существующих баз перевода, сохранение форматирования документов и одновременная работа нескольких переводчиков над одним проектом, например, SmartCAT, Memsource, Wordfast, MateCAT.

SmartCAT – система автоматизированного перевода, включающая память переводов, машинный перевод, управление глоссариями, функцию совместной работы переводчиков над одним документом. Система является «облачным» сервисом и не может быть установлена на компьютер. Работа с SmartCAT проводится при помощи браузера, ожидается разработка мобильного приложения. Пользовательский интерфейс доступен на русском, английском и японском языках; документация – на русском и английском.

Memsource Cloud – это полноценная переводческая среда, которая включает память переводов, а также встроенные функции машинного и ручного перевода, управления терминологией и переводческий редактор для работы в режиме онлайн и в автономном режиме.

Wordfast изначально был разработан Ивом Шамполионом (Yves Champollion) в 1999 как дешевая, простая альтернатива Trados. Wordfast Anywhere – это бесплатная веб-платформа Wordfast с пользовательским интерфейсом, повторяющим Wordfast Classic. Она запущена в мае 2010 года. MateCat был выпущен как программное обеспечение с открытым исходным кодом под Lesser General Public License (LGPL) от Free Software Foundation. Это относительно новый сервис, позволяющий переводчикамфрилансерам и студентам работать в браузере со многими форматами.

При таком разнообразии каждый переводчик выбирает для себя «кошку» по своему вкусу, исходя из конкретных задач, уже существующих навыков и средств на покупку программы. При этом бесспорным остается тот факт, что знание средств CAT-tools на сегодняшний день является не просто еще одним дополнительным требованием переводческих фирм это ключевой аспект выживания переводчиков на конкурентном рынке труда.

Существует несколько видов программ, обеспечивающих автоматизацию процесса перевода. В данной статье описывается что такое CAT -средства и как они применяются для автоматизации перевода .

Что такое CAT -средства

Основными из программ, обеспечивающих автоматизацию процесса перевода являются:

  • электронные словари (Abby Lingvo , Мультилекс и др.);
  • системыпомощипереводчикам Computer Assisted Translation Tools (CAT- средства) илисистемы Translation Memory (TM)
  • программы машинного перевода (PROMT , Socrat и др.).

Помимо этого существуют специализированные программы для создания и ведения глоссариев.

Переводческие компании, как правило, пользуются первыми двумя видами программ.

Принцип работы CAT-средств

Оригинал документа, присланный заказчиком, программными средствами разбивается на сегменты. (Сегмент – некоторый логический фрагмент исходного текста, чаще меньший либо равный предложению.)

После этого каждый переведенный сегмент анализируется на совпадение с памятью переводов (TM – translation memory , база данных переведенных сегментов, память переводов ), и при определенном проценте совпадения выдаются варианты перевода. В свою очередь, переводчик подтверждает предложенный вариант, корректирует его по своему усмотрению, либо полностью переводит уникальный сегмент.

Исходя из описанной схемы видно, что принятие решения о выборе варианта перевода полностью лежит на переводчике – это основное отличие CAT-средств от машинного перевода, где окончательное решение принимает машина (ПО).

Преимущества переводов с помощью CAT-средств

Исходя из вышесказанного, подведем итоги, какие преимущества обеспечивает применение CAT -средств:

  1. обеспечивается единообразие перевода, что положительно сказывается на его качестве;
  2. ускоряется сам темп работ по переводу за счет возможности не переводить одинаковые фрагменты текста дважды. В результате, сокращаются сроки, необходимые на перевод;
  3. изменения, дополнения и замечания заказчика достаточно легко можно внести по всей базе переводов, что позволяет мгновенно исправить неточности в уже переведенных сегментах и избежать нового появления подобных ошибок.
  4. в случае, если исходный документ предоставлен в одном из приведенных нижу форматов, то перевод осуществляется без нарушения структуры документа. Фактически необходимо лишь подправить текстовые фрагменты для устранения несоответствия объемов текста оригинала и перевода.
  5. CAT -средства позволяют снизить общую стоимость перевода для заказчика. В отличие от обычных расчетов на перевод, перевод с помощью CAT-средств тарифицируется по количеству слов с учетом следующих параметров:
    • количество одинаковых (повторяющихся) сегментов;
    • количество сегментов, совпадающих с памятью переводов в процентном соотношении;

Список форматов поддерживаемых CAT-средствами

  • Microsoft Word (.doc) ;
  • Microsoft Excel (.xls);
  • Microsoft PowerPoint (.ppt);
  • документы QuarkXPress;
  • документы Adobe InDesign ;
  • документы Adobe Framemaker;
  • документы Adobe Pagemaker ;
  • HTML- страницы (.html, .htm);
  • файлысправки MS Windows (.chm) ;
  • расширяемый язык разметки (.xml) .

Существует несколько видов программ, обеспечивающих автоматизацию процесса перевода. В данной статье описывается что такое CAT -средства и как они применяются для автоматизации перевода .

Что такое CAT -средства

Основными из программ, обеспечивающих автоматизацию процесса перевода являются:

  • электронные словари (Abby Lingvo , Мультилекс и др.);
  • системыпомощипереводчикам Computer Assisted Translation Tools (CAT- средства) илисистемы Translation Memory (TM)
  • программы машинного перевода (PROMT , Socrat и др.).

Помимо этого существуют специализированные программы для создания и ведения глоссариев.

Переводческие компании, как правило, пользуются первыми двумя видами программ.

Принцип работы CAT-средств

Оригинал документа, присланный заказчиком, программными средствами разбивается на сегменты. (Сегмент – некоторый логический фрагмент исходного текста, чаще меньший либо равный предложению.)

После этого каждый переведенный сегмент анализируется на совпадение с памятью переводов (TM – translation memory , база данных переведенных сегментов, память переводов ), и при определенном проценте совпадения выдаются варианты перевода. В свою очередь, переводчик подтверждает предложенный вариант, корректирует его по своему усмотрению, либо полностью переводит уникальный сегмент.

Исходя из описанной схемы видно, что принятие решения о выборе варианта перевода полностью лежит на переводчике – это основное отличие CAT-средств от машинного перевода, где окончательное решение принимает машина (ПО).

Преимущества переводов с помощью CAT-средств

Исходя из вышесказанного, подведем итоги, какие преимущества обеспечивает применение CAT -средств:

  1. обеспечивается единообразие перевода, что положительно сказывается на его качестве;
  2. ускоряется сам темп работ по переводу за счет возможности не переводить одинаковые фрагменты текста дважды. В результате, сокращаются сроки, необходимые на перевод;
  3. изменения, дополнения и замечания заказчика достаточно легко можно внести по всей базе переводов, что позволяет мгновенно исправить неточности в уже переведенных сегментах и избежать нового появления подобных ошибок.
  4. в случае, если исходный документ предоставлен в одном из приведенных нижу форматов, то перевод осуществляется без нарушения структуры документа. Фактически необходимо лишь подправить текстовые фрагменты для устранения несоответствия объемов текста оригинала и перевода.
  5. CAT -средства позволяют снизить общую стоимость перевода для заказчика. В отличие от обычных расчетов на перевод, перевод с помощью CAT-средств тарифицируется по количеству слов с учетом следующих параметров:
    • количество одинаковых (повторяющихся) сегментов;
    • количество сегментов, совпадающих с памятью переводов в процентном соотношении;

Список форматов поддерживаемых CAT-средствами

  • Microsoft Word (.doc) ;
  • Microsoft Excel (.xls);
  • Microsoft PowerPoint (.ppt);
  • документы QuarkXPress;
  • документы Adobe InDesign ;
  • документы Adobe Framemaker;
  • документы Adobe Pagemaker ;
  • HTML- страницы (.html, .htm);
  • файлысправки MS Windows (.chm) ;
  • расширяемый язык разметки (.xml) .

В данной статье собраны программы (программы translation memory, электронные словари, программы для распознавания текста, программы для подсчета статистики, программы для локализации приложений, программы для перевода сайтов, другие программы для переводчиков), в том числе – бесплатные, которые позволяют переводить больше текстов за меньшее время. Так же даны краткие описания этих программ с ссылками на первоисточники для скачивания и установки. Надеемся, что Вы найдете здесь что-то полезное для себя.

ПРОГРАММЫ TRANSLATION MEMORY

Translation memory (переводческая память, накопители переводов) – программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи – одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы – модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

ЭЛЕКТРОННЫЕ СЛОВАРИ

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе – узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

ПРОГРАММЫ ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

ПРОГРАММЫ ДЛЯ ПОДСЧЕТА СТАТИСТИКИ

Translator’s Abacus – бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount – платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт: http://www.anycount.com/

FineCount – программа доступна в двух версиях, платной и бесплатной, которые различаются объемом функций. Сайт: http://www.tilti.com/

ПРОГРАММЫ ДЛЯ ЛОКАЛИЗАЦИИ ПРИЛОЖЕНИЙ

ПРОГРАММЫ ДЛЯ ПЕРЕВОДА САЙТОВ

ДРУГИЕ ПРОГРАММЫ ДЛЯ ПЕРЕВОДЧИКОВ

ApSIC Comparator – программа для сравнения файлов (исходный текст VS текст с изменениями, внесенными переводчиком). Сайт.