Справочный центр

Правила разбора файлов
*.tmx

Правила синтаксического разбора файлов *.tmx для проекта локализации приложений
Исходные файлы
Назначение файлов:
.tmx файл — это файл, содержащий базу переводов (база данных, содержащая набор ранее переведённых сегментов текста), основанный на языке разметки XML. TMX (Translation Memory eXchange — Обмен памятью переводов) — открытый формат файлов XML для обмена данными памяти переводов, которые создаются в процессе автоматизированного перевода. Формат TMX разработан и поддерживается группой OSCAR (Открытые стандарты для повторного использования контейнеров/контента), входящей в состав Localization Industry Standards Association (LISA) (Ассоциация стандартов индустрии локализации). Формат ТМХ облегчает обмен памятью переводов между программами и переводчиками практически без потерь важной информации. Последняя версия этого формата позволяет восстанавливать исходные документы и их перевод из файла TMX. TMX является частью открытой архитектуры для XML-авторинга и локализации (OAXAL).
  1. Анализ
Более детально о формате XML в целом можно почитать здесь.
Основные ключи рассмотрим на примере ниже:
<?xml version="1.0" encoding="UTF-8"?>
<tmx version="1.4">
  <header creationtool="loc" creationtoolversion="1.0" segtype="sentence" adminlang="en" srclang="ru" o-tmf="unknown" creationid="Nemo" creationdate="20190101T012650"/>
  <body>
    <tu tuid="c4ca4238a0b923820dcc509a6f75849b1">
      <tuv xml:lang="bg">
        <prop type="x-new-metadata">e0aa021e21dddbd6d8cecec71e9cf564</prop>
        <seg>РћРљ</seg>
      </tuv>
      <tuv xml:lang="en">
        <prop type="x-new-metadata">e0aa021e21dddbd6d8cecec71e9cf564</prop>
        <seg>OK</seg>
      </tuv>
      <tuv xml:lang="en-AU">
        <prop type="x-new-metadata">e0aa021e21dddbd6d8cecec71e9cf564</prop>
        <seg>OK</seg>
      </tuv> 
      <tuv xml:lang="ru">
        <prop type="x-new-metadata">e0aa021e21dddbd6d8cecec71e9cf564</prop>
        <seg>OK</seg>
      </tuv>
    </tu>
  </body>
</tmx>
Описание ключей:

  1. элемент header, атрибут srclang
a.Назначение: исходный язык базы переводов.
b.Пример: ru.
c.Пояснение: -.


2. элемент tuv, атрибут xml:lang
a.Назначение: язык строки.
b.Пример: ru.
c.Пояснение: в качестве строки может быть как исходная строка, так и строка перевода.


3. элемент seg
a.Назначение: исходная строка | строка перевода.
b.Пример: Отмена.
c.Пояснение: содержит исходную строку или строку перевода, по умолчанию присутствует только исходная строка.

Файлы .tmx можно загружать, использовать, создавать и выгружать в нашем онлайн-сервисе alingvo