Справочный центр

Правила разбора файлов
*.csv

Правила синтаксического разбора файлов *.csv для проекта локализации приложений
Исходные файлы

Назначение файлов:
.csv файл — файл данных, разделенных запятыми (Comma Separated Values File). Представляет собой простой текстовый формат, в котором данные разделены запятыми и предназначен для представления табличных данных. Часто используются для импорта\экспорта табличных данных между двумя различными компьютерными программами, например, между базой данных и электронной таблицей.

Пример исходного .csv файла:
"47";"Акт выполненных работ";"Work acceptance report";"ru"
"48";"Акт выполненных работ";"Work acceptance report";"ru"
  1. Анализ
Каждая строка в файле CSV соответствует строке в таблице. На одной линии поля разделяются запятыми, каждое поле принадлежит одному столбцу таблицы. Разделителем (delimiter) может быть и другой символ, например, точка с запятой и т.д. Значения, содержащие зарезервированные символы (двойная кавычка, запятая, точка с запятой, новая строка) обрамляются двойными кавычками («), иногда двойными кавычками обрамляют и текстовые значения. Строки разделяются парой символов CR LF (0x0D 0x0A), но может быть и просто LF (0x0A). Т.к. разделители столбцов и строк могут быть разными, так же может быть разной кодировка текстового файла и обрамление двойными кавычками, то все это усложняет перенос данных из одних программ в другие, несмотря на всю простоту реализации поддержки CSV.

Существует расширенный формат, в котором кавычки могут быть как опущены, так и использоваться парно для указания наличия кавычек внутри строки. Также в расширенном формате встречаются комментарии, которые начинаются с символа решётки «#». Обычно комментарии переводу не подлежат и игнорируются в рамках процедуры перевода.Также в расширенном формате внутри строк могут использоваться спецпоследовательности, которые начинаются комбинацией символов &#.

При локализации может использоваться 2 способами:

  • при использовании простого формата в 1 строке хранится 4 ключа;

  • при использовании расширенного формата в 1 строке хранится 2 ключа.

Основные ключи с текстом рассмотрим на примерах ниже:
"47";"Акт выполненных работ";"Work acceptance report";"ru"
и
"Hello, world!","Hallo, Welt!"
# "this is a comment","Dies ist ein Kommentar"
"a phrase with ""double quotes""","Ein Satz mit ""doppelte Anführungszeichen"""
"a phrase with 'single quotes'","Ein Satz mit 'einfachen Anführungszeichen'"
Описание ключей:

1.id
a. Назначение: контекст.
b. Пример: 47.
c. Пояснение: первая колонка, если номера нет, то это второй формат документа.

2.исходная_строка
a. Назначение: исходная строка.
b. Пример: Акт выполненных работ.
c. Пояснение: вторая колонка.

3.строка_перевода
a. Назначение: строка перевода.
b. Пример: Work acceptance report.
c. Пояснение: третья колонка.

4.исходный_язык
a. Назначение: аббревиатура языка исходного текста.
b. Пример: ru.
c. Пояснение: четвертая колонка, если используется второй формат, то отсутствует.

Процесс перевода:
1. Чтобы получить локализованное приложение, необходимо перевести .csv файлы на нужные языки.
2. Мы предлагаем воспользоваться для перевода нашим онлайн-сервисом. Сервис:
  • загружает исходные файлы
  • преобразует их в строки для перевода
  • предоставляет удобный для переводчика интерфейс
  • формирует целевые файлы локализации