Робота з форматованим текстом

Інформація форматування у файлі оригінала зазвичай повинна відтворюватися в перекладеному файлі. OmegaT показує інформацію про форматування у підтримуваних форматах (у даний час це DocBook, HTML, XHTML, Open Document і OpenOffice.org) у вигляді тегів. Зазвичай, під час оцінки схожості різних текстів з метою визначення збігів, теги ігноруються. Теги, які Ви створили в перекладеному сегменті, також будуть і в перекладеному документі.


Форматування тегів

Назва тегу: Теги складаються з 1-3 літер та однієї цифри. Унікальний номер дозволяє групувати теги й розрізняти ті теги, які мають однакові символи, але насправді — різні. Символи можуть відображати (не обовʼязково) значення форматування даного тегу (наприклад, жирний шрифт, курсив тощо).

Нумерація тегів: Теги нумеруються в порядку зростання за групами тегів. Те, що називається „група тегів“ — це або один окремий тег (наприклад, <br1>) або парні теги (наприклад, <i0> і </i0>). У сегменті перша група (парний або окремий тег) отримує номер 0, друга — номер 1 і так далі. Перший приклад нижче має 3 групи тегів (парний, окремий тег і знову парний), другий приклад має лише одну групу (парний тег).

Парні чи окремі теги: Теги завжди є або окремими тегами або парними. Окремі теги вказують інформацію форматування, яка не впливає на текст, що його оточує (наприклад, додатковий пробіл або розрив рядка).

         <сегмент 2132><b0><Ctr+N></b0>, <br1><b2><Enter></b2><кінець сегмента>

<br1> — це окремий тег, який не впливає на текст, що його оточує. Парні теги зазвичай впливають на інформацію про стиль, яка застосовується до тексту між відкриваючим і закриваючим тегами пари. Що б не трапилося з парними тегами, відкриваючий тег завжди повинен стояти перед закриваючим.

        <сегмент 3167>файл Log (<b0>log.txt</b0>) для відстеження операцій та помилок.<кінець сегмента>

Теги <b0> і </b0> парні і стосуються тексту log.txt.


Сегментація тегів та речень

OmegaT створює теги перш ніж буде застосовано сегментацію по реченнях. Залежно від правил сегментації, у Вас може зʼявитися враження, що теги не відповідають вищезазначеним правилам нумерації та групування. Погляньте на наступний текст: "До: \. Після: \s". .Можна було б очікувати таке форматування (<b0> і </b0> означають початок і кінець курсиву):

        <сегмент ....> <b0>До: \. Після: \s</b0><кінець сегмента>

Але якщо Ви зараз застосуєте до цього сегмента правило сегментації за замовчуванням, то отримаєте такий результат:

         <сегмент 1990> <b0>До: \. <кінець сегмента>
<сегмент 1991> Після: \s</b0><кінець сегмента>   

Застосування правила сегментація після крапки і пробілу, розділяє текст оригінала на два сегменти, навіть якщо два теги <b0> і </b0>будуть разом у одному сегменті. У деяких випадках це може навіть спричинити проблеми з перекладом, наприклад, якщо теги потрібно вставити в текст перекладу, щоб відобразити порядок слів цієї мови, (див. нижче Операції з тегами).


Операції з тегами

При роботі з тегами потрібно бути обережним. Якщо їх випадково змінити, форматування файлу оригінала може бути пошкоджено. Розумним буде підхід „не лагодь те, що не зломане“. Тим не менш, важливо знати можливості і як їх можна використати.

Копіювання груп тегів: : щоб дублювати групи тегів, просто скопіюйте їх у потрібне вам місце. Памʼятайте, що в парних тегах відкриваючий тег завжди повинен передувати закриваючому. Форматування групи, яку ви скопіювали, застосовується до того місця, куди ви її скопіювали.

Наприклад:

        <сегмент 0001><b0>Це форматування</b0>буде скопійоване сюди.<кінець сегмента>

Після копіювання:

        <сегмент 0001><b0>Це форматування</b0> було <b0>скопійоване сюди</b0>.<кінець сегмента>

Видалення груп тегів:Якщо Ви хочете видалити групу сегментів, просто приберіть її в сегменті. Памʼятайте, що для групи парних тегів як початковий, так і кінцевий теги повинні бути видалені, щоб переконатись, що видалені всі сліди форматування, інакше перекладений файл може бути пошкодженим. Видаляючи групу тегів, Ви видалите відповідне форматування у перекладеному файлі.

Наприклад:

        <сегмент 0001><b0>Це форматування</b0> буде виделено.<кінець сегмента>

Після видалення:

        <сегмент 0001>Це форматування було видалено.<кінець сегмента>

Зміна порядку груп тегів: Щоб змінити порядок груп тегів для відображення структури мови в перекладі, просто перемістіть групу тегів туди, де вона повинна бути в перекладі. Форматування буде відповідати тій частині, до якої воно було застосоване.

Наприклад:

        <сегмент 0001><b0>Форматування нуль</b0> і <b1>форматування один</b1> у зворотньому порядку.<кінець сегмента>

Після зміни порядку:

        <сегмент 0001><b1>Форматування один</b1> і <b0>форматування нуль</b0> помінялися місцями.<кінець сегмента>

Ієрархія груп тегів

Зміна порядку груп тегів може призвести до вкладення однієї групи тегів в іншу групу. Це добре, якщо зовнішня група повністю оточує внутрішню групу. Іншими словами, при переміщенні парних тегів переконайтеся, щоб відкриваючий та закриваючий теги були переміщені в переклад, інакше перекладений файл може бути пошкоджений і не відкриється. Для вкладеної частини застосовуються обидва формати.

Наприклад:

        <сегмент 0001><b0>Форматування</b0> <b1>один</b1> буде вкладене у форматування нуль.<кінець сегмента>

Після вкладення:

        <сегмент 0001><b0>Форматування <b1>один</b1></b0> було вкладено у форматування нуль.<кінець сегмента

Групи тегів, які перекриваються

Перекривання — результат неправильних змін парних тегів. Воно, без сумніву, пошкоджує форматування, а іноді і призводить до того, що перекладений файл не відкривається. Наприклад:

        <сегмент 0001><b0>Форматування</b0> <b1>один</b1>буде пошкоджено.<кінець сегмента>

Після неправильної зміни:

        <сегмент 0001><b0>Форматування <b1>один</b0> </b1>було успішно пошкоджено.<кінець сегмента>

Перевірка груп тегів

Функція „Перевірити теги“ виявляє (навмисно або випадково) змінені теги та відображає задіяні сегменти. Цю функція можна ввімкнути, натиснувши CTRL+T, після чого відкриється вікно, в якому відображаються всі теги в перекладі, де є підозра на пошкоджені або погані теги. Часто виникають проблеми з файлами OpenDocument або OpenOffice.org, які неможливо відкрити через проблеми з тегами, які зʼявляються під час перекладу. Цю проблему можна легко вирішити за допомогою функції перевірки тегів, відновлюючи теги та створюючи знову перекладені документи.

Вікно, яке відкривається натисканням CTRL+T, містить таблицю з 3 стовпцями:

Теги виділені жирним шрифтом і синім кольором для зручного порівняння вмісту оригінала та перекладу. Натисніть на посилання, щоб активувати сегмент у вікні редагування. Якщо необхідно, виправте помилку та натисніть CTRL+T, щоб повернутися на екран перевірки тегів виправлення інших помилок. Помилки тегів виникають при зміні тега у перекладі, через що змінюється порядок і кількість тегів, які більше не співпадають з оригіналом. Деякі зміни тегів необхідні та доброякісні, деякі призводять до проблем при створенні перекладеного документа.


Поради щодо керування тегами

Теги зазвичай містять певне форматування тексту оригінала. Спрощення оригінального тексту може значно зменшити кількість помилок з тегами. По можливості уніфікуйте шрифти, розміри, кольори тощо, оскільки це може спростити переклад і зменшити можливість помилок з тегами. У розділі Операції з тегами Ви можете побачити, що можна зробити за допомогою тегів. Якщо теги створюють для Вас проблеми, а форматування для перекладу не надто важливе, видалення тегів — найлегший спосіб вирішення проблем.

Якщо вам потрібно бачити теги в OmegaT, але не потрібно зберігати більшість форматування у перекладеному документі, Ви можете просто не включати теги у переклад. У цьому випадку слід особливо уважно ставитись до пар тегів, оскільки форматування документа можна легко зіпсувати, якщо видалити лише половину пари. Оскільки теги входять до самого тексту, можна застосовувати правила сегментації для створення сегментів із меншою кількістю тегів. Це додаткова функція, і для її правильного використання потрібен певний досвід.

Важливо: OmegaT ще не може автоматично виявляти помилки при форматуванні, тому програма не попередить Вас про будь-які помилки, які Ви робите, змінюючи форматування, яке краще відповідає мові перекладу. Однак, іноді перекладений файл може виглядати дивно, а у випадку з файлами OpenDocument / OpenOffice.org ці файли можуть не відкриватися взагалі.


Юридична інформація Домашня сторінка Карта змісту