что такое параллельный перевод

Изучение английского языка с помощью параллельных переводов

Изучение английского языка — дело непростое и небыстрое. Хотя этот язык и считается одним из самых простых и прозрачных для изучения, но в действительности прозрачен в английском языке только синтаксис. Специфика произношения английских слов и наличие большого количества идиом значительно усложняют изучение этого языка. Если при разговоре на русском языке основную роль играют согласные, то при разговоре на английском языке основное внимание уделяется гласным.

Находясь за рубежом, можно легко вычислить русских, только начинающих говорить на английском. Характерно твердое произношение согласных, и произношение слов английских слов — как пишется, так и читается.

Если вы поставили перед собой цель — изучить английский язык, то можно обратить внимание на изучение английского языка с помощью параллельных переводов. Этот способ мало вам поможет — если ваша цель — разговорный английский. Но если вы хотите свободно читать английскую литературу, то параллельные переводы — это хороший способ сформировать обширный словарный запас и освоить произношение слов.

На сайте getParallelTranslations.com процесс изучения английских слов с помощью параллельных переводов выглядит следующим образом.

Есть набор художественных книг. На данный момент их около пятидесяти. Вы можете выбрать любую из книг для изучения английского языка.
Каждая книга разбита на предложения как показано на рисунке ниже.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

По каждому слову в английского тексте есть словарные статьи, где дается перевод слова, его произношение в виде транскрипции. К каждому звуку в транскрипции слова есть видеурок, как этот звук произносится. Пример словарной статьи вы можете увидеть на следующем рисунке.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Для помощи в освоении незнакомых английских слов используется методика интервальных повторений (ссылка “выучить слово” на рисунке) — первые три повторения каждый день, последующие повторения каждые три дня. Минимальный цикл изучения слов — четыре повторения или одна неделя. За четыре повторения новое слово и его произношение прочно усваивается.

Повторение слова состоит из следующих этапов:
— пробуем вспомнить слово и его произношение
— проверяем правильность произношения и значение слова
— читаем слово в контексте предложения

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Тут два важных момента. Через произношение слова подключается слуховая память. Правильно проговаривая слово, легче его усвоить. Также если вы его услышите в речи, то сможете его распознать.

Через чтение слова в контексте предложения формируются четкие ассоциации с данным словом, что позволяет изучать большое количество слов. Слова не накладываются друг на друга и не путаются между собой.

Схема изучения слов может быть следующая.
Читаем новый текст до тех пор, пока не наберется около 35 новых слов для изучения.
Повторяем их в течении недели (четыре повторения: три повторения через день и одно повторение через три дня)
На следующей неделе все повторяется заново. И за год при таком расписании может быть изучено около 1,500 новых слов, что равносильно уверенному чтению английской литературы без словаря за один год.

Источник

Метод параллельного чтения на английском: реальная польза или трата времени?

В последнее время популярным стало параллельное чтение на английском и русском языках, поэтому наши читатели иногда спрашивают, так ли он эффективен, как пишут составители книг с текстами на двух языках. В этой статье мы расскажем о пользе и недостатках этого способа изучения языка, а также приведем советы о том, как использовать метод параллельного чтения на английском максимально продуктивно.

Параллельное чтение — это чтение одного и того же текста на двух языках: родном и изучаемом. За основу, как правило, берется адаптированный текст, например, на английском языке, и рядом с ним пишется дословный или литературный перевод на русский язык. Однако есть и другой вариант параллельного чтения, его использовал полиглот Генрих Шлиман. Так, он сначала читал текст на родном языке, а потом неадаптированный текст на изучаемом. Сегодня люди тоже используют такой способ: берут книгу в оригинале и ее перевод и изучают язык таким образом.

Польза параллельного чтения

1. Развитие чувства языка

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный переводГлавное достоинство параллельного чтения — развитие чувства языка и языковой догадки. То есть, читая и сравнивая два текста на разных языках, вы постепенно начинаете лучше понимать структуру английского предложения, принципы его построения, особенности использования тех или иных частей речи и т. п. Вы можете подробно почитать в наших статьях о том, что такое языковое чутье и как его развить и что такое языковая догадка.

2. «Полное погружение» в английский язык

Тексты книг в оригинале позволят вам создать языковую среду для изучения английского. Вы сможете «погрузиться» в изучаемый язык в его естественном виде на время чтения.

3. Изучение английского языка экстенсивным способом

Интенсивные способы изучения английского, такие как выполнение упражнений, изучение новых слов или общение с преподавателем, иногда хочется заменить чем-то, требующим меньше усилий. Метод параллельного чтения позволяет вам «учиться без учебы», то есть по факту вы читаете интересную вам книгу, и в то же время это занятие приносит пользу вашему английскому.

4. Учеба без грамматики

Приверженцы метода параллельного чтения на английском утверждают, что это естественный способ изучения языка, схожий с тем принципом, по которому дети осваивают родной язык. Малыш с первого же дня погружается в языковую среду, а не просто изучает грамматику. Таким образом он учится говорить, механически повторяя за окружающими слова и фразы, а уже позже переходит непосредственно к изучению грамматических правил. Вам тоже предлагается читать книгу, не разбираясь во временах английского и прочих тонкостях языка. По мнению лингвистов, такой способ подойдет не всем, но некоторые люди получают пользу при чтении параллельных текстов на английском языке.

5. Меньше отвлечения — больше удовольствия

При чтении обычной книги на английском языке вы будете прибегать к помощи словаря и отвлекаться от чтения всякий раз, когда встретите незнакомое слово и не сможете понять его значение из контекста. При параллельном чтении такой необходимости не возникает: у вас перед глазами находится полный перевод текста, так что вы не будете отвлекаться на работу со словарем.

6. Задействование зрительной памяти

Во время чтения вы задействуете зрительную память, а это значит, что часто встречающиеся в тексте слова и фразы будут неплохо запоминаться. Если вы визуал, которому легче воспринимать именно зрительную информацию, вам может понравиться такой метод чтения на английском языке.

7. Запоминание слов в контексте

Во время чтения книги вы будете запоминать часто повторяющиеся слова, а также принципы их использования в речи. Причем вы будете изучать новую лексику, не прилагая почти никаких усилий. А если во время чтения вы будете еще и выписывать некоторые слова и заучивать их, то получите еще больше пользы от параллельного чтения на английском языке.

8. Интересный прием для любителей чтения

Если вам знакомо состояние «Я дочитаю тебя, последняя глава, и неважно, что сейчас 3 часа ночи», то вы по достоинству оцените такой прием изучения английского, как чтение параллельных текстов. А особенно понравится это занятие тем, кто пока не очень хорошо знает английский, но горит желанием прочитать какое-либо произведение англоговорящих авторов в оригинале. К тому же вам будет интересно увидеть, насколько перевод отличается от оригинала и как выражаются те или иные эмоции на родном и изучаемом языке.

9. Можно пропускать сложные отрывки

При параллельном чтении вы не потеряете нить рассуждения, даже если наткнетесь на сложный отрывок на английском языке. Вы сможете прочитать перевод и разобраться с текстом или просто пропустите непонятый отрывок.

Недостатки параллельного чтения

1. Трудоемкое занятие, которое подойдет не всем

Так как параллельное чтение английских текстов — экстенсивный способ изучения языка, то он требует больших временных затрат, нежели интенсивные способы. Читать надо будет много и притом ежедневно. Кроме того, не каждому человеку подойдет этот прием: вам надо будет заставлять себя читать много незнакомых слов, а это довольно утомительное занятие.

2. Сложно найти подходящую книгу

Хоть параллельное чтение и популярно, интересные книги придется искать довольно долго, ведь составление действительно качественного материала для параллельного чтения — занятие долгое и сложное.

3. Большие затраты времени

При параллельном чтении вы фактически читаете текст 2 раза: на родном языке и на изучаемом. Получается, вы тратите много времени на чтение, а эффективность такого приема изучения английского остается под вопросом.

4. Опечатки в тексте

Нередко качество параллельных текстов оставляет желать лучшего, а опечатки и грубые ошибки по «закону подлости» запоминаются лучше, чем правильно написанные слова. Поэтому тщательно подбирайте литературу для чтения.

5. Проблемы с сопоставлением текстов

Если вы учите английский язык совсем недавно, еще не успели разобраться с грамматикой, то вам будет довольно сложно сопоставлять русский и английский текст. Надо понимать, что предложения не будут переводиться дословно, а иногда их структура будет меняться и вовсе кардинальным способом. А если вы не понимаете, почему предложение построено именно так, а не иначе, как соотносятся части речи, польза от чтения значительно уменьшается.

6. Постоянное переключение с одного языка на другой

Не всем просто перестраиваться на чтение то на родном языке, то на изучаемом. У вас в голове может возникнуть «языковая каша», а сюжетная линия произведения будет потеряна.

7. Неудобство в использовании метода

Читать два текста на бумажном носителе можно только дома, да и то это весьма неудобно. Компьютерные программы и приложения для гаджетов— неплохая альтернатива, однако и у них есть нюансы. Так, подобные программы, как правило, не предоставляют широкого выбора произведений, а в текстах частенько присутствуют ошибки.

8. Устаревшие слова и выражения

Шекспир и Диккенс — не слишком удачный выбор для тех, кто решил заняться параллельным чтением. В текстах их произведений много устаревших слов, которые вам никогда не пригодятся в жизни. Поэтому, если вы решили почитать произведение в оригинале, отдайте предпочтение более современным авторам, хотя подобные тексты сложно найти.

9. Исключительно для любителей чтения

Если вы не знаете, что такое «книжное похмелье» и никогда не жертвовали сном ради «ну еще 20 страничек этой чудесной главы», скорее всего, вам не понравится этот метод. Все логично: чтение следует использовать только тем, кто любит читать. Если вам это не подходит, попробуйте учить английский по фильмам и сериалам, по подкастам или аудиокнигам.

Как эффективно пользоваться методом параллельного чтения

Решили попробовать, подойдет ли вам метод параллельного чтения текстов на английском языке? В таком случае мы хотим дать вам несколько советов о том, как сделать это занятие максимально полезным для вашего английского.

1. Сначала изучение основ, потом чтение

Тем, кто только начал учить английский, нет никакого смысла читать параллельные тексты. Вы пока не сможете сопоставить грамматические конструкции и части речи в разных языках. Поэтому дождитесь хотя бы уровня Elementary, освойте основы грамматики и только потом приступайте к чтению.

2. После Intermediate уже поздно

Как только вы достигли уровня Intermediate, переходите к чтению книг полностью на английском языке. Это может быть как адаптированная литература, так и книги в оригинале. А чтобы вам было легко и приятно читать текст, мы составили для вас подробную таблицу художественных произведений, рекомендованных к прочтению на разных ступенях знаний. Вы найдете эту информацию в статье «Какие книги читать на английском языке и как правильно это делать». Полностью англоязычный текст приносит намного больше пользы, чем параллельное чтение, поэтому по достижении среднего уровня отложите параллельные тексты в сторонку.

3. Выучите правила чтения

Знание правил чтения — обязательное условие для использования метода параллельных текстов. В противном случае ваши занятия принесут больше вреда, чем пользы.

4. Собственные интересы — прежде всего

Всегда выбирайте тот текст, который вы с удовольствием прочитали бы или перечитали бы на русском языке. Если вам будет интересен сюжет, есть вероятность, что вы продержитесь до конца книги, а не забросите это занятие после первых 10 страниц.

5. Развивайте остальные навыки

При параллельном чтении вы развиваете только один навык — само чтение, а аудирование, говорение и письмо остаются в своем первозданном виде. Однако если не работать с остальными навыками, то прогресса в английском вы не почувствуете. Не забывайте прослушивать аудиоматериалы, писать небольшие сочинения и обязательно найдите себе собеседника, ведь вы учите английский, чтобы говорить на нем, а не только читать тексты.

6. Слушайте аудиозапись текста

Хотите привыкнуть к звучанию английской речи и научиться понимать ее на слух? Тогда советуем найти аудиозапись к английскому тексту и прослушивать каждую прочитанную вами фразу. Также можно воспользоваться специальными программами с технологией Text-To-Speech, например neospeech.com. В окошко можно ввести любую фразу, и программа озвучит ее голосом носителя языка с правильным произношением и интонацией.

7. Читайте фразу на русском и сопоставляйте с предложением на английском

В принципе, вы можете делать наоборот: читать на английском, а потом на русском, однако если вы хотите разобраться в структуре предложения, то удобнее будет именно предложенный нами вариант. Так, вы прочитаете фразу на русском и автоматически будете сопоставлять английские слова с русскими, разбираться в структуре предложения, это поможет вам развить чувство языка и языковую догадку.

8. Читайте много и часто

Параллельное чтение принесет пользу только в том случае, если читать вы будете долго и часто, желательно ежедневно. Поэтому, если вам нравится такой прием изучения английского, уделяйте ему минимум 25-30 минут в день, иначе ваши старания будут напрасной тратой времени.

9. Выберите удобные ресурсы

Конечно, мы не можем не упомянуть в этой статье полезные сайты, на которых вы найдете тексты для параллельного чтения. Хотим порекомендовать вам 2 хороших ресурса:

Думаем, теперь вы сможете сами оценить для себя преимущества и недостатки метода параллельного чтения, а наши советы помогут вам сделать это занятие действительно полезным. Хотите своевременно получать авторские советы и анонсы статей? Предлагаем подписаться на нашу рассылку, обещаем беспокоить вас всего 1 раз в неделю и только по делу!

Источник

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный переводeng_with_pic

Об иностранных языках, рисунках и не только.

Метод параллельных текстов наверное самый древний из всех известных методов, используемый для обучения иностранному языку. Его еще можно было увидеть в старых советских учебниках для подготовки переводчиков.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Итак, это один из самых первых способов начать изучать иностранный язык. Давным давно учебников по грамматике языка почти не существовало. Поэтому начав изучать новый язык, студенты просто брали две одинаковые книги на разных языках и страница за страницей читали то на одном, то на другом языке. В Италии жил когда-то гений по имени Джузеппе Меццофанти (1774-1849), кардинал, которому приписывали знание 72 языков. Жил да был он в свей келье и в свободное время, которого у него было навалом, изучал иностранные языки как раз методом параллельных текстов. Джузеппе читал литературу, очерки на разных языках, сравнивал предложения и пытался догадаться о значении слов и частей речи. Как можно догадаться времени на такое скрупулезное занятие у него уходило не мало.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Метод параллельных текстов был популярен не только в Европе но и в Российской империи. Помните на уроках истории говорили, что чуть ли ни у каждого дворянского отпрыска была madam? Гувернантки и гувернеры, французы и немцы жили при дворе и их задача была обучить детей манерам и языкам. Так вот и там же, детишек заставляли читать книги, сравнивать, догадываться о значении того или иного слова.

Чтение — полезный навык. И, конечно, один из самых основных. Но насколько эффективно именно такое чтение?

— развивает языковую догадку. Нет словаря — нет подсказок. До всего приходится додумываться самому. Дедуктивный метод всем в помощь! Надо будет поднапрячься и определить где глагол а где прилагательное. Внимательность и усидчивость развивается как никогда;

— вы будете много читать. Собственно весь метод- это сплошное чтение. И если книжка не ваш верный спутник, то здесь уже увернутся не получится, так как она и есть источник всех знаний;

— вы научитесь воспринимать текст целиком как единое целое. Это со временем поможет быстрее понимать и воспринимать информацию.

— Съедает много времени.
Нужно открыть книжки на нужных одинаковых страницах. Прочесть один отрывок, затем его же в русском переводе. Или предложение за предложением. Тут вам вдруг непонятно слово, и вы начинаете искать его аналог в русском. Минуту, две а слова все нет и, к примеру, быть не может, так как переводчик его просто выкинул из текста. Структура английского предложения и русского разная, поэтому чтобы найти где тут прилагательное а где глагол, а где вообще наречие, может уйти не одна минута, особенно если вы новичок.
Иногда в книге при переводе выкидывают целые абзацы, потому что их смысл может быть не понятен читателям, или просто цензура не позволила или еще что. А вот вам придется тогда искать его в по всей странице и тратить свое время;

— Чтение параллельных текстов не годиться для совсем новичков. Да есть Като Ломб, венгерская переводчица и полиглот, для которой языки были страстью на столько сильной, что она посвятила им жизнь. Като могла взяться за древний язык и методом параллельных текстов начать его осваивать. Сравнивать, догадываться и тд. Поэтому говорить она к примеру могла на 10 языках, а понимать тексты на 30 и более. Но она была лингвистом, причем жутко любопытным и дотошным. Ей доставляло удовольствие копаться в тексте, догадываться о его структуре и предсказывать части речи. У многих людей есть такое увлечение? Очень сомневаюсь.

На начальных этапах изучения испанского я помню взяла книгу на испанском и ее перевод на английском. Промучила две главы и закинула. Честно, у меня не пошло. Мне не удобно было сидеть с 2 книгами одновременно, то на одну отвлекаться то на другую. Потом уже я увидела, что издательство Лонгман выпустило книжечку с параллельными текстами, но я на тот момент уже подсела на книги по методу Ильи Франка и дело пошло значительно быстрее.

И такого чтения есть свои поклонники, которые создают сайты и пишут книги. И это здорово. Но я для себя и студентов стараюсь его минимизировать при обучении.

Полезный пост? Поставьте плюсик пожалуйста =)

Источник

Сам себе Гутенберг. Делаем параллельные книги

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Если вам нравится изучать языки (или вы их преподаете), то вы наверняка сталкивались с таким способом освоения языка как параллельное чтение. Он помогает погрузиться в контекст, увеличивает лексикон и позволяет получить удовольствие от обучения. Читать тексты в оригинале параллельно с русскоязычными, на мой взгляд, стоит, когда уже освоены азы грамматики и фонетики, так что учебники и преподавателей никто не отменял. Но когда дело все же доходит до чтения, то хочется подобрать что-то по своему вкусу, либо что-то уже знакомое или любимое, а это часто невозможно, потому что такого варианта параллельной книги никто не выпускал. А если вы учите не английский язык, а условный японский или венгерский, то трудно найти вообще хоть какой-то интересный материал с параллельным переводом.

Сегодня мы сделаем решительный шаг в сторону исправления этой ситуации.

Из чего делаем

На входе у нас будут два текстовых файла с оригинальным текстом и его переводом. Для примера возьмем книгу «Убить пересмешника» Харпер Ли на русском и английском языках.

Начало документов выглядит так (отрывки приведены в таком виде, в котором они были найдены в сети):

Как делаем

Задача объемная, поэтому разобьем ее на три части:

Начнем с выравнивания двух текстов, так как эта часть является центральной и крайние пункты опираются на нее.

Получение параллельного корпуса

Строго говоря, нам нужно получить параллельный корпус из двух текстов. Задача не так проста как кажется по ряду причин:

Для выравнивания воспользуемся библиотекой lingtrain-aligner, над которой я работаю около года и которая родилась из кучи скриптов на python, часть из которых еще ждет своего часа. Проект открытый, буду рад вашим идеям и предложениям. Все ссылки вы найдете в конце статьи.

Под капотом библиотека использует модели машинного обучения, которые переводят предложения в векторное пространство. Это позволяет посчитать между векторами расстояние и проинтерпретировать его как близость предложений по смыслу. Эти модели многоязычные, одна из них поддерживает чуть более 50-ти языков, вторая — более ста. Причем сюда не входят родственные языки, для которых такой подход тоже будет иметь смысл за счет того, что они частично пересекаются по лексикону. Ссылки на статьи и списки языков, опять же, найдете ниже.

При подаче в программу текстов, произойдет следующее:

Метки нам понадобятся для того, чтобы при составлении книги из корпуса восстановить деление по частям и главам.
Давайте подготовим тексты для подачи в программу.

Подготовка текстов

Язык разметки

В качестве разметки был придуман простой язык, который совместим с последующим разбиением текста на предложения. Сейчас поддерживаются несколько типов меток, которые ставятся в конце строки. В конце каждой метки должна стоять точка.

МеткаЗначениеУстановка
%%%%%title.Название произведенияВручную
%%%%%author.АвторВручную
%%%%%h1. %%%%%h2. %%%%%h3. %%%%%h4. %%%%%h5.ЗаголовкиВручную
%%%%%divider.РазделительВручную
%%%%%.Новый абзацАвтоматически

Метки абзацев

Метки абзацев будут проставлены автоматически по следующему правилу: если строка кончается на символ [. ] и перенос строки, то считаем такую строку концом абзаца.

Правила подготовки текста

Расставьте метки руками в соответствии с правилами, пустые строки в данном случае роли не играют. Должны получиться документы, похожие на такие:

Здесь и дальше все «главные» заголовки («ЧАСТЬ ПЕРВАЯ», «ЧАСТЬ ВТОРАЯ» и т.д.) помечены меткой h1, номера глав помечены метками h2. Перед выравниваем все метки будут удалены из текста и будут использованы при создании книги.

Выравнивание

Colab блокнот

Чтобы выровнять свои тексты используйте вот этот Colab блокнот. Это интерактивный блокнот на питоне, в который вы можете вносить изменения и запускать в браузере. В нем есть инструкции и некоторые комментарии к процессу. В конце можно будет скачать получившуюся книгу как html страничку.

Скрипты

Здесь же давайте напишем небольшой скрипт, обсудим сложности и ограничения нашего подхода.
Установим библиотеку следующей командой:

Импортируем необходимые компоненты:

Определим пути до входных файлов и прочитаем все строки в переменные:

Определим также путь до SQLite базы данных (это хранилище со всей необходимой для выравнивания информацией) и параметрами языка lang_from и lang_to. Эти параметры очень важны, так как они влияют на правила разбиения строк на предложения:

Получить список всех доступных языков можно следующей командой:

Если нужного языка в списке пока нет, но он поддерживаются моделями, то используйте код xx, тогда к тексту будут применены стандартные правила фильтрации и разбиения на предложения. Модель sentence_transformer_multilingual работает быстрее и поддерживает 50+ языков, sentence_transformer_multilingual_labse поддерживает 100+ языков.

Добавим к текстам метки абзацев:

Разобьем документы на строки:

Создадим нашу базу данных и наполним ее данными, взятыми из нашей разметки. В базе хранятся строки с координатами абзацев и глав, метаданные, маппинг выровненных строк на их изначальный состав и местоположение. Такая структура позволяет писать для этого хранилища UI, в котором можно проводить различные манипуляции с корпусом. Это отдельный проект, о нем в следующий раз.

Теперь можно выровнять документы. Процесс выравнивания идет кусками с размером batch_size, вокруг каждого куска берется дополнительное количество строк размера window, чтобы гарантированно захватить необходимые строки. Модель берет заданное количество строк первого текста и подбирает в соответствующем фрагменте второго текста лучшие соответствия, используя векторные представления. На этом основывается первоначальное выравнивание. Для того, чтобы выровнять первые четыреста строк, выполним следующую команду.

Результат выравнивания

Теперь можно посмотреть на результат первичного выравнивания! Это возможно благодаря тому, что в базе мы храним изначальные номера строк для выровненного корпуса. Воспользуемся модулем vis_helper. Так как строк у нас 400, то нарисуем все на одной картинке, задав параметр batch_size=400. Если указать, например, batch_size=50, то получим 4 картинки по-меньше.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Посмотрим на картинку. Выравнивание предсказуемо идет от начала к концу, но есть конфликты. Основных причин две:

Хорошим решением мне видится регрессия на координаты строк при выравнивании батча и сдвиг окна на конец потока при выравнивании следующего. Минусом тут будет потеря возможности распараллеливания обсчета батчей, так как они станут зависимы друг от друга.

Сейчас окно сдвигается на основе отношения длин текстов. Батчи не зависимы, но есть другая проблема, — если один из текстов это только часть книги, а второй текст полный, то окно быстро убежит от правильного потока выравнивания.

Меня зовут Уинстон Вульф. Я решаю проблемы.

Давайте теперь разбираться с шероховатостями. Глядя на картинку, мы видим, что есть непрерывные цепочки, есть разрывы и есть выбросы. Например, для предложений 10,11,12 модель подобрала предложения 15,16,17 из второго текста. Эта цепочка хорошая. Все, что находится между цепочками назовем конфликтом. При таком определении конфликта можно измерить его размер и подобрать стратегию разрешения. Логика по решению проблем находится в модуле resolver.

Для начала давайте посмотрим на все найденные конфликты:

При этом в переменную conflicts_to_solve попадут конфликты, которые соответствуют заданным параметрам поиска, а в переменную rest остальные.

Выведем на экран статистику:

Видим, что чаще всего попадаются конфликты размера 2:3 и 3:2, это означает, что одно из предложений было переведено как два, либо два предложения были слиты в одно.

Посмотреть на конфликт можно следующей командой:

Видим, что строки 125 и 126 нужно бы сложить в одну, тогда правильное сопоставление выглядело бы как [124]-[122] и [125,126]-[123]. Как же научить этому программу? Так как она уже умеет выбирать лучший из предоставленных вариантов, то давайте ей их и предоставим. Конфликты у нас не очень большие, поэтому мы будем брать все возможные варианты разрешения конфликта, считать для них коэффициент похожести, суммировать и брать лучший. В данном случае это будет два варианта:

Что до стратегии выравнивания, то на данный момент лучше всего себя проявила такая, — сначала ищем конфликты при минимальной длине хорошей цепочки 2 (при таком параметре конфликтов найдется больше всего) и максимальной длиной конфликта не больше 6. Разрешаем все найденные конфликты, при этом большие конфликты становятся меньше так мы их частично разрешили. Затем увеличиваем оба параметра, ищем и снова разрешаем, добивая остатки.

Результат после первого шага:

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

На выходе мы имеем файл book.db. Теперь мы можем перейти к созданию книги.

Конфликты на концах интервала

Отметим, что алгоритм находит конфликты только между цепочками, поэтому разрывы могут остаться на концах интервала. Для разрешения таких конфликтов есть методы:

Книги и стили

За создание книжки отвечает модуль reader.

Сначала прочитаем из базы тексты, разбитые по абзацам, и данные о главах:

Параметр direction [«from», «to»] показывает на основе какого текста делить выравнивание на абзацы. Это дает нам возможность лучше подредактировать только один текст (например, русский) и на его основе сформировать книгу.

Теперь передадим данные в метод create_book():

Получим вот такую книгу:

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Это обыкновенная html страничка со встроенными стилями. В стили я добавил модификаторы, поэтому ее можно распечатать или сохранить как pdf, при этом шрифт с полями станут меньше.

Стилизация

У нас в загашнике осталась информация о соответствии пар предложений. Давайте ее задействуем, дополнительная подсветка поможет при подготовке материалов для обучения. Чтобы это сделать зададим параметр template.

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Шаблонов стилей пока немного, предлагайте свои кастомные стили, добавим их в библиотеку.

Кастомные стили

Зададим параметр template=»custom» и передадим объект styles. Этот объект представляет из себя массив CSS стилей, которые будут применены к предложениям каждого абзаца циклически.

Например, подсветим каждое втрое предложение в абзаце желтым цветом начиная со второго:

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Задавать можно любые применимые к span’ам стили:

что такое параллельный перевод. Смотреть фото что такое параллельный перевод. Смотреть картинку что такое параллельный перевод. Картинка про что такое параллельный перевод. Фото что такое параллельный перевод

Заключение

В голове есть еще много идей по доработкам и дополнительным фишкам. Например, можно сделать мультиязычные книги, можно доставать из текста ключевые предложения и искать по ним картинки (или генерировать нейросетями), можно делать пословное выравнивание и много чего еще. Пока же хочется поделиться промежуточным результатом с сообществом и выслушать ваше мнение.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *