Friday, August 31, 2018

Рапорт о статистике (крамтошка)

1. О названии.

Текст должен называться «Статистические методы в применении к художественному переводу (черновик)», но это звучит слишком уныло, чтобы быть поставленным в заголовок. Поэтому уж лучше назвать первым попавшимся словом. Речь пойдет о возможностях в меру формализованных статистических подходов к переводу художественных текстов с одного языка на другой. На примере романа Ричарда Гавялиса «Vilniaus pokeris», а конкретно на примере нового белорусского перевода (Рычард Гавяліс. Віленскі покер. Менск: Логвінаў, 2018). Выбор языка рапорта я объясню несколько позже.

Дальнейшие рассуждения таковы, что для чтениях их нет нужды быть знакомым с текстом романа.

2. Гиперонимизация

После общей редактуры (т.е. параллельного чтения оригинала и перевода) были созданы частотные словники оригинала и перевода. Сделаны они были максимально просто — словоформы и количество вхождений. Леммы (объединение словоформ в лексему) автоматически не строились, просто потому, что вся затея творилась из любопытства, без далеко идущих планов. Когда они понадобились, я сводил словоформы вручную.

Сопоставление словников тотчас показало значительное сокращение лексикона в переводе, больше чем на 10%. А беглое обследование 4-5 переводов показало, что сокращение словника — естественная, бессознательная тенденция, видимо, любого переводчика. Переводчик художественного текста, насколько можно судить, бессознательно сокращает словарь, в каждом случае выбирая более общее слово заместо более частного. Как кажется, эта тенденция резко противопоставляет собственно автора и переводчика — первый стремится к максимально конкретному описанию, ищет наиболее точное одно слово, не связанный обязательствами. В случае переводчика, связанного требованием точности, происходит что-то вроде взаимовычитания лексиконов (его личного и авторского). Кроме того, очевидно, что огромная часть слишком конкретной, слишком точной лексики (а равно и синтаксиса) отсекается из боязни сделать перевод чрезмерно локализованным, из представления, что, допустим слово «хабарик» или «поджопник» недопустимы в иностранном тексте.

(Для первоначального обсчета брались одни и те же романы в литовский, русских, белорусских, немецких переводах — немецкий был удобен, как язык с меньшим количеством падежей. Соответственно, отдельно обсчитывалась морфология, а потом она выносилась за скобки и сопоставлялся только лексикон.)

На практике эта бессознательная привычка к гиперонимизации была отрефлексирована и возведена в творческий принцип именно русскими переводчиками. Наиболее яркими образцами такого «дистиллированного» перевода можно назвать Маршака и Лозинского, сформировавших целую школу. Лучше всего претензии к этому методу описаны в соответствующей статье М.Л.Гаспарова, где применено замечательно точное определение «стилистический знаменатель», в том смысле, что текст подвергается такой мощной фильтрации, что от него остается лишь самый общий контур, какая-то идея, но полностью исчезает стиль автора, своеобразие языка, любой локальный колорит, приметы эпохи. Излишне говорить, что такой же нормификации подвергаются и синтаксис, и риторический инструментарий автора, а не только словарь. (Можно предположить, что такой метод перевода восторжествовал внутри русской культуры, ибо совпал с вектором языковой политики, направленным на максимальную стандартизацию языка, но это уже несколько другая тема. Так или иначе, хотя я редактировал перевод с литовского на белорусский, я выбрал здесь языком изложения русский, — так как русский читатель может понять и актуальность этой проблемы, и представить себе, что возможны иные типы перевода. В случае английского, представляется, дела обстоят либо еще хуже, из-за повсеместности его употребления, либо в англоязычном мире эта тема слишком сложна, чтобы в ней мог разобраться я, иностранец.)

3. Семантические кластеры

Дальнейшая работа носила менее формализованный характер: выявлялись определенные семантические группы (нп. прилагательные описывающие грязное, (не)приятный запах итд) и сопостовлялись по: (а) богатству лексикона — сколько слов по одну сторону текста, и сколько по другую, и (б) по их распределению вдоль текста.

Последнее существенно, поскольку 4 части романа написаны от лица 4 разных персонажей, у каждого из которых свой особый стиль речи. Линейное распределение показывает, например, что в оригинале используется 3 слова для призраков: pamėklė (4), vaiduoklis (16), šmėkla (26) — в скобках количество вхождений. И дополнительное к ним šešėlis ’тень’. Причем последнее употребляется во всех частях романа, но только в первой — в значении привидения, призрака, а в остальных частях — в значении физической, оптической тени. В переводе же первоначально использовались как основные только два здань (28), прывід (18). Тонкость же состоит в том, что в лексиконе первого героя представлены все 4 слова, тогда как остальные персонажи преимущественно обходятся каким-то одним из этих слов. Можно себе представить, что на довольно незаметном для читателя, переводчика, редактора уровне такой прием вызывает эффект, словно бы остальные трое персонажей выдуманы первым.

Хотя описанные процедуры производились вручную, понятно, что они достаточно формальны и могут быть без труда автоматизованы. Во-первых, анализу неизбежно подвергаются наиболее частотные слова, смысловые слова появляющиеся в тексте чаще всего. Во-вторых, установление синонимических групп происходит более-менее автоматически, так как переводчик в одном случае переведет šlykštus как ‘гідкі’, в другом как ‘брудны’, в третьем как ‘агідны’, а в другом случае один из этих переводов получит слово purvinas. Таким образом, пересечение словарей оригинала и перевода позволяет формировать семантические кластеры не на голых ощущениях, а вполне себе формальным способом.

Всего таких групп было взято около 20: грязное и грязь, плохое и ужасное, продолговатое, запахи (острые, резкие итп), тонкое, слова описывающие воду (мутное итп), названия одежды — таковы наиболее лексически богатые группы. (И как можно увидеть, прочитав книгу, всё это — значимые для романа темы.)

(Понятно, что при построении групп учитывались все контексты оригинала для каждой лексемы, учитывались смыкание и пересечения групп, использовалась визуализация — всё это я опускаю за очевидностью.)

4. Практическая польза и удовольствие для всего разумного человечества и отдельных представителей.

Если говорить об ощущениях редактора, то они довольно сильны — он начинает видеть роман в разрезе, получает возможность уловить далекие друг от друга переклички, которые незаметны при линейном чтении.

Если же говорить о практической пользе от статистического подсчета, то она, в первую очередь, не в расширении словаря — с чего я начал изложение, — а в создании дополнительного слоя организации текста. Перевод тем и отличается от оригинального художественного текста, что второй проходит множество этапов формирования — от планов, набросков, отрывков, до объединения фрагментов в целое, сглаживания отличий итп. Если перед нами роман, то написание его занимает большой промежуток времени, в течении которого он может лежать без движений, потом подвергаться переделкам в соотвествии со сменой словаря или стилистических пристрастий. При этом оригинальный текст навсегда сохраняет эту многослойность, связанную с постепенным его ростом, переделками, сменой задач.

Тогда как перевод, за редким исключением, есть работа одного человека, выполняемая одномоментно — по сравнению с оригинальным сочинением, перевод оказывается однослойным, плоским.

Поэтому мне представляется, что статистические подсчеты позволяют создать формализованную надстройку над текстом перевода, то есть делают перевод несколько более сложно организованным, несколько более глубоко структурированным — а, значит, более похожим на оригинальное художественно произведение. (В случае работы над этим романом было применено еще несколько процедур, позволивших создать еще несколько слоев, но в этот рапорт их описание не влезет.)

На картинке примеры визуализации для тех случаев, когда большие группы переставали помещаться в голове:

PS: текст этот написан известным приемом one-touch, без глубоких раздумий, но вероятно с опечатками. Я не стал его снабжать конкретными разборами (хотя их много было написано в процессе работы), боясь, что та простая идея, которая в рапорте высказана — просто не выдержит большего веса.

PPS: список рецензий, просто удобное место хранения:

  1. 25-05-2021. С. Астраўцов. «Віленскі покер»: раман пра Вільню, дзе няма месца для беларусаў (svaboda).

No comments: