A manually aligned Polish-Russian parallel corpus of 4 250 000 words from 20 Polish literary works and 1 legal text and 14 Russian literary texts translated into Russian and Polish respectively.
The texts were processed and aligned using ABBY Aligner. All corrections to the segmentation and alignment of the translation with the original were performed manually.
The texts are provided as TEI P5-compliant XML files with custom PELCRA extensions to mark complex translation equivalence types, and in the XLIFF and TMX formats.
The corpus was originally acquired from the University of Warsaw and enhanced by University of Łódź and the Insitute of Computer Science, Polish Academy of Sciences.
The corpus consists of:
Original title | Translation title | Author | Translator | Original words | Translation words |
---|---|---|---|---|---|
Pamiętnik Pani Hanki | Дневник любви (Дневник пани Ганки) | Dołęga-Mostowicz Tadeusz | Дик Наталья | 97 610 | 100 370 |
Ruch Generała | Ход генерала | Dukaj Jacek | 19 450 | 20 869 | |
Hrabia Monte Christo | Граф Монте-Кристо | Dumas Alexandre, transl. Rogoziński Julian | Олавская Л., Строев В. | 50 749 | 51 447 |
Adama Polanowskiego, dworzanina króla Jegomości Jana III notatki | Ян Собеский Записки Адама Поляновского | Kraszewski Józef Ignacy | 77 632 | 77 243 | |
Boleszczyce | Болеславцы | Kraszewski Józef Ignacy | 72 877 | 76 208 | |
Król Piast | Kraszewski Józef Ignacy | 76 642 | 81 620 | ||
Kunigas | Кунигас | Kraszewski Józef Ignacy | 59 630 | 62 169 | |
Zniewolony umysł | Порабощенный разум | Miłosz Czesław | Британишский Владимир Львович | 66 685 | 66 409 |
Cham | Хам | Orzeszkowa Eliza | Никольская Н. | 57 597 | 55 129 |
Dziurdziowie | Ведьма | Orzeszkowa Eliza | Никольская Н. | 54 671 | 50 414 |
Marta | Марта | Orzeszkowa Eliza | Кротовская Я. | 63 798 | 57 227 |
Meir Ezofowicz | Меир Эзофович | Orzeszkowa Eliza | Смидович И. | 98 999 | 50 414 |
Nad Niemnem | Над Неманом | Orzeszkowa Eliza | Лавров Вукол | 164 306 | 145 515 |
Rękopis znaleziony w Saragossie | Рукопись найденная в Сарагосе | Potocki Jan | Дмитрий Александрович Горбов | 193 522 | 194 853 |
Faraon | Фараон | Prus Bolesław | Слободян Елена | 233 590 | 224 899 |
Ogniem i mieczem | Огнем и мечом | Sienkiewicz Henryk | Лавров Вукол | 235 297 | 205 969 |
Ludzie bezdomni | Бездомные | Żeromski Stefan | 96 764 | 97 470 | |
Popioły | Пепел | Żeromski Stefan | Егорова Е. М. | 226 863 | 229 026 |
Syzyfowe prace | Сизифов труд | Żeromski Stefan | 62 698 | 61 735 | |
Wierna rzeka | Верная река | Żeromski Stefan | 40 430 | 39 250 | |
Kodeks karny | Уголовный кодекс | 46 685 | 48 251 | ||
2 096 000 | 1 998 000 | ||||
Сказка старого прокурора | Bajka starego prokuratora | Арцыбашев Михаил Петрович | Śliwowski René | 5 914 | 5 982 |
Через пятнадцать лет | Po piętnastu latach. Opowiadanie naszego współczesnego | Брюсов Валерий Яковлевич | Śliwowski René | 2 811 | 2 548 |
Последние страницы из дневника женщины | Ostatnie stronice z dziennika kobiety | Брюсов Валерий Яковлевич | Śliwowski René | 16 102 | 15 850 |
Рея Сильвия Повесть из жизни VI века | Rea Silvia. Opowiadanie z życia VI wieku | Брюсов Валерий Яковлевич | Śliwowski René | 8 220 | 7 964 |
Республика Южного Креста | Republika Krzyża Południowego | Брюсов Валерий Яковлевич | Śliwowski René | 5 718 | 5 862 |
За себя или за другую? | Za siebie czy za inną? | Брюсов Валерий Яковлевич | Śliwowski René | 2 394 | 2 397 |
Город Градов | Miasto Gradow | Платонов Андрей | Śliwowski René | 8 775 | 9 729 |
Царица поцелуев | Królowa pocałunków | Сологуб Фёдор | Śliwowski René | 2 040 | 2 083 |
Голодный блеск | Błysk głodu | Сологуб Фёдор | Śliwowski René | 1 972 | 2 083 |
Маленький человек | Maleńki człowiek | Сологуб Фёдор | Śliwowski René | 4 511 | 4 851 |
Превращения | Metamorfozy | Сологуб Фёдор | Śliwowski René | 1 594 | 1 755 |
Рождественский мальчик | Chłopiec wigilijny | Сологуб Фёдор | Śliwowski René | 3 401 | 3 647 |
Свет и тени | Światło i cienie | Сологуб Фёдор | Śliwowski René | 5 714 | 6 008 |
В толпе | W tłumie | Сологуб Фёдор | Śliwowski René | 7 987 | 8 559 |
79 000 | 77 000 | ||||
Total | 2 175 000 | 2 075 000 |
The corpus is available at http://pelcra.pl/resources/parallel/pelcra_par_5.tgz