Machine Translation Review
No. 13, December 2002
ISSN: 1358-8346
This page URL: http://www.bcs.org.uk/siggroup/nalatran/mtreview/mtr-13/5.htm
The Pattern-Based French-to-Polish Machine Translation System
by Dr Miroslaw Gajer
Technical University in Cracow
Department of Control Science
al. Mickiewicza 30
30-059 Kraków
Poland
mgajer@ia.agh.edu.pl
Footnotes are numbered [1], [2], etc., and are hyper-linked to the text.
Abstract
The field of machine translation now has over 50 years of history, and despite great scientific effort is still far from a final and fully satisfactory solution. Several years ago a case-based machine translation technique was proposed, and proved to be a serious alternative to existing machine translation methods. However, case-based machine translation has never been implemented for the Polish language. This author has investigated the possibilities of implementing the case-based machine translation technique for the Polish languages, leading him to the conclusion that this technique must be modified thoroughly if it is to add to the effective construction of a machine translation system for unrestricted text. The modification of case-based machine translation technique for the Polish language led finally to a translation technique, which the author has named pattern-based machine translation. This paper demonstrates the implementation of pattern-based machine translation technique for French to Polish translation.
Introduction
Machine translation is a science about writing computer programs that are able to translate in a fully automatic way between natural languages, e.g. between Spanish and Korean
[1]. It was suggested by an American, Warren Weaver, who on 15th July 1949 sent his famous memorandum to the Rockefeller Foundation that started scientific research in the field
[2]. The first public demonstration of an operating machine translation system took place in New York on 7th December 1954. During this demonstration the machine translation system translated 49 simple sentences from Russian to English.
But after over 50 years of intensive scientific research machine translation is still far from a satisfactory solution
[4]. Several years ago case-based or example-based machine translation techniques emerged as a very serious alternative to other methods used so far for automating the translation process
[3],
[5],
[6],
[7].
The main idea of CBMT (Case-Base Machine Translation) is as follows. Let there be given any bilingual text, for example the following English and Polish text:
There are certain themes of which the interest is all-absorbing, but which are too entirely horrible for the purposes of legitimate fiction. These the mere romanticist must eschew, if he do not wish to offend, or to disgust. They are with propriety handled only when the severity and majesty of truth sanctify and sustain them.
and
Istnieją pewne tematy przejmujące do głębi, wszelako nazbyt okropne, izby mogły stać się przedmiotem rzetelnej literatury powieściowej. Rzetelni pisarze muszą ich unikać, jeśli nie chcą wywołać zgorszenia lub niesmaku. Godzi się je podejmować tylko w takich razach, gdy uświęca je i usprawiedliwia surowe dostojeństwo prawdy.
The first text is the beginning of the story by Edgar Allan Poe entitled 'The Premature Burial' and the second one is its Polish translation made by a prominent translator, Stanisław Wyrzykowski.
In this bilingual text the English phrase 'they are with proprietary handled' was translated into Polish by a human professional translator as 'godzi się je podejmować'. So the idea of the CBMT is such that, while translating any other English text into Polish, if the English phrase 'they are with proprietary handled' appears again anywhere else, it will be substituted the same way as it had been done before by a human translator, i.e. it will be substituted by 'godzi się je podejmować' . The translation obtained in such a manner should still be correct.
Of course, there is no certainty that the translation obtained by the use of CBMT will always and under any circumstances be correct. The main reason for this is natural language ambiguity, which is a permanent feature of any human language. Even translations of whole sentences can be totally different, depending on the context in which these sentences are used. A good example for this is the Dutch sentence:
Als ik in Amsterdam werkte kopte ik en auto.
This sentence can be translated into English as:
If I worked in Amsterdam I would buy a car.
or as:
When I worked in Amsterdam I bought a car.
Everything depends on the context in which the sentence is used. So we can see that the CBMT is not always able to return a correct translation, but the probability that the translation will be correct is still very high, and generally the quality of a text translated with the use of the CBMT is much higher than one obtained with the use of other, e.g. transfer or interlingua, methods.
The Implementation of CBMT for the Polish Language
The Polish language, which belongs to the group of Slavonic languages, posseses a quite complex grammar. The main feature of Polish is its inflexional nature, which makes learning it extremely difficult for a foreigner. In Polish grammar there can be found such phenomena as declination of nouns (there are 6 cases) and conjugation of verbs. Also there are singular and plural forms of words and 3 genders (masculine, feminine and neutral).
These phenomena make the direct usage of CBMT for the Polish language difficult and non-effective. In order to implement CBMT for Polish it must be thoroughly modified. This author has proposed such a modification, which takes into account the peculiarities of the Polish grammar and allows for its effective usage for the purpose of translating into Polish from most West European languages.
In the system developed by this author there exist 3 different types of translation examples, which are further called translation patterns. The way in which these patterns are translated into Polish depends on the actual value of 3 attributes: <case>, <number>, and <gender>.
The first type of translation pattern is the so called declination-type translation pattern, which has the following form:
| 'source language phrase'
| <case> |
| 'translation into target language for <case>=1' | 1 |
| 'translation into target language for <case>=2' | 2 |
| 'translation into target language for <case>=3' | 3 |
| 'translation into target language for <case>=4' | 4 |
| 'translation into target language for <case>=5' | 5 |
| 'translation into target language for <case>=6' | 6 |
| <case> = x; <number> = y; <gender> = z; |
The second type of translation pattern is the so called conjugation-type translation pattern:
| 'source language text' | <number> | <gender> |
| 'translation into target language for <number>=1 and <gender>=1' | 1 | 1 |
| 'translation into target language for <number>=1 and <gender>=2' | 1 | 2 |
| 'translation into target language for <number>=1 and <gender>=3' | 1 | 3 |
| 'translation into target language for <number>=2 and <gender>=1' | 2 | 1 |
| 'translation into target language for <number>=2 and <gender>=2' | 2 | 2 |
| 'translation into target language for <number>=2 and <gender>=3' | 2 | 3 |
| <case> = x; <number> = y; <gender> = z; |
The third type of translation pattern is the non-flexion-type translation pattern:
| 'source language text' |
| 'translation into target language' |
| <case> = x; <number> = y; <gender> = z; |
As we can see, each of the translation patterns has in its bottom row the optional information about the values that must be assigned to the <case>, <number>, and <gender> attributes, so that the grammatical relations between subject, verb, and object should be preserved. This part of the translation pattern is optional, i.e. not all the attributes must be assigned values in every translation pattern. In some special cases no attributes can be assigned values at all. The <case> attribute is assigned values from 1 to 6 (depending on the grammatical case). The attribute <number> is assigned value 1 for singular or 2 for plural. And the attribute <gender> is assigned value 1 for masculine, 2 for feminine, or 3 for neutral.
The pattern-based machine translation technique was implemented by this author for the system that translates from French to Polish. The manner in which the system operates will be described thoroughly in the next paragraph.
The French-to-Polish Machine Translation System in Operation
In order to illustrate how the pattern-based French-to-Polish machine translation system operates, the following quite complicated French text will be considered for translation:
Chopin naquit en 1810 ŕ Zelazowa Wola prčs de Varsovie. Son pčre y enseignait le français dans une famille riche. Ensuite, sa famille vint s’installer ŕ Varsovie. Il étudia le piano et suivit les cours du Conservatoire. Aussitôt qu’il eut commencé ses études, ses maîtres s’aperçurent qu’il avait du génie. Lorsqu’il eut fini ses études au Conservatoire de Varsovie, il quitta la Pologne et il vint ŕ Paris oů il resta jusqu’ŕ la fin de sa vie. Il y donna d’abord des leçons particuličres de piano et y il eut des jours difficiles. Mais, dčs qu’il eut donné ses premiers concerts, il devint célčbre. Il fit la connaissance de la romancičre George Sand avec laquelle il resta en amitié de longues années. Ils voyagčrent ensamble ŕ Majorque. L’état de santé de Chopin s’aggrava, dčs qu’ils furent rentrés en France. La maladie de poitrine dont il souffrait empirait de jour en jour. Malgré ses souffrances, il continua ŕ composer les chefs-d’oevre qui l’ont rendu immortel. Il mourut ŕ Paris en 1849, en pensant ŕ sa patrie, la Pologne.
Les Polonais ont depuis longtemps participé ŕ la vie française. Et le souvenir de certains d’entre eux reste toujours vivant dans la mémoir des Français. En effet, les Français connaissent les noms des Polonais illustre comme Thadée Kościuszko, Frédéric Chopin et Marie Curie-Sklodowska. Ce sont lŕ des Polonais qui se sont engagés aux côtés de la France populaire. Mais pour les Français, c’est Adam Mickiewicz qui est l’incarnation vivante de son pays. Victor Hugo a dit que parle de Mickiewicz, c’est parle du beau, du juste et du vrai: c’est parle du droit, dont il a été le soldat, du devoir, dont il a été le héros, de la liberté, dont il a été l’apôtre, et de la délivrance, dont il a été le précurseur. Victor Hugo et Adam Mickiewicz symboliset bien l’amitié entre nos deux peuples.
The machine translation system looks up in the database the following translation patterns and substitutes them with their Polish equivalents, as follows:
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
1) the declination-type translation pattern
| ... Chopin ... | <case> |
| Chopin | 1 |
| Chopina | 2 |
| Chopinowi | 3 |
| Chopina | 4 |
| Chopinem | 5 |
| Chopinie | 6 |
| <number> = 1; <gender> = 1; |
2) the conjugation-type translation pattern
| ... naquit ... | <number> | <gender> |
| urodził się | 1 | 1 |
| urodziła się | 1 | 2 |
| urodziło się | 1 | 3 |
| urodzili się | 2 | 1 |
| urodziły się | 2 | 2 |
| urodziły się | 2 | 3 |
3) the non-flexion-type translation pattern
| ... en 1810 ... |
| w roku 1810 |
4) the non-flexion-type translation pattern
| ... ŕ Zelazowa Wola ... |
| w Żelazowej Woli |
5) the non-flexion-type translation pattern
| ... prčs de ... |
| blisko |
| <case> = 2; |
6) the declination-type translation pattern
| ... Varsovie ... | <case> |
| Warszawa | 1 |
| Warszawy | 2 |
| Warszawie | 3 |
| Warszawę | 4 |
| Warszawą | 5 |
| Warszawie | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
7) the declination-type translation pattern
| ... son pčre ... | <case> |
| jego ojciec | 1 |
| jego ojca | 2 |
| jego ojcu | 3 |
| jego ojca | 4 |
| jego ojcem | 5 |
| jego ojcu | 6 |
| <number> = 1; <gender> = 1; |
8) the conjugation-type translation pattern
| ... y enseignait ... | <number> | <gender> |
| uczył tam | 1 | 1 |
| uczyła tam | 1 | 2 |
| uczyło tam | 1 | 3 |
| uczyli tam | 2 | 1 |
| uczyły tam | 2 | 2 |
| uczyły tam | 2 | 3 |
| <case> = 2; |
9) the declination-type translation pattern
| ... le français ... | <case> |
| język francuski | 1 |
| języka francuskiego | 2 |
| językowi francuskiemu | 3 |
| język francuski | 4 |
| językiem francuskim | 5 |
| języku francuskims | 6 |
| <number> = 1; <gender> = 1; |
10) the non-flexion-type translation pattern
| ... dans ... |
| w |
| <case> = 6; |
11) the declination-type translation pattern
| ... une famille riche ... | <case> |
| bogata rodzina | 1 |
| bogatej rodziny | 2 |
| bogatej rodzinie | 3 |
| bogatą rodzinę | 4 |
| bogatą rodziną | 5 |
| bogatej rodzinie | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
12) the non-flexion-type translation pattern
| ... ensuite ... |
| następnie |
13) the declination-type translation pattern
| ... sa famille ... | <case> |
| jego rodzina | 1 |
| jego rodziny | 2 |
| jego rodzinie | 3 |
| jego rodzinę | 4 |
| jego rodziną | 5 |
| jego rodzinie | 6 |
| <number> = 1; <gender> = 2; |
14) the conjugation-type translation pattern
| ... vint s’installer ŕ ... | <number> | <gender> |
| przeniósł się do | 1 | 1 |
| przeniosła się do | 1 | 2 |
| przeniosło się do | 1 | 3 |
| przenieśli się do | 2 | 1 |
| przeniosły się do | 2 | 2 |
| przeniosły się do | 2 | 3 |
| <case> = 2; |
15) the declination-type translation pattern
| ... Varsovie ... | <case> |
| Warszawa | 1 |
| Warszawy | 2 |
| Warszawie | 3 |
| Warszawę | 4 |
| Warszawą | 5 |
| Warszawie | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
16) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
17) the conjugation-type translation pattern
| ... étudia le piano ... | <number> | <gender> |
| uczył się gry na fortepianie | 1 | 1 |
| uczył asie gry na fortepianie | 1 | 2 |
| uczyło się gry na fortepianie | 1 | 3 |
| uczyli się gry na fortepianie | 2 | 1 |
| uczyły się gry na fortepianie | 2 | 2 |
| uczyły się gry na fortepianie | 2 | 3 |
18) the non-flexion-type translation pattern
19) the conjugation-type translation pattern
| ... suivit les cours du ... | <number> | <gender> |
| uczęszczał na zajęcia w | 1 | 1 |
| uczęszczała na zajęcia w | 1 | 2 |
| uczęszczało na zajęcia w | 1 | 3 |
| uczęszczali na zajęcia w | 2 | 1 |
| | uczęszczały na zajęcia w | 2 | 2 |
| | uczęszczały na zajęcia w | 2 | 3 |
| | <case> = 6; |
20) the declination-type translation pattern
| ... Conservatoire ... | <case> |
| Konserwatorium | 1 |
| Konserwatorium | 2 |
| Konserwatorium | 3 |
| Konserwatorium | 4 |
| Konserwatorium | 5 |
| Konserwatorium | 6 |
| <number> = 1; <gender> = 3; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
21) the non-flexion-type translation pattern
| ... aussitôt ... |
| skoro tylko |
22) the non-flexion-type translation pattern
| ... qu’il eut commencé ses études ... |
| rozpoczął studia |
23) the declination-type translation pattern
| ... ses maîtres... | <case> |
| jego nauczyciele | 1 |
| jego nauczycieli | 2 |
| jego nauczycielom | 3 |
| jego nauczyciele | 4 |
| jego nauczycielami | 5 |
| jego nauczycielach | 6 |
| <number> = 2; <gender> = 1; |
24) the conjugation-type translation pattern
| ... s’aperçurent... | <number> | <gender> |
| zauważył | 1 | 1 |
| zauważyła | 1 | 2 |
| zauważyło | 1 | 3 |
| zauważyli | 2 | 1
| | zauważyły | 2 | 2 |
| zauważyły | 2 | 3 |
25) the non-flexion-type translation pattern
| ... qu’il avait du génie ... |
| że był genialnie uzdolniony |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
26) the non-flexion-type translation pattern
| ... lorsqu’il eut fini ... |
| kiedy ukończył |
| <case> = 4; |
27) the declination-type translation pattern
| ... ses études ... | <case> |
| swoje studia | 1 |
| swoich studiów | 2 |
| swoim studiom | 3 |
| swoje studia | 4 |
| swoimi studiami | 5 |
| swoich studiach | 6 |
| <number> = 2; <gender> = 3; |
28) the non-flexion-type translation pattern
| ... au Conservatoire de Varsovie ... |
| w Konserwatorium Warszawskim |
29) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
30) the conjugation-type translation pattern
| ... quitta ... | <number> | <gender> |
| opuścił | 1 | 1 |
| opuściła | 1 | 2 |
| opuściło | 1 | 3 |
| opuścili | 2 | 1 |
| opuściły | 2 | 2 |
| opuściły | 2 | 3 |
| <case> = 4; |
31) the declination-type translation pattern
| ... la Pologne ... | <case> |
| Polska | 1 |
| Polski | 2 |
| Polsce | 3 |
| Polskę | 4 |
| Polską | 5 |
| Polsce | 6 |
| <number> = 1; <gender> = 2; |
32) the non-flexion-type translation pattern
33) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
34) the conjugation-type translation pattern
| ... vint ŕ ... | <number> | <gender> |
| wyjechał do | 1 | 1 |
| wyjechała do | 1 | 2 |
| wyjechało do | 1 | 3 |
| wyjechali do | 2 | 1 |
| wyjechały do | 2 | 2 |
| wyjechały do | 2 | 3 |
| <case> = 2; |
35) the declination-type translation pattern
| ... Paris ... | <case> |
| Paryż | 1 |
| Paryża | 2 |
| Paryżowi | 3 |
| Paryż | 4 |
| Paryżem | 5 |
| Paryżu | 6 |
| <number> = 1; <gender> = 1; |
36) the non-flexion-type translation pattern
37) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
38) the conjugation-type translation pattern
| ... resta ... | <number> | <gender> |
| pozostał | 1 | 1 |
| pozostała | 1 | 2 |
| pozostało | 1 | 3 |
| pozostali | 2 | 1 |
| pozostały | 2 | 2 |
| pozostały | 2 | 3 |
39) the non-flexion-type translation pattern
| ... jusqu’ŕ ... |
| do |
| <case> = 2; |
40) the declination-type translation pattern
| ... la fin ... | <case> |
| koniec | 1 |
| końca | 2 |
| końcowi | 3 |
| koniec | 4 |
| końcem | 5 |
| końcu | 6 |
| <number> = 1; <gender> = 1; |
41) the non-flexion-type translation pattern
| ... de sa vie ... |
| swojego życia |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
42) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
43) the conjugation-type translation pattern
| ... y donna ... | <number> | <gender> |
| dawał tam | 1 | 1 |
| dawała tam | 1 | 2 |
| dawało tam | 1 | 3 |
| dawali tam | 2 | 1 |
| dawały tam | 2 | 2 |
| dawały tam | 2 | 3 |
| <case> = 4; |
44) the non-flexion-type translation pattern
45) the declination-type translation pattern
| ... des leçons particuličres de piano ... | <case> |
| prywatne lekcje gry na fortepianie | 1 |
| prywatnych lekcji gry na fortepianie | 2 |
| prywatnym lekcjom gry na fortepianie | 3 |
| prywatne lekcje gry na fortepianie | 4 |
| prywatnymi lekcjami gry na fortepianie | 5 |
| prywatnych lekcjach gry na fortepianie | 6 |
| <number> = 2; <gender> = 2; |
46) the non-flexion-type translation pattern
47) the non-flexion-type translation pattern
| ... y il eut des jours difficiles ... |
| przeżywał tam ciężkie dni | |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
48) the non-flexion-type translation pattern
49) the non-flexion-type translation pattern
| ... dčs qu’il eut donné ... |
| od chwili gdy dał |
| <case> = 4; |
50) the declination-type translation pattern
| ... ses premiers concerts ... | <case> |
| swoje pierwsze koncerty | 1 |
| swoich pierwszych koncertów | 2 |
| swoim pierwszym koncertom | 3 |
| swoje pierwsze koncerty | 4 |
| swoimi pierwszymi koncertami | 5 |
| swoich pierwszych koncertach | 6 |
| <number> = 2; <gender> = 3; |
51) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
52) the conjugation-type translation pattern
| ... devint célčbre ... | <number> | <gender> |
| stał się sławny | 1 | 1 |
| stała się sławna | 1 | 2 |
| stało się sławne | 1 | 3 |
| stali się sławni | 2 | 1 |
| stały się sławne | 2 | 2 |
| stały się sławne | 2 | 3 |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
53) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
54) the conjugation-type translation pattern
| ... fit la connaissance de ... | <number> | <gender> |
| zawarł znajomość z | 1 | 1 |
| zawarła znajomość z | 1 | 2 |
| zawarło znajomość z | 1 | 3 |
| zawarli znajomość z | 2 | 1 |
| zawarły znajomość z | 2 | 2 |
| zawarły znajomość z | 2 | 3 |
| <case> = 5; |
55) the declination-type translation pattern
| ... la romancičre George Sand ... | <case> |
| powieściopisarka George Sand | 1 |
| powieściopisarki George Sand | 2 |
| powieściopisarce George Sand | 3 |
| powieściopisarkę George Sand | 4 |
| powieściopisarką George Sand | 5 |
| powieściopisarce George Sand | 6 |
| <number> = 1; <gender> = 2; |
56) the non-flexion-type translation pattern
| ... avec laquelle ... |
| z którą |
57) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
58) the conjugation-type translation pattern
| ... resta en amitié ... | <number> | <gender> |
| pozostał w przyjaźni | 1 | 1 |
| pozostała w przyjaźni | 1 | 2 |
| pozostało w przyjaźni | 1 | 3 |
| pozostali w przyjaźni | 2 | 1 |
| pozostały w przyjaźni | 2 | 2 |
| pozostały w przyjaźni | 2 | 3 |
59) the non-flexion-type translation pattern
| ... de longues années ... |
| przez długie lata |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
60) the non-flexion-type translation pattern
| ... ils ... |
| oni |
| <number> = 2; <gender> = 1; |
61) the conjugation-type translation pattern
| ... voyagčrent ... |
<number> | <gender> |
| podróżował | 1 | 1 |
| podróżowała | 1 | 2 |
| podróżowało | 1 | 3 |
| podróżowali | 2 | 1 |
| podróżowały | 2 | 2 |
| podróżowały | 2 | 3 |
62) the non-flexion-type translation pattern
63) the non-flexion-type translation pattern
| ... ŕ Majorque ... |
| na Majorkę |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
64) the declination-type translation pattern
| ... l’état de santé ... | <case> |
| stan zdrowia | 1 |
| stanu zdrowia | 2 |
| stanowi zdrowia | 3 |
| stan zdrowia | 4 |
| stanem zdrowia | 5 |
| stanie zdrowia | 6 |
| <number> = 1; <gender> = 1; |
65) the non-flexion-type translation pattern
| ... de Chopin ... |
| Chopina |
66) the conjugation-type translation pattern
| ... s’aggrava ... |
<number> | <gender> |
| pogorszył się | 1 | 1 |
| pogorszyła się | 1 | 2 |
| pogorszyło się | 1 | 3 |
| pogorszyli się | 2 | 1 |
| pogorszyły się | 2 | 2 |
| pogorszyły się | 2 | 3 |
67) the non-flexion-type translation pattern
| ... dčs qu’ils furent rentrés en ... |
| po tym jak wrócił do |
| <case> = 2; |
68) the declination-type translation pattern
| ... France ... | <case> |
| Francja | 1 |
| Francji | 2 |
| Francji | 3 |
| Francję | 4 |
| Francją | 5 |
| Francji | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
69) the declination-type translation pattern
| ... la maladie de poitrine ... | <case> |
| choroba płuc | 1 |
| choroby płuc | 2 |
| chorobie płuc | 3 |
| chorobę płuc | 4 |
| chorobą płuc | 5 |
| chorobie płuc | 6 |
| <number> = 1; <gender> = 2;
70) the conjugation-type translation pattern
| ... dont il souffrait ... |
<number> | <gender> |
| na który cierpiał | 1 | 1 |
| na którą cierpiał | 1 | 2 |
| na które cierpiał | 2 | 3 |
| na których cierpiał | 2 | 1 |
| na które cierpiał | 2 | 2 |
| na które cierpiał | 2 | 3 |
71) the conjugation-type translation pattern
| ... empirait ... | <number> | <gender> |
| pogłębiał się | 1 | 1 |
| pogłębiała się | 1 | 2 |
| pogłębiało się | 1 | 3 |
| pogłębiali się | 2 | 1 |
| pogłębiały się | 2 | 2 |
| pogłębiały się | 2 | 3 |
72) the non-flexion-type translation pattern
| ... de jour en jour ... |
| z dnia na dzień |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
73) the non-flexion-type translation pattern
| ... malgré ... |
| pomimo |
| <case> = 2; |
74) the declination-type translation pattern
| ... ses souffrances ... | <case> |
| jego cierpienia | 1 |
| jego cierpień | 2 |
| jego cierpieniom | 3 |
| jego cierpienia | 4 |
| jego cierpieniami | 5 |
| jego cierpieniach | 6 |
| <number> = 2; <gender> = 3; |
75) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
76) the conjugation-type translation pattern
| ... continua ŕ composer ... |
<number> | <gender> |
| nadal komponował | 1 | 1 |
| nadal komponowała | 1 | 2 |
| nadal komponowało | 1 | 3 |
| nadal komponowali | 2 | 1 |
| nadal komponowały | 2 | 2 |
| nadal komponowały | 2 | 3 |
| <case> = 4; |
77) the declination-type translation pattern
| ... les chefs-d’oevre ... | <case> |
| arcydzieła | 1 |
| arcydzieł | 2 |
| arcydziełom | 3 |
| arcydzieła | 4 |
| arcydziełami | 5 |
| arcydziełach | 6 |
| <number> = 2; <gender> = 3; |
78) the conjugation-type translation pattern
| ... qui l’ont rendu immortel ... | <number> | <gender> |
| który uczynił go nieśmiertelnym | 1 | 1 |
| która uczyniła go nieśmiertelnym | 1 | 2 |
| które uczyniło go nieśmiertelnym | 1 | 3 |
| którzy uczynili go nieśmiertelnym | 2 | 1 |
| które uczyniły go nieśmiertelnym | 2 | 2 |
| które uczyniły go nieśmiertelnym | 2 | 3 |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
79) the non-flexion-type translation pattern
| ... il ... |
| on |
| <number> = 1; <gender> = 1; |
80) the conjugation-type translation pattern
| ... mourut ŕ ... | <number> | <gender> |
| umarł w | 1 | 1 |
| umarła w | 1 | 2 |
| umarło w | 1 | 3 |
| umarli w | 2 | 1 |
| umarły w | 2 | 2 |
| umarły w | 2 | 3 |
| <case> = 6; |
81) the declination-type translation pattern
| ... Paris ... | <case> |
| Paryż | 1 |
| Paryża | 2 |
| Paryżowi | 3 |
| Paryż | 4 |
| Paryżem | 5 |
| Paryżu | 6 |
| <number> = 1; <gender> = 1; |
82) the non-flexion-type translation pattern
| ... en 1849 ... |
| w roku 1849 |
83) the non-flexion-type translation pattern
| ... en pensant ŕ ... |
| myśląc o |
| <case> = 6; |
84) the declination-type translation pattern
| ... sa patrie ... | <case> |
| swoja ojczyzna | 1 |
| swojej ojczyzny | 2 |
| swojej ojczyźnie | 3 |
| swoją ojczyznę | 4 |
| swoja ojczyzną | 5 |
| swojej ojczyźnie | 6 |
| <number> = 1; <gender> = 2; |
85) the declination-type translation pattern
| ... la Pologne ... | <case> |
| Polska | 1 |
| polski | 2 |
| Polsce | 3 |
| Polskę | 4 |
| Polską | 5 |
| Polsce | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
86) the declination-type translation pattern
| ... les Polonais ... | <case> |
| Polacy | 1 |
| Polaków | 2 |
| Polakom | 3 |
| Polaków | 4 |
| Polakami | 5 |
| Polakach | 6 |
| <number> = 2; <gender> = 1; |
87) the conjugation-type translation pattern
| ... ont depuis longtemps participé ŕ ... | <number> | <gender> |
| od dawna uczestniczył w | 1 | 1 |
| od dawna uczestniczyła w | 1 | 2 |
| od dawna uczestniczyło w | 1 | 3 |
| od dawna uczestniczyli w | 2 | 1 |
| od dawna uczestniczyły w | 2 | 2 |
| od dawna uczestniczyły w | 2 | 3 |
| <case> = 6; |
88) the declination-type translation pattern
| ... la vie française ... | <case> |
| życie Francji | 1 |
| życia Francji | 2 |
| życiu Francji | 3 |
| życie Francji | 4 |
| życiem Francji | 5 |
| życiu Francji | 6 |
| <number> = 1; <gender> = 3; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
89) the non-flexion-type translation pattern
90) the declination-type translation pattern
| ... le souvenir de certains d’entre eux ... | <case> |
| pamiątki po niektórych z nich | 1 |
| pamiątek po niektórych z nich | 2 |
| pamiątkom po niektórych z nich | 3 |
| pamiątki po niektórych z nich | 4 |
| pamiątkami po niektórych z nich | 5 |
| pamiątkach po niektórych z nich | 6 |
| <number> = 2; <gender> = 2; |
91) the conjugation-type translation pattern
| ... reste toujours vivant dans ... | <number> | <gender> |
| pozostaje wiecznie żywy w | 1 | 1 |
| pozostaje wiecznie żywa w | 1 | 2 |
| pozostaje wiecznie żywe w | 1 | 3 |
| pozostają wiecznie żywi w | 2 | 1 |
| pozostają wiecznie żywe w | 2 | 2 |
| pozostają wiecznie żywe w | 2 | 3 |
| <case> = 6; |
92) the declination-type translation pattern
| ... la mémoir des Français ... | <case> |
| pamięć Francuzów | 1 |
| pamięci Francuzów | 2 |
| pamięci Francuzów | 3 |
| pamięć Francuzów | 4 |
| pamięcią Francuzów | 5 |
| pamięci Francuzów | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
93) the non-flexion-type translation pattern
| ... en effet ... |
| istotnie |
94) the declination-type translation pattern
| ... les Français ... | <case> |
| Francuzi | 1 |
| Francuzów | 2 |
| Francuzom | 3 |
| Francuzów | 4 |
| Francuzami | 5 |
| Francuzach | 6 |
| <number> = 2; <gender> = 1; |
95) the conjugation-type translation pattern
| ... connaissent ... | <number> | <gender> |
| zna | 1 | 1 |
| zna | 1 | 2 |
| zna | 1 | 3 |
| znają | 2 | 1 |
| znają | 2 | 2 |
| znają | 2 | 3 |
| <case> = 4; |
96) the declination-type translation pattern
| ... les noms des Polonais illustre comme ... | <case> |
| nazwiska tak znanych Polaków jak | 1 |
| nazwisk tak znanych Polaków jak | 2 |
| nazwiskom tak znanych Polaków jak | 3 |
| nazwiska tak znanych Polaków jak | 4 |
| nazwiskami tak znanych Polaków jak | 5 |
| nazwiskach tak znanych Polaków jak | 6 |
| <number> = 2; <gender> = 3; <case> = 1; |
97) the declination-type translation pattern
| ... Thadée Kościuszko ... | <case> |
| Tadeusz Kościuszko | 1 |
| Tadeusza Kościuszki | 2 |
| Tadeuszowi Kościuszce | 3 |
| Tadeusza Kościuszko | 4 |
| Tadeuszem Kościuszką | 5 |
| Tadeuszu Kościuszce | 6 |
| <number> = 1; <gender> = 1; |
98) the declination-type translation pattern
| ... Frédéric Chopin ... | <case> |
| Fryderyk Chopin | 1 |
| Fryderyka Chopina | 2 |
| Fryderykowi Chopinowi | 3 |
| Fryderyka Chopina | 4 |
| Fryderykiem Chopinem | 5 |
| Fryderyku Chopinie | 6 |
| <number> = 1; <gender> = 1; |
99) the non-flexion-type translation pattern
100) the declination-type translation pattern
| ... Marie Curie-Sklodowska ... | <case> |
| Maria Curie-Skłodowska | 1 |
| Marii Curie-Skłodowskiej | 2 |
| Marii Curie-Skłodowskiej | 3 |
| Marię Curie-Skłodowską | 4 |
| Marią Curie-Skłodowska | 5 |
| Marii Curie-Skłodowskiej | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
101) the non-flexion-type translation pattern
| ... ce sont lŕ ... |
| to są |
| <case> = 1; |
102) the declination-type translation pattern
| ... des Polonais ... | <case> |
| Polacy | 1 |
| Polaków | 2 |
| Polakom | 3 |
| Polaków | 4 |
| Polakami | 5 |
| Polakach | 6 |
| <number> = 2; <gender> = 1; |
103) the conjugation-type translation pattern
| ... qui se sont engagés aux côtés de ... |
<number> | <gender> |
| który się zaangażował po stronie | 1 | 1 |
| która się zaangażowała po stronie | 1 | 2 |
| które się zaangażowało po stronie | 1 | 3 |
| którzy się zaangażowali po stronie | 2 | 1 |
| które się zaangażowały po stronie | 2 | 2 |
| które się zaangażowały po stronie | 2 | 3 |
| <case> = 2; |
104) the declination-type translation pattern
| ... la France populaire ... | <case> |
| Francja ludowa | 1 |
| Francji ludowej | 2 |
| Francji ludowej | 3 |
| Francję ludową | 4 |
| Francją ludową | 5 |
| Francji ludowej | 6 |
| <number> = 1; <gender> = 2; |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
105) the non-flexion-type translation pattern
106) the non-flexion-type translation pattern
| ... pour les Français ... |
| dla Francuzów |
107) the non-flexion-type translation pattern
| ... c’est Adam Mickiewicz qui ... |
| to właśnie Adam Mickiewicz |
| <number> = 1; <gender> = 1; |
108) the conjugation-type translation pattern
| ... est ... | <number> | <gender> |
| jest | 1 | 1 |
| jest | 1 | 2 |
| jest | 1 | 3 |
| są | 2 | 1 |
| są | 2 | 2 |
| są | 2 | 3 |
| <case> = 5; |
109) the declination-type translation pattern
| ... l’incarnation vivante ... | <case> |
| żywe wcielenie | 1 |
| żywego wcielenia | 2 |
| żywemu wcieleniu | 3 |
| żywe wcielenie | 4 |
| żywym wcieleniem | 5 |
| żywym wcieleniu | 6 |
| <number> = 1; <gender> = 2; |
110) the non-flexion-type translation pattern
| ... de son pays ... |
| swojego kraju |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
111) the declination-type translation pattern
| ... Victor Hugo ... | <case> |
| Wiktor Hugo | 1 |
| Wickora Hugo | 2 |
| Wiktorowi Hugo | 3 |
| Wiktora Hugo | 4 |
| Wiktorem Hugo | 5 |
| Wiktorze Hugo | 6 |
| <number> = 1; <gender> = 1; |
112) the conjugation-type translation pattern
| ... a dit que parle de ... | <number> | <gender> |
| powiedział że mówić o | 1 | 1 |
| powiedziała że mówić o | 1 | 2 |
| powiedziało że mówić o | 1 | 3 |
| powiedzieli że mówić o | 2 | 1 |
| powiedziały że mówić o | 2 | 2 |
| powiedziały że mówić o | 2 | 3 |
| <case> = 6; |
113) the declination-type translation pattern
| ... Mickiewicz ... | <case> |
| Mickiewicz | 1 |
| Mickiewicza | 2 |
| Mickiewiczowi | 3 |
| Mickiewicza | 4 |
| Mickiewiczem | 5 |
| Mickiewiczu | 6 |
| <number> = 1; <gender> = 1; |
114) the non-flexion-type translation pattern
| ... c’est parle ... |
| to mówić o |
| <case> = 6; |
115) the declination-type translation pattern
| ... du beau ... | <case> |
| piękno | 1 |
| piękna | 2 |
| pięknu | 3 |
| piękno | 4 |
| pięknem | 5 |
| pięknie | 6 |
| <number> = 1; <gender> = 3; |
116) the declination-type translation pattern
| ... du juste ... | <case> |
| sprawiedliwość | 1 |
| sprawiedliwości | 2 |
| sprawiedliwości | 3 |
| sprawiedliwość | 4 |
| sprawiedliwością | 5 |
| sprawiedliwości | 6 |
| <number> = 1; <gender> = 2; |
117) the non-flexion-type translation pattern
118) the declination-type translation pattern
| ... du vrai ... | <case> |
| prawda | 1 |
| prawdy | 2 |
| prawdzie | 3 |
| prawdę | 4 |
| prawdą | 5 |
| prawdzie | 6 |
| <number> = 1; <gender> = 2; |
119) the non-flexion-type translation pattern
| ... c’est parle ... |
| to mówić o |
| <case> = 6; |
120) the declination-type translation pattern
| ... du droit ... | <case> |
| prawo | 1 |
| prawa | 2 |
| prawu | 3 |
| prawo | 4 |
| prawem | 5 |
| prawie | 6 |
| <number> = 1; <gender> = 3; |
121) the conjugation-type translation pattern
| ... dont il a été le soldat ... | <number> | <gender> |
| którego był żołnierzem | 1 | 1 |
| której był żołnierzem | 1 | 2 |
| którego był żołnierzem | 1 | 3 |
| których był żołnierzem | 2 | 1 |
| których był żołnierzem | 2 | 2 |
| których był żołnierzem | 2 | 3 |
122) the declination-type translation pattern
| ... du devoir ... | <case> |
| obowiązek | 1 |
| obowiązku | 2 |
| obowiązkowi | 3 |
| obowiązek | 4 |
| obowiązkiem | 5 |
| obowiązku | 6 |
| <number> = 1; <gender> = 1; |
123) the conjugation-type translation pattern
| ... dont il a été le héros ... | <number> | <gender> |
| którego był bohaterem | 1 | 1 |
| której był bohaterem | 1 | 2 |
| którego był bohaterem | 1 | 3 |
| których był bohaterem | 2 | 1 |
| których był bohaterem | 2 | 2 |
| których był bohaterem | 2 | 3 |
124) the declination-type translation pattern
| ... de la liberté ... | <case> |
| wolność | 1 |
| wolności | 2 |
| wolności | 3 |
| wolność | 4 |
| wolnością | 5 |
| wolności | 6 |
| <number> = 1; <gender> = 2; |
125) the conjugation-type translation pattern
| ... dont il a été l’apôtre ... | <number> | <gender> |
| którego był apostołem | 1 | 1 |
| której był apostołem | 1 | 2 |
| którego był apostołem | 1 | 3 |
| których był apostołem | 2 | 1 |
| których był apostołem | 2 | 2 |
| których był apostołem | 2 | 3 |
126) the non-flexion-type translation pattern
127) the declination-type translation pattern
| ... de la délivrance ... | <case> |
| wyzwolenie | 1 |
| wyzwolenia | 2 |
| wyzwoleniu | 3 |
| wyzwolenie | 4 |
| wyzwoleniem | 5 |
| wyzwoleniu | 6 |
| <number> = 1; <gender> = 3; |
128) the conjugation-type translation pattern
| ... dont il a été le précurseur ... | <number> | <gender> |
| którego był prekursorem | 1 | 1 |
| której był prekursorem | 1 | 2 |
| którego był prekursorem | 1 | 3 |
| których był prekursorem | 2 | 1 |
| których był prekursorem | 2 | 2 | których był prekursorem | 2 | 3 |
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
129) the declination-type translation pattern
| ... Victor Hugo et Adam Mickiewicz ... | <case> |
| Wiktor Hugo i Adam Mickiewicz | 1 |
| Wiktora Hugo i Adama Mickiewicza | 2 |
| Wiktorowi Hugo i Adamowi Mickiewiczowi | 3 |
| Wiktora Hugo i Adama Mickiewicza | 4 |
| Wiktorem Hugo i Adamem Mickiewiczem | 5 |
| Wiktorze Hugo i Adamie Mickiewiczu | 6 |
| <number> = 2; <gender> = 1; |
130) the conjugation-type translation pattern
| ... symboliset bien ... | <number> | <gender> |
| dobrze symbolizuje | 1 | 1 |
| dobrze symbolizuje | 1 | 2 |
| dobrze symbolizuje | 1 | 3 |
| dobrze symbolizują | 2 | 1 |
| dobrze symbolizują | 2 | 2 |
| dobrze symbolizują | 2 | 3 |
| <case> = 4; |
131) the declination-type translation pattern
| ... l’amitié ... | <case> |
| przyjaźń | 1 |
| przyjaźni | 2 |
| przyjaźni | 3 |
| przyjaźń | 4 |
| przyjaźnią | 5 |
| przyjaźni | 6 |
| <number> = 1; <gender> = 2; |
132) the non-flexion-type translation pattern
| ... entre nos deux peuples ... |
| pomiędzy naszymi narodami |
The result from the French-to-Polish machine translation system is the following Polish translation of the French input text:
Chopin urodził się w roku 1810 w Żelazowej Woli blisko Warszawy. Jego ojciec uczył tam języka francuskiego w bogatej rodzinie. Następnie jego rodzina przeniosła się do Warszawy. On uczył się gry na fortepianie i uczęszczał na zajęcia w Konserwatorium. Skoro tylko rozpoczął studia jego nauczyciele zauważyli że był genialnie uzdolniony. Kiedy ukończył swoje studia w Konserwatorium Warszawskim on opuścił Polskę i on wyjechał do Paryża gdzie on pozostał do końca swojego życia. On dawał tam najpierw prywatne lekcje gry na fortepianie i przeżywał tam ciężkie dni. Ale od chwili gdy dał swoje pierwsze koncerty on stał się sławny. On zawarł znajomość z powieściopisarką George Sand z którą on pozostał w przyjaźni przez długie lata. Oni podróżowali razem na Majorkę. Stan zdrowia Chopina pogorszył się po tym jak wrócił do Francji. Choroba płuc na którą cierpiał pogłębiała się z dnia na dzień. Pomimo jego cierpień on nadal komponował arcydzieła które uczyniły go nieśmiertelnym. On umarł w Paryżu w roku 1849 myśląc o swojej ojczyźnie Polsce.
Polacy od dawna uczestniczyli w życiu Francji. I pamiątki po niektórych z nich pozostają wiecznie żywe w pamięci Francuzów. Istotnie Francuzi znają nazwiska tak znanych Polaków jak Tadeusz Kościuszko Fryderyk Chopin Maria Curie-Skłodowska. To są Polacy którzy się zaangażowali po stronie Francji ludowej. Ale dla Francuzów to właśnie Adam Mickiewicz jest żywym wcieleniem swojego kraju. Victor Hugo powiedział że mówić o Mickiewiczu to mówić o pięknie sprawiedliwości i prawdzie to mówić o prawie którego był żołnierzem obowiązku którego był bohaterem wolności której był apostołem i wyzwoleniu którego był prekursorem. Victor Hugo i Adam Mickiewicz dobrze symbolizują przyjaźń pomiędzy naszymi narodami.
The obtained Polish translation is both accurate and of high quality. It also sounds very natural and resembles the effect of the work of a human translator.
Conclusions:
In this paper the proposal by this author of a pattern-based machine translation technique is presented. The implementation of this technique for the system which translates from French to Polish is also described.
The obtained Polish translation is of high quality even if the length of translation patterns is not great. The translation pattern length statistics are presented in Fig. 1.
Fig. 1. The statistics of the translation pattern lengths.
As one can conclude from Fig. 1 most of the translation patterns have a length of one or two words. Exactly 38.6% translation examples have a length of one word, 31.1% translation patterns have a length of two words, 13.6% three words, 6.8% four words, 9.1% five words, and only 0.8% more than five words. This fact suggests convincingly that the pattern-based machine translation is aimed in the right direction. The final success of building a fully-automatic high-quality machine translation system, which would be able to translate unrestricted text from French to Polish depends on the amount of data gathered in the database, on which this author is currently working.
References:
[1] D. Arnold, L. Balkan, S. Meijer, R. L. Humphreys, L. Sadler: Machine Translation: An Introductory Guide, NCC Blackwell, London, 1994
RETURN
[2] P. Whitelock, K. Kilby: Linguistic and Computational Techniques in Machine Translation System Design, UCL Press, London, GB, 1995
RETURN
[3] C. Rico: From Novelty to Ubiquity: Computers and Translation at the Close of Industrial Age, http:\\www.accurapid.com/journal/15mt2.htm
RETURN
[4] A. Melby: Machine Translation and Philosophy of Language; Machine Translation Review, No. 9, April 1999, pp. 6-17
RETURN
[5] R. D. Brown: Adding linguistic knowledge to a lexical example-based translation system, Language Technologies Institute, Carnegie Mellon University, Pittsburgh, PA, USA, 2000
RETURN
[6] R. D. Brown: Example-based machine translation in the Pangloss system, Language Technologies Institute, Carnegie Mellon University, Pittsburgh, PA, USA, 2000
RETURN
[7] Y. Zhang, R. D. Brown, R. E. Frederking: Adapting an example-based translation system to Chinese, Carnegie Mellon University, Pittsburgh, PA, USA, 2000
RETURN
|