NATURAL LANGUAGE
TRANSLATION
SITE NAVIGATOR
Click for...
  MTR main menu

  MTR-13 overview   •   previous item   next item

NLT
home page
search
engine

click for British Computer Society home-page 

 

The British Computer Society
Natural Language Translation
Specialist Group

Site URL: http://www.bcs.org.uk/siggroup/sg37.htm
  PAGE 7--41
Machine Translation Review
No. 13, December 2002 ISSN: 1358-8346
This page URL: http://www.bcs.org.uk/siggroup/nalatran/mtreview/mtr-13/5.htm

 
The Pattern-Based French-to-Polish Machine Translation System

by Dr Miroslaw Gajer
Technical University in Cracow
Department of Control Science
al. Mickiewicza 30
30-059 Kraków
Poland
mgajer@ia.agh.edu.pl

Footnotes are numbered [1], [2], etc., and are hyper-linked to the text.
 

Abstract
 
The field of machine translation now has over 50 years of history, and despite great scientific effort is still far from a final and fully satisfactory solution. Several years ago a case-based machine translation technique was proposed, and proved to be a serious alternative to existing machine translation methods. However, case-based machine translation has never been implemented for the Polish language. This author has investigated the possibilities of implementing the case-based machine translation technique for the Polish languages, leading him to the conclusion that this technique must be modified thoroughly if it is to add to the effective construction of a machine translation system for unrestricted text. The modification of case-based machine translation technique for the Polish language led finally to a translation technique, which the author has named pattern-based machine translation. This paper demonstrates the implementation of pattern-based machine translation technique for French to Polish translation.
 
 
Introduction
 
Machine translation is a science about writing computer programs that are able to translate in a fully automatic way between natural languages, e.g. between Spanish and Korean [1]. It was suggested by an American, Warren Weaver, who on 15th July 1949 sent his famous memorandum to the Rockefeller Foundation that started scientific research in the field [2]. The first public demonstration of an operating machine translation system took place in New York on 7th December 1954. During this demonstration the machine translation system translated 49 simple sentences from Russian to English.
 
But after over 50 years of intensive scientific research machine translation is still far from a satisfactory solution [4]. Several years ago case-based or example-based machine translation techniques emerged as a very serious alternative to other methods used so far for automating the translation process [3], [5], [6], [7].
 
The main idea of CBMT (Case-Base Machine Translation) is as follows. Let there be given any bilingual text, for example the following English and Polish text:
 
There are certain themes of which the interest is all-absorbing, but which are too entirely horrible for the purposes of legitimate fiction. These the mere romanticist must eschew, if he do not wish to offend, or to disgust. They are with propriety handled only when the severity and majesty of truth sanctify and sustain them.
and
Istnieją pewne tematy przejmujące do głębi, wszelako nazbyt okropne, izby mogły stać się przedmiotem rzetelnej literatury powieściowej. Rzetelni pisarze muszą ich unikać, jeśli nie chcą wywołać zgorszenia lub niesmaku. Godzi się je podejmować tylko w takich razach, gdy uświęca je i usprawiedliwia surowe dostojeństwo prawdy.
 
The first text is the beginning of the story by Edgar Allan Poe entitled 'The Premature Burial' and the second one is its Polish translation made by a prominent translator, Stanisław Wyrzykowski.
 
In this bilingual text the English phrase 'they are with proprietary handled' was translated into Polish by a human professional translator as 'godzi się je podejmować'. So the idea of the CBMT is such that, while translating any other English text into Polish, if the English phrase 'they are with proprietary handled' appears again anywhere else, it will be substituted the same way as it had been done before by a human translator, i.e. it will be substituted by 'godzi się je podejmować' . The translation obtained in such a manner should still be correct.
 
Of course, there is no certainty that the translation obtained by the use of CBMT will always and under any circumstances be correct. The main reason for this is natural language ambiguity, which is a permanent feature of any human language. Even translations of whole sentences can be totally different, depending on the context in which these sentences are used. A good example for this is the Dutch sentence:

Als ik in Amsterdam werkte kopte ik en auto.

This sentence can be translated into English as:
If I worked in Amsterdam I would buy a car.

or as:
When I worked in Amsterdam I bought a car.

 
Everything depends on the context in which the sentence is used. So we can see that the CBMT is not always able to return a correct translation, but the probability that the translation will be correct is still very high, and generally the quality of a text translated with the use of the CBMT is much higher than one obtained with the use of other, e.g. transfer or interlingua, methods.


The Implementation of CBMT for the Polish Language
 
The Polish language, which belongs to the group of Slavonic languages, posseses a quite complex grammar. The main feature of Polish is its inflexional nature, which makes learning it extremely difficult for a foreigner. In Polish grammar there can be found such phenomena as declination of nouns (there are 6 cases) and conjugation of verbs. Also there are singular and plural forms of words and 3 genders (masculine, feminine and neutral).
 
These phenomena make the direct usage of CBMT for the Polish language difficult and non-effective. In order to implement CBMT for Polish it must be thoroughly modified. This author has proposed such a modification, which takes into account the peculiarities of the Polish grammar and allows for its effective usage for the purpose of translating into Polish from most West European languages.
 
In the system developed by this author there exist 3 different types of translation examples, which are further called translation patterns. The way in which these patterns are translated into Polish depends on the actual value of 3 attributes: <case>, <number>, and <gender>.
 
The first type of translation pattern is the so called declination-type translation pattern, which has the following form:
'source language phrase' <case>
'translation into target language for <case>=1'1
'translation into target language for <case>=2'2
'translation into target language for <case>=3'3
'translation into target language for <case>=4'4
'translation into target language for <case>=5'5
'translation into target language for <case>=6'6
<case> = x; <number> = y; <gender> = z;

 
The second type of translation pattern is the so called conjugation-type translation pattern:
'source language text'<number><gender>
'translation into target language for <number>=1 and <gender>=1'11
'translation into target language for <number>=1 and <gender>=2'12
'translation into target language for <number>=1 and <gender>=3'13
'translation into target language for <number>=2 and <gender>=1'21
'translation into target language for <number>=2 and <gender>=2'22
'translation into target language for <number>=2 and <gender>=3'23
<case> = x; <number> = y; <gender> = z;

 
The third type of translation pattern is the non-flexion-type translation pattern:
'source language text'
'translation into target language'
<case> = x; <number> = y; <gender> = z;

 
As we can see, each of the translation patterns has in its bottom row the optional information about the values that must be assigned to the <case>, <number>, and <gender> attributes, so that the grammatical relations between subject, verb, and object should be preserved. This part of the translation pattern is optional, i.e. not all the attributes must be assigned values in every translation pattern. In some special cases no attributes can be assigned values at all. The <case> attribute is assigned values from 1 to 6 (depending on the grammatical case). The attribute <number> is assigned value 1 for singular or 2 for plural. And the attribute <gender> is assigned value 1 for masculine, 2 for feminine, or 3 for neutral.
 
The pattern-based machine translation technique was implemented by this author for the system that translates from French to Polish. The manner in which the system operates will be described thoroughly in the next paragraph.


The French-to-Polish Machine Translation System in Operation
 
In order to illustrate how the pattern-based French-to-Polish machine translation system operates, the following quite complicated French text will be considered for translation:

FRENCH

click
for
Polish
trans-
lated
text
Chopin naquit en 1810 ŕ Zelazowa Wola prčs de Varsovie. Son pčre y enseignait le français dans une famille riche. Ensuite, sa famille vint s’installer ŕ Varsovie. Il étudia le piano et suivit les cours du Conservatoire. Aussitôt qu’il eut commencé ses études, ses maîtres s’aperçurent qu’il avait du génie. Lorsqu’il eut fini ses études au Conservatoire de Varsovie, il quitta la Pologne et il vint ŕ Paris oů il resta jusqu’ŕ la fin de sa vie. Il y donna d’abord des leçons particuličres de piano et y il eut des jours difficiles. Mais, dčs qu’il eut donné ses premiers concerts, il devint célčbre. Il fit la connaissance de la romancičre George Sand avec laquelle il resta en amitié de longues années. Ils voyagčrent ensamble ŕ Majorque. L’état de santé de Chopin s’aggrava, dčs qu’ils furent rentrés en France. La maladie de poitrine dont il souffrait empirait de jour en jour. Malgré ses souffrances, il continua ŕ composer les chefs-d’oevre qui l’ont rendu immortel. Il mourut ŕ Paris en 1849, en pensant ŕ sa patrie, la Pologne.
 
Les Polonais ont depuis longtemps participé ŕ la vie française. Et le souvenir de certains d’entre eux reste toujours vivant dans la mémoir des Français. En effet, les Français connaissent les noms des Polonais illustre comme Thadée Kościuszko, Frédéric Chopin et Marie Curie-Sklodowska. Ce sont lŕ des Polonais qui se sont engagés aux côtés de la France populaire. Mais pour les Français, c’est Adam Mickiewicz qui est l’incarnation vivante de son pays. Victor Hugo a dit que parle de Mickiewicz, c’est parle du beau, du juste et du vrai: c’est parle du droit, dont il a été le soldat, du devoir, dont il a été le héros, de la liberté, dont il a été l’apôtre, et de la délivrance, dont il a été le précurseur. Victor Hugo et Adam Mickiewicz symboliset bien l’amitié entre nos deux peuples.


 
The machine translation system looks up in the database the following translation patterns and substitutes them with their Polish equivalents, as follows:
 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
1) the declination-type translation pattern
... Chopin ...<case>
Chopin1
Chopina2
Chopinowi3
Chopina4
Chopinem5
Chopinie6
<number> = 1; <gender> = 1;

 
2) the conjugation-type translation pattern
... naquit ...<number><gender>
urodził się11
urodziła się12
urodziło się13
urodzili się21
urodziły się22
urodziły się23

 
3) the non-flexion-type translation pattern
... en 1810 ...
w roku 1810

 
4) the non-flexion-type translation pattern
... ŕ Zelazowa Wola ...
w Żelazowej Woli

 
5) the non-flexion-type translation pattern
... prčs de ...
blisko
<case> = 2;

 
6) the declination-type translation pattern
... Varsovie ...<case>
Warszawa1
Warszawy2
Warszawie3
Warszawę4
Warszawą5
Warszawie6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
7) the declination-type translation pattern
... son pčre ...<case>
jego ojciec1
jego ojca2
jego ojcu3
jego ojca4
jego ojcem5
jego ojcu6
<number> = 1; <gender> = 1;

 
8) the conjugation-type translation pattern
... y enseignait ...<number><gender>
uczył tam11
uczyła tam 12
uczyło tam 13
uczyli tam21
uczyły tam 22
uczyły tam 23
<case> = 2;

 
9) the declination-type translation pattern
... le français ...<case>
język francuski1
języka francuskiego2
językowi francuskiemu3
język francuski4
językiem francuskim5
języku francuskims6
<number> = 1; <gender> = 1;

 
10) the non-flexion-type translation pattern
... dans ...
w
<case> = 6;

 
11) the declination-type translation pattern
... une famille riche ...<case>
bogata rodzina1
bogatej rodziny2
bogatej rodzinie3
bogatą rodzinę4
bogatą rodziną5
bogatej rodzinie6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
12) the non-flexion-type translation pattern
... ensuite ...
następnie

 
13) the declination-type translation pattern
... sa famille ...<case>
jego rodzina1
jego rodziny2
jego rodzinie3
jego rodzinę4
jego rodziną5
jego rodzinie6
<number> = 1; <gender> = 2;

 
14) the conjugation-type translation pattern
... vint s’installer ŕ ...<number><gender>
przeniósł się do11
przeniosła się do12
przeniosło się do13
przenieśli się do21
przeniosły się do22
przeniosły się do23
<case> = 2;

 
15) the declination-type translation pattern
... Varsovie ...<case>
Warszawa1
Warszawy2
Warszawie3
Warszawę4
Warszawą5
Warszawie6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
16) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
17) the conjugation-type translation pattern
... étudia le piano ...<number><gender>
uczył się gry na fortepianie 11
uczył asie gry na fortepianie 12
uczyło się gry na fortepianie 13
uczyli się gry na fortepianie 21
uczyły się gry na fortepianie 22
uczyły się gry na fortepianie 23

 
18) the non-flexion-type translation pattern
... et ...
i

 
19) the conjugation-type translation pattern
... suivit les cours du ...<number><gender>
uczęszczał na zajęcia w11
uczęszczała na zajęcia w12
uczęszczało na zajęcia w13
uczęszczali na zajęcia w21
uczęszczały na zajęcia w22
uczęszczały na zajęcia w23
<case> = 6;

 
20) the declination-type translation pattern
... Conservatoire ...<case>
Konserwatorium1
Konserwatorium2
Konserwatorium3
Konserwatorium4
Konserwatorium5
Konserwatorium6
<number> = 1; <gender> = 3;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
21) the non-flexion-type translation pattern
... aussitôt ...
skoro tylko

 
22) the non-flexion-type translation pattern
... qu’il eut commencé ses études ...
rozpoczął studia

 
23) the declination-type translation pattern
... ses maîtres...<case>
jego nauczyciele1
jego nauczycieli2
jego nauczycielom3
jego nauczyciele4
jego nauczycielami5
jego nauczycielach6
<number> = 2; <gender> = 1;

 
24) the conjugation-type translation pattern
... s’aperçurent...<number><gender>
zauważył 1 1
zauważyła 1 2
zauważyło 1 3
zauważyli 2 1
zauważyły 2 2
zauważyły 2 3

 
25) the non-flexion-type translation pattern
... qu’il avait du génie ...
że był genialnie uzdolniony

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
26) the non-flexion-type translation pattern
... lorsqu’il eut fini ...
kiedy ukończył
<case> = 4;

 
27) the declination-type translation pattern
... ses études ...<case>
swoje studia1
swoich studiów2
swoim studiom3
swoje studia4
swoimi studiami5
swoich studiach6
<number> = 2; <gender> = 3;

 
28) the non-flexion-type translation pattern
... au Conservatoire de Varsovie ...
w Konserwatorium Warszawskim

 
29) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
30) the conjugation-type translation pattern
... quitta ...<number><gender>
opuścił11
opuściła12
opuściło13
opuścili21
opuściły22
opuściły23
<case> = 4;

 
31) the declination-type translation pattern
... la Pologne ...<case>
Polska1
Polski2
Polsce3
Polskę4
Polską5
Polsce6
<number> = 1; <gender> = 2;

 
32) the non-flexion-type translation pattern
... et ...
i

 
33) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
34) the conjugation-type translation pattern
... vint ŕ ...<number><gender>
wyjechał do11
wyjechała do12
wyjechało do13
wyjechali do21
wyjechały do22
wyjechały do23
<case> = 2;

 
35) the declination-type translation pattern
... Paris ...<case>
Paryż1
Paryża2
Paryżowi3
Paryż4
Paryżem5
Paryżu6
<number> = 1; <gender> = 1;

 
36) the non-flexion-type translation pattern
......
gdzie

 
37) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
38) the conjugation-type translation pattern
... resta ...<number><gender>
pozostał11
pozostała12
pozostało13
pozostali21
pozostały22
pozostały23

 
39) the non-flexion-type translation pattern
... jusqu’ŕ ...
do
<case> = 2;

 
40) the declination-type translation pattern
... la fin ...<case>
koniec1
końca2
końcowi3
koniec4
końcem5
końcu6
<number> = 1; <gender> = 1;

 
41) the non-flexion-type translation pattern
... de sa vie ...
swojego życia

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
42) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
43) the conjugation-type translation pattern
... y donna ...<number><gender>
dawał tam11
dawała tam12
dawało tam13
dawali tam21
dawały tam22
dawały tam23
<case> = 4;

 
44) the non-flexion-type translation pattern
... d’abord ...
najpierw

 
45) the declination-type translation pattern
... des leçons particuličres de piano ...<case>
prywatne lekcje gry na fortepianie1
prywatnych lekcji gry na fortepianie2
prywatnym lekcjom gry na fortepianie3
prywatne lekcje gry na fortepianie4
prywatnymi lekcjami gry na fortepianie5
prywatnych lekcjach gry na fortepianie6
<number> = 2; <gender> = 2;

 
46) the non-flexion-type translation pattern
... et ...
i

 
47) the non-flexion-type translation pattern
... y il eut des jours difficiles ...
przeżywał tam ciężkie dni

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
48) the non-flexion-type translation pattern
... mais ...
ale

 
49) the non-flexion-type translation pattern
... dčs qu’il eut donné ...
od chwili gdy dał
<case> = 4;

 
50) the declination-type translation pattern
... ses premiers concerts ...<case>
swoje pierwsze koncerty1
swoich pierwszych koncertów2
swoim pierwszym koncertom3
swoje pierwsze koncerty4
swoimi pierwszymi koncertami5
swoich pierwszych koncertach6
<number> = 2; <gender> = 3;

 
51) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
52) the conjugation-type translation pattern
... devint célčbre ...<number><gender>
stał się sławny11
stała się sławna12
stało się sławne13
stali się sławni21
stały się sławne22
stały się sławne23

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
53) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
54) the conjugation-type translation pattern
... fit la connaissance de ...<number><gender>
zawarł znajomość z11
zawarła znajomość z12
zawarło znajomość z13
zawarli znajomość z21
zawarły znajomość z22
zawarły znajomość z23
<case> = 5;

 
55) the declination-type translation pattern
... la romancičre George Sand ...<case>
powieściopisarka George Sand1
powieściopisarki George Sand2
powieściopisarce George Sand3
powieściopisarkę George Sand4
powieściopisarką George Sand5
powieściopisarce George Sand6
<number> = 1; <gender> = 2;

 
56) the non-flexion-type translation pattern
... avec laquelle ...
z którą

 
57) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
58) the conjugation-type translation pattern
... resta en amitié ...<number><gender>
pozostał w przyjaźni11
pozostała w przyjaźni12
pozostało w przyjaźni13
pozostali w przyjaźni21
pozostały w przyjaźni22
pozostały w przyjaźni23

 
59) the non-flexion-type translation pattern
... de longues années ...
przez długie lata

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
60) the non-flexion-type translation pattern
... ils ...
oni
<number> = 2; <gender> = 1;

 
61) the conjugation-type translation pattern
... voyagčrent ... <number><gender>
podróżował11
podróżowała12
podróżowało13
podróżowali21
podróżowały22
podróżowały23

 
62) the non-flexion-type translation pattern
... ensamble ...
razem

 
63) the non-flexion-type translation pattern
... ŕ Majorque ...
na Majorkę

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
64) the declination-type translation pattern
... l’état de santé ...<case>
stan zdrowia1
stanu zdrowia2
stanowi zdrowia3
stan zdrowia4
stanem zdrowia5
stanie zdrowia6
<number> = 1; <gender> = 1;

 
65) the non-flexion-type translation pattern
... de Chopin ...
Chopina

 
66) the conjugation-type translation pattern
... s’aggrava ... <number><gender>
pogorszył się11
pogorszyła się12
pogorszyło się13
pogorszyli się21
pogorszyły się22
pogorszyły się23

 
67) the non-flexion-type translation pattern
... dčs qu’ils furent rentrés en ...
po tym jak wrócił do
<case> = 2;

 
68) the declination-type translation pattern
... France ...<case>
Francja1
Francji2
Francji3
Francję4
Francją5
Francji6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
69) the declination-type translation pattern <number> = 1; <gender> = 2;
... la maladie de poitrine ...<case>
choroba płuc1
choroby płuc2
chorobie płuc3
chorobę płuc4
chorobą płuc5
chorobie płuc6

 
70) the conjugation-type translation pattern
... dont il souffrait ... <number><gender>
na który cierpiał11
na którą cierpiał12
na które cierpiał23
na których cierpiał21
na które cierpiał22
na które cierpiał23

 
71) the conjugation-type translation pattern
... empirait ...<number><gender>
pogłębiał się11
pogłębiała się 12
pogłębiało się13
pogłębiali się21
pogłębiały się22
pogłębiały się23

 
72) the non-flexion-type translation pattern
... de jour en jour ...
z dnia na dzień

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
73) the non-flexion-type translation pattern
... malgré ...
pomimo
<case> = 2;

 
74) the declination-type translation pattern
... ses souffrances ...<case>
jego cierpienia1
jego cierpień2
jego cierpieniom3
jego cierpienia4
jego cierpieniami5
jego cierpieniach6
<number> = 2; <gender> = 3;

 
75) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
76) the conjugation-type translation pattern
... continua ŕ composer ... <number><gender>
nadal komponował11
nadal komponowała12
nadal komponowało13
nadal komponowali21
nadal komponowały22
nadal komponowały23
<case> = 4;

 
77) the declination-type translation pattern
... les chefs-d’oevre ...<case>
arcydzieła1
arcydzieł2
arcydziełom3
arcydzieła4
arcydziełami5
arcydziełach6
<number> = 2; <gender> = 3;

 
78) the conjugation-type translation pattern
... qui l’ont rendu immortel ...<number><gender>
który uczynił go nieśmiertelnym11
która uczyniła go nieśmiertelnym12
które uczyniło go nieśmiertelnym13
którzy uczynili go nieśmiertelnym21
które uczyniły go nieśmiertelnym22
które uczyniły go nieśmiertelnym23

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
79) the non-flexion-type translation pattern
... il ...
on
<number> = 1; <gender> = 1;

 
80) the conjugation-type translation pattern
... mourut ŕ ...<number><gender>
umarł w11
umarła w12
umarło w13
umarli w21
umarły w22
umarły w23
<case> = 6;

 
81) the declination-type translation pattern
... Paris ...<case>
Paryż1
Paryża2
Paryżowi3
Paryż4
Paryżem5
Paryżu6
<number> = 1; <gender> = 1;

 
82) the non-flexion-type translation pattern
... en 1849 ...
w roku 1849

 
83) the non-flexion-type translation pattern
... en pensant ŕ ...
myśląc o
<case> = 6;

 
84) the declination-type translation pattern
... sa patrie ...<case>
swoja ojczyzna1
swojej ojczyzny2
swojej ojczyźnie3
swoją ojczyznę4
swoja ojczyzną5
swojej ojczyźnie6
<number> = 1; <gender> = 2;

 
85) the declination-type translation pattern
... la Pologne ...<case>
Polska1
polski2
Polsce3
Polskę4
Polską5
Polsce6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
86) the declination-type translation pattern
... les Polonais ...<case>
Polacy1
Polaków2
Polakom3
Polaków4
Polakami5
Polakach6
<number> = 2; <gender> = 1;

 
87) the conjugation-type translation pattern
... ont depuis longtemps participé ŕ ...<number><gender>
od dawna uczestniczył w11
od dawna uczestniczyła w12
od dawna uczestniczyło w13
od dawna uczestniczyli w21
od dawna uczestniczyły w22
od dawna uczestniczyły w23
<case> = 6;

 
88) the declination-type translation pattern
... la vie française ...<case>
życie Francji1
życia Francji2
życiu Francji3
życie Francji4
życiem Francji5
życiu Francji6
<number> = 1; <gender> = 3;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
89) the non-flexion-type translation pattern
... et ...
i

 
90) the declination-type translation pattern
... le souvenir de certains d’entre eux ...<case>
pamiątki po niektórych z nich1
pamiątek po niektórych z nich2
pamiątkom po niektórych z nich3
pamiątki po niektórych z nich4
pamiątkami po niektórych z nich5
pamiątkach po niektórych z nich6
<number> = 2; <gender> = 2;

 
91) the conjugation-type translation pattern
... reste toujours vivant dans ...<number><gender>
pozostaje wiecznie żywy w11
pozostaje wiecznie żywa w12
pozostaje wiecznie żywe w13
pozostają wiecznie żywi w21
pozostają wiecznie żywe w22
pozostają wiecznie żywe w23
<case> = 6;

 
92) the declination-type translation pattern
... la mémoir des Français ...<case>
pamięć Francuzów1
pamięci Francuzów2
pamięci Francuzów3
pamięć Francuzów4
pamięcią Francuzów5
pamięci Francuzów6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
93) the non-flexion-type translation pattern
... en effet ...
istotnie

 
94) the declination-type translation pattern
... les Français ...<case>
Francuzi1
Francuzów2
Francuzom3
Francuzów4
Francuzami5
Francuzach6
<number> = 2; <gender> = 1;

 
95) the conjugation-type translation pattern
... connaissent ...<number><gender>
zna11
zna12
zna13
znają21
znają22
znają23
<case> = 4;

 
96) the declination-type translation pattern
... les noms des Polonais illustre comme ...<case>
nazwiska tak znanych Polaków jak1
nazwisk tak znanych Polaków jak2
nazwiskom tak znanych Polaków jak3
nazwiska tak znanych Polaków jak4
nazwiskami tak znanych Polaków jak5
nazwiskach tak znanych Polaków jak6
<number> = 2; <gender> = 3; <case> = 1;

 
97) the declination-type translation pattern
... Thadée Kościuszko ...<case>
Tadeusz Kościuszko1
Tadeusza Kościuszki2
Tadeuszowi Kościuszce3
Tadeusza Kościuszko4
Tadeuszem Kościuszką5
Tadeuszu Kościuszce6
<number> = 1; <gender> = 1;

 
98) the declination-type translation pattern
... Frédéric Chopin ...<case>
Fryderyk Chopin1
Fryderyka Chopina2
Fryderykowi Chopinowi3
Fryderyka Chopina4
Fryderykiem Chopinem5
Fryderyku Chopinie6
<number> = 1; <gender> = 1;

 
99) the non-flexion-type translation pattern
... et ...
i

 
100) the declination-type translation pattern
... Marie Curie-Sklodowska ...<case>
Maria Curie-Skłodowska1
Marii Curie-Skłodowskiej2
Marii Curie-Skłodowskiej3
Marię Curie-Skłodowską4
Marią Curie-Skłodowska5
Marii Curie-Skłodowskiej6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
101) the non-flexion-type translation pattern
... ce sont lŕ ...
to są
<case> = 1;

 
102) the declination-type translation pattern
... des Polonais ...<case>
Polacy1
Polaków2
Polakom3
Polaków4
Polakami5
Polakach6
<number> = 2; <gender> = 1;

 
103) the conjugation-type translation pattern
... qui se sont engagés aux côtés de ... <number><gender>
który się zaangażował po stronie11
która się zaangażowała po stronie12
które się zaangażowało po stronie13
którzy się zaangażowali po stronie21
które się zaangażowały po stronie22
które się zaangażowały po stronie23
<case> = 2;

 
104) the declination-type translation pattern
... la France populaire ...<case>
Francja ludowa1
Francji ludowej2
Francji ludowej3
Francję ludową4
Francją ludową5
Francji ludowej6
<number> = 1; <gender> = 2;

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
105) the non-flexion-type translation pattern
... mais ...
ale

 
106) the non-flexion-type translation pattern
... pour les Français ...
dla Francuzów

 
107) the non-flexion-type translation pattern
... c’est Adam Mickiewicz qui ...
to właśnie Adam Mickiewicz
<number> = 1; <gender> = 1;

 
108) the conjugation-type translation pattern
... est ...<number><gender>
jest11
jest12
jest13
21
22
23
<case> = 5;

 
109) the declination-type translation pattern
... l’incarnation vivante ...<case>
żywe wcielenie1
żywego wcielenia2
żywemu wcieleniu3
żywe wcielenie4
żywym wcieleniem5
żywym wcieleniu6
<number> = 1; <gender> = 2;

 
110) the non-flexion-type translation pattern
... de son pays ...
swojego kraju

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
111) the declination-type translation pattern
... Victor Hugo ...<case>
Wiktor Hugo1
Wickora Hugo2
Wiktorowi Hugo3
Wiktora Hugo4
Wiktorem Hugo5
Wiktorze Hugo6
<number> = 1; <gender> = 1;

 
112) the conjugation-type translation pattern
... a dit que parle de ...<number><gender>
powiedział że mówić o11
powiedziała że mówić o12
powiedziało że mówić o13
powiedzieli że mówić o21
powiedziały że mówić o22
powiedziały że mówić o23
<case> = 6;

 
113) the declination-type translation pattern
... Mickiewicz ...<case>
Mickiewicz1
Mickiewicza2
Mickiewiczowi3
Mickiewicza4
Mickiewiczem5
Mickiewiczu6
<number> = 1; <gender> = 1;

 
114) the non-flexion-type translation pattern
... c’est parle ...
to mówić o
<case> = 6;

 
115) the declination-type translation pattern
... du beau ...<case>
piękno1
piękna2
pięknu3
piękno4
pięknem5
pięknie6
<number> = 1; <gender> = 3;

 
116) the declination-type translation pattern
... du juste ...<case>
sprawiedliwość1
sprawiedliwości2
sprawiedliwości3
sprawiedliwość4
sprawiedliwością5
sprawiedliwości6
<number> = 1; <gender> = 2;

 
117) the non-flexion-type translation pattern
... et ...
i

 
118) the declination-type translation pattern
... du vrai ...<case>
prawda1
prawdy2
prawdzie3
prawdę4
prawdą5
prawdzie6
<number> = 1; <gender> = 2;

 
119) the non-flexion-type translation pattern
... c’est parle ...
to mówić o
<case> = 6;

 
120) the declination-type translation pattern
... du droit ...<case>
prawo1
prawa2
prawu3
prawo4
prawem5
prawie6
<number> = 1; <gender> = 3;

 
121) the conjugation-type translation pattern
... dont il a été le soldat ...<number><gender>
którego był żołnierzem11
której był żołnierzem12
którego był żołnierzem13
których był żołnierzem21
których był żołnierzem22
których był żołnierzem23

 
122) the declination-type translation pattern
... du devoir ...<case>
obowiązek1
obowiązku2
obowiązkowi3
obowiązek4
obowiązkiem5
obowiązku6
<number> = 1; <gender> = 1;

 
123) the conjugation-type translation pattern
... dont il a été le héros ...<number><gender>
którego był bohaterem11
której był bohaterem12
którego był bohaterem13
których był bohaterem21
których był bohaterem22
których był bohaterem23

 
124) the declination-type translation pattern
... de la liberté ...<case>
wolność1
wolności2
wolności3
wolność4
wolnością5
wolności6
<number> = 1; <gender> = 2;

 
125) the conjugation-type translation pattern
... dont il a été l’apôtre ...<number><gender>
którego był apostołem11
której był apostołem12
którego był apostołem13
których był apostołem21
których był apostołem22
których był apostołem23

 
126) the non-flexion-type translation pattern
... et ...
i

 
127) the declination-type translation pattern
... de la délivrance ...<case>
wyzwolenie1
wyzwolenia2
wyzwoleniu3
wyzwolenie4
wyzwoleniem5
wyzwoleniu6
<number> = 1; <gender> = 3;

 
128) the conjugation-type translation pattern
... dont il a été le précurseur ...<number><gender>
którego był prekursorem11
której był prekursorem12
którego był prekursorem13
których był prekursorem21
których był prekursorem22
których był prekursorem23

 
At the beginning of a new sentence the value 1 is assigned to the <case> attribute.
<case> = 1;

 
129) the declination-type translation pattern
... Victor Hugo et Adam Mickiewicz ...<case>
Wiktor Hugo i Adam Mickiewicz1
Wiktora Hugo i Adama Mickiewicza2
Wiktorowi Hugo i Adamowi Mickiewiczowi3
Wiktora Hugo i Adama Mickiewicza4
Wiktorem Hugo i Adamem Mickiewiczem5
Wiktorze Hugo i Adamie Mickiewiczu6
<number> = 2; <gender> = 1;

 
130) the conjugation-type translation pattern
... symboliset bien ...<number><gender>
dobrze symbolizuje11
dobrze symbolizuje12
dobrze symbolizuje13
dobrze symbolizują21
dobrze symbolizują22
dobrze symbolizują23
<case> = 4;

 
131) the declination-type translation pattern
... l’amitié ...<case>
przyjaźń1
przyjaźni2
przyjaźni3
przyjaźń4
przyjaźnią5
przyjaźni6
<number> = 1; <gender> = 2;

 
132) the non-flexion-type translation pattern
... entre nos deux peuples ...
pomiędzy naszymi narodami

 
The result from the French-to-Polish machine translation system is the following Polish translation of the French input text:

POLISH

click
for
French
source
text
Chopin urodził się w roku 1810 w Żelazowej Woli blisko Warszawy. Jego ojciec uczył tam języka francuskiego w bogatej rodzinie. Następnie jego rodzina przeniosła się do Warszawy. On uczył się gry na fortepianie i uczęszczał na zajęcia w Konserwatorium. Skoro tylko rozpoczął studia jego nauczyciele zauważyli że był genialnie uzdolniony. Kiedy ukończył swoje studia w Konserwatorium Warszawskim on opuścił Polskę i on wyjechał do Paryża gdzie on pozostał do końca swojego życia. On dawał tam najpierw prywatne lekcje gry na fortepianie i przeżywał tam ciężkie dni. Ale od chwili gdy dał swoje pierwsze koncerty on stał się sławny. On zawarł znajomość z powieściopisarką George Sand z którą on pozostał w przyjaźni przez długie lata. Oni podróżowali razem na Majorkę. Stan zdrowia Chopina pogorszył się po tym jak wrócił do Francji. Choroba płuc na którą cierpiał pogłębiała się z dnia na dzień. Pomimo jego cierpień on nadal komponował arcydzieła które uczyniły go nieśmiertelnym. On umarł w Paryżu w roku 1849 myśląc o swojej ojczyźnie Polsce.
 
Polacy od dawna uczestniczyli w życiu Francji. I pamiątki po niektórych z nich pozostają wiecznie żywe w pamięci Francuzów. Istotnie Francuzi znają nazwiska tak znanych Polaków jak Tadeusz Kościuszko Fryderyk Chopin Maria Curie-Skłodowska. To są Polacy którzy się zaangażowali po stronie Francji ludowej. Ale dla Francuzów to właśnie Adam Mickiewicz jest żywym wcieleniem swojego kraju. Victor Hugo powiedział że mówić o Mickiewiczu to mówić o pięknie sprawiedliwości i prawdzie to mówić o prawie którego był żołnierzem obowiązku którego był bohaterem wolności której był apostołem i wyzwoleniu którego był prekursorem. Victor Hugo i Adam Mickiewicz dobrze symbolizują przyjaźń pomiędzy naszymi narodami.


 
The obtained Polish translation is both accurate and of high quality. It also sounds very natural and resembles the effect of the work of a human translator.


Conclusions:
 
In this paper the proposal by this author of a pattern-based machine translation technique is presented. The implementation of this technique for the system which translates from French to Polish is also described. The obtained Polish translation is of high quality even if the length of translation patterns is not great. The translation pattern length statistics are presented in Fig. 1.
 

Fig. 1. The statistics of the translation pattern lengths.
 
As one can conclude from Fig. 1 most of the translation patterns have a length of one or two words. Exactly 38.6% translation examples have a length of one word, 31.1% translation patterns have a length of two words, 13.6% three words, 6.8% four words, 9.1% five words, and only 0.8% more than five words. This fact suggests convincingly that the pattern-based machine translation is aimed in the right direction. The final success of building a fully-automatic high-quality machine translation system, which would be able to translate unrestricted text from French to Polish depends on the amount of data gathered in the database, on which this author is currently working.


References:
 
[1] D. Arnold, L. Balkan, S. Meijer, R. L. Humphreys, L. Sadler: Machine Translation: An Introductory Guide, NCC Blackwell, London, 1994 RETURN

[2] P. Whitelock, K. Kilby: Linguistic and Computational Techniques in Machine Translation System Design, UCL Press, London, GB, 1995 RETURN

[3] C. Rico: From Novelty to Ubiquity: Computers and Translation at the Close of Industrial Age, http:\\www.accurapid.com/journal/15mt2.htm RETURN

[4] A. Melby: Machine Translation and Philosophy of Language; Machine Translation Review, No. 9, April 1999, pp. 6-17 RETURN

[5] R. D. Brown: Adding linguistic knowledge to a lexical example-based translation system, Language Technologies Institute, Carnegie Mellon University, Pittsburgh, PA, USA, 2000 RETURN

[6] R. D. Brown: Example-based machine translation in the Pangloss system, Language Technologies Institute, Carnegie Mellon University, Pittsburgh, PA, USA, 2000 RETURN

[7] Y. Zhang, R. D. Brown, R. E. Frederking: Adapting an example-based translation system to Chinese, Carnegie Mellon University, Pittsburgh, PA, USA, 2000 RETURN

 

NATURAL LANGUAGE
TRANSLATION
SITE NAVIGATOR
Click for...
  MTR main menu

  MTR-13 overview   •   previous item   next item

NLT
home page
search
engine