Tux

...making Linux just a little more fun!

[Apertium-stuff] English->Esperanto language pair released

Jimmy O'Regan [joregan at gmail.com]


Wed, 4 Feb 2009 18:12:14 +0000

---------- Forwarded message ----------

From: Jacob Nordfalk <jacob.nordfalk@gmail.com>
Date: 2009/2/4
Subject: [Apertium-stuff] English->Esperanto language pair released
To: Apertium-stuff <apertium-stuff@lists.sourceforge.net>

(English below / pli sube en la angla)

Ni ĵus publikigis novan lingvoparon, de la angla al Esperanto, apertium-eo-en. Temas pri la 27a publikigita aŭtomata tradukilo evoluiigita surbaze de la liber-programara motoro kaj ilaro por maŝina tradukado Apertium, la 4a en la angla kaj la 3a en Esperanto.

Oni povas jam nun provi la paron ĉe: http://www.apertium.org/index.php?id=translatetext&lang=eo

La komencaj celoj por la eldono de tiu versio estis:

* Por nescianto de la angla, esti kapabla kompreni la enhavon de
novaĵo pri ĝenerala temo.
* Esti kapabla kompreni, ĉu la koncerna novaĵo estas sufiĉe interesa
por esti konvene tradukita.
* Mallongaj frazoj devus esti akcepteble tradukitaj.

Ni kredas, ke ni atingis tiujn celojn sufiĉe akcepteble kaj ke la rezulto povas esti utila.

Entute, temas pri 'komunume' disvolvita pakaĵo, t.e. evoluigita per volontula laboro.

==Estonto==

La sekvaj paŝoj estos en diversajn direktojn:

'' - Plibonigi la aktualan version. - Labori pri la tradukilo de Esperanto en la anglan. - Evoluigi novajn ilojn surbaze de la tradukilo kaj la leksikonoj. ''

==Agnoskoj==

Koran dankon al ĉiuj evoluigintoj de la multaj malferma-fontaj iloj kaj liberaj lingvo-rimedoj, kiuj permesis starigi ĉi tiun novan tradukilon. Precipe dankon al ABC Enciklopedioj S.L., IULA of the Universitat Pompeu Fabra kaj Prompsit Language Engineering, S.L por la lingvoparoj Catalan->Esperanto kaj Spanish->Esperanto kiu donis la elirpunkto por tiu ĉi paro.

Koran dankon al Mike Leon (traduku.net), kiu liveris grandegan leksikonon kun 114 082 paroj da vortoj kaj idiomaĵoj.

Koran dankon al Francis Tyer, Prompsit Language Engineering, kaj Jimmy O'Reagan pro la konsiloj kaj pro la dizajno de la kerno de la sistemo de transdon-reguloj.

==Statistikoj==

;Leksiko:

'' Esperanto-vortaro: 22 462 lemoj English-vortaro: 13 733 lemoj Dulingva vortaro: 30 773 duopoj ''

;Reguloj:

'' 1a ŝtupo (chunk): 44 2a ŝtupo (inter-chunk): 8 3a ŝtupo (post-chunk): 6 ''

==Teknikaj notoj==

Vidu http://wiki.apertium.org/wiki/English_and_Esperanto

We've just released a new language pair, for English to Esperanto, apertium-eo-en. It's the 27th released automatic translator developped with the open-source Apertium machine translator engine, the 4th from English and the 3rd to Esperanto.

The pair is already available at http://www.apertium.org/index.php?id=translatetext&lang=eo

The stated release goals for this version were:

* For someone who doesn't know English to be able to discern the topic
of a general news item.
* To be able to distinguish if a particular item is interesting enough
to be translated properly.
* Short sentences should be translated reasonably well.

We think we've achieved these goals quite reasonably and the result can be useful.

It's a 'community' developed package: i.e., developed in a 'bazaar'-like fashion using volunteer contributions.

==Future==

The next steps should be in several directions:

- Improve the current version
- Work on the translator from Esperanto into English.
- Develop new tools which will use the translator and the lexicons.

==Acknowledgements==

Many thanks to all those who developped the lots of open-source tools and free language resources, which made to develop this new translator. Especially thanks to ABC Enciklopedioj S.L., IULA of the Universitat Pompeu Fabra and Prompsit Language Engineering, S.L for the language pairs Catalan->Esperanto kaj Spanish->Esperanto which made the starting point for this pair.

Many thanks to Mike Leon (traduku.net), who suplied a huge lexicon with 114,082 pairs of words and idioms.

Many thanks to Francis Tyer, Prompsit Language Engineering, and Jimmy O'Reagan for advice and for designing the bulk of the system of transfer rules.

==Statistics==

;Lexis:

Esperanto dictionary: 22,462 lemmata
English dictionary: 13,733 lemmata
Bilingual dictionary: 30,773 correspondences

;Rules:

Stage 1 (chunk): 44
Stage 2 (inter-chunk): 8
Stage 3 (post-chunk): 6

==Technical notes==

See http://wiki.apertium.org/wiki/English_and_Esperanto

-- Jacob Nordfalk Venu al la plej granda kultura evento en esperantujo: Kultura Esperanto-Festivalo - la 7a ĝis la 12a de julio 2009 - http://kef.saluton.dk

------------------------------------------------------------------------------ Create and Deploy Rich Internet Apps outside the browser with Adobe(R)AIR(TM) software. With Adobe AIR, Ajax developers can use existing skills and code to build responsive, highly engaging applications that combine the power of local resources and data with the reach of the web. Download the Adobe AIR SDK and Ajax docs to start building applications today-http://p.sf.net/sfu/adobe-com Apertium-stuff mailing list Apertium-stuff@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/apertium-stuff


Top    Back