• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Wykorzystywanie informacji lingwistycznych do hybrydowego tłumaczenia automatycznego, Barcelona, Hiszpania

    07.09.2011. 16:26
    opublikowane przez: Redakcja Naukowy.pl

    Dnia 18 listopada 2011 r. w Barcelonie, Hiszpania, odbędzie się wydarzenie pt. "Wykorzystywanie informacji lingwistycznych do hybrydowego tłumaczenia automatycznego".

    Tłumaczenie automatyczne sterowane danymi jest coraz szerzej wykorzystywane przez społeczność naukową zajmującą się tłumaczeniem automatycznym. Pod względem jakości wyniki stają się coraz bardziej przydatne, zwłaszcza kiedy językiem docelowym jest angielski.

    Systemy tłumaczenia automatycznego sterowane danymi bazują na dwujęzycznych wyrównanych korpusach językowych, które są dużymi i ustrukturyzowanymi zestawami tekstów, wykorzystywanymi do analizy statystycznej i testowania założeń, sprawdzania wystąpień i zatwierdzania zasad językowych. Zatem wydajność systemu zdecydowanie zależy od jakości i wielkości korpusów językowych. Dla wielu par językowych brak jednak dużych i wiarygodnych, dwujęzycznych korpusów językowych. Ponadto bogactwo morfologiczne języka docelowego raczej utrudnia opracowanie systemu sterowanego danymi.

    W czasie wydarzenia nacisk położony zostanie na działalność badawczą podejmowaną w wielu ośrodkach, której przedmiotem są podejścia do integracji informacji strukturalnych w rozwiązania open-source oraz opracowanie nowej ewaluacji tłumaczenia automatycznego z wykorzystaniem metryki o podłożu lingwistycznym.

    Za: CORDIS

    Czy wiesz ĹĽe...? (beta)
    BLEU (Bilingual Evaluation Understudy) jest algorytmem do ewaluacji jakości tłumaczenia automatycznego z jednego języka naturalnego na inny. Jakość jest rozumiana jako korelacja między danymi wyjściowymi a tekstem ludzkim: "im bliższe tłumaczenie automatyczne jest profesjonalnemu tłumaczeniu ludzkiemu, tym jest lepsze". BLEU był jedną z pierwszych metryk, która uzyskała wysoką korelację z ludzkim osądem jakości. Pozostaje także najbardziej popularną z metod. Statystyczne tłumaczenie maszynowe – metoda tłumaczenia automatycznego, w której przekład tworzony jest w oparciu o modele statystyczne, których parametry pozyskiwane są poprzez analizę korpusu równoległego danej pary języków. Ten sposób tłumaczenia stanowi alternatywę dla metod opartych na regułach transferu, jak i dla systemów opierających się na przykładach. Modele IBM - pięć modeli tłumaczenia automatycznego metodą statystyczną. Zostały one opracowane i opublikowane przez grupę badaczy z IBM w 1993 r.

    Friulska Wikipedia: W kwietniu 2008 r. Wikipedia miała 216 "aktywnych" edycji językowych (każda ponad 100 artykułów), w sumie wszystkich edycji jest 255. Znaczna część haseł zredagowana jest w kilku edycjach językowych – co czwarte hasło w Wikipedii zapisane jest w języku angielskim, a 2 na 3 hasła powstały w jednej z dziesięciu najbardziej popularnych edycji językowych.

    Dodano: 07.09.2011. 16:26  


    Najnowsze