Conference PaperPDF Available

Machine Translation and under resourced

Authors:

Abstract

Είναι γενικά αποδεκτό ότι η Μηχανική Μετάφραση (ΜΜ) για γλώσσες με έλλειψη γλωσσικών πόρων, όπως τα Ελληνικά, έχει αποδειχτεί προβληματική εξ αρχής λόγω του μορφολογικού τους πλούτου και της δυναμικής τους σύνταξης. Το γεγονός ότι η πρόσβαση στο Ευρωπαϊκό Systran δεν ήταν εφικτή λόγω προβλημάτων της ΕΕ με την εταιρεία-πάροχο Systran, καθώς και ότι η δωρεάν προς διανομή μηχανή Moses θα έπρεπε να στηθεί τοπικά και δεν υπήρχε πακέτο σχετικό με τα Ελληνικά, οδήγησε στην επιλογή τριών διαδικτυακών, ελεύθερα προσβάσιμων, πλατφορμών μηχανικής μετάφρασης: το Google Translate, το Bing Translator και την εμπορική έκδοση του λογισμικού Systran. Εργαστήκαμε στο γλωσσικό ζεύγος Αγγλικά – Ελληνικά και χρησιμοποιήσαμε κείμενα προς μετάφραση από τέσσερις διαφορετικούς θεματικούς τομείς: τρία ειδησεογραφικά άρθρα, ένα με οικονομικό περιεχόμενο, ένα με Ευρωπαϊκό περιεχόμενο, ένα με αθλητικό περιεχόμενο, καθώς και ένα έγγραφο από τον ιατρικό τομέα. Τα κείμενα επιλέχθηκαν ώστε να έχουν παρόμοιο αριθμό λέξεων, περίπου 200. Η αξιολόγηση των αποτελεσμάτων έγινε σημειώνοντας τα γραμματικά, μορφολογικά και συντακτικά σφάλματα που έκανε κάθε πλατφόρμα σε κάθε έγγραφο. Βαθμολογήσαμε κάθε πρόταση του αποτελέσματος χρησιμοποιώντας μία κλίμακα από το 1 έως το 4 πάντα σε σχέση με τους τέσσερις άξονες του Hutchins: πρόσβαση, κατανομή, αφομοίωση και ανταλλαγή πληροφορίας. Στην παρούσα εργασία παρουσιάζουμε τα κοινά προβλήματα που βρέθηκαν κατά την αξιολόγηση, όπως η έλλειψη φυσικότητας όσον αφορά στην έκφραση, η μεταφορά των ακρωνυμίων, η αδυναμία μεταφραστικών ισοδυναμιών σε ορολογία, η ανεπάρκεια στην αντιστοίχιση συντακτικών δομών και κεφαλαιοποίησης από τη γλώσσα-προέλευσης στη γλώσσα-στόχο, καθώς και το πρόβλημα στην αναγνώριση και μεταφορά των ονοματικών οντοτήτων (πρόσωπα, τοποθεσίες, οργανισμοί κτλ). Παράλληλα παρουσιάζουμε και τις προτάσεις μας για βελτίωση των αποτελεσμάτων, όπως είναι η χρήση απλών Αγγλικών (Plain English), η διαδραστικότητα με τον χρήστη, καθώς και ο εμπλουτισμός των βάσεων ορολογίας. Όλα τα παραπάνω μπορούν να αποτελέσουν αντικείμενο εστίασης για περαιτέρω έρευνα.
A preview of the PDF is not available
ResearchGate has not been able to resolve any citations for this publication.
ResearchGate has not been able to resolve any references for this publication.