Back to Top

Τεχνολογία της Μicrosoft προσφέρει διερμηνεία σε πραγματικό χρόνο

Ένα πειραματικό σύστημα που μεταφράζει τα λόγια ενός αγγλόφωνου ομιλητή στα κινέζικα, σχεδόν σε πραγματικό χρόνο, χρησιμοποιήθηκε πρακτικά σε παρουσίαση που έδωσε στέλεχος της Microsoft στo Τιανζίν της Κίνας. Το λογισμικό, μάλιστα, μπορεί ακόμα και να μιμείται τη χροιά της φωνής του ομιλητή.

«Καθώς μιλούσα στα αγγλικά, το σύστημα συνδύαζε αυτόματα μια σειρά τεχνολογιών για να δώσει μια ικανοποιητική εμπειρία στους ακροατές -με τη δική μου φωνή να ακούγεται στα κινέζικα» γράφει σε εταιρικό ιστολόγιο ο Ρικ Ρασίντ, επικεφαλής Έρευνας στη Μicrosoft.

Τα πρώτα συστήματα αυτόματης μετάφρασης ομιλίας εμφανίστηκαν τη δεκαετία του 1970 και προσπαθούσαν να αντιστοιχίσουν την κυματομορφή της φωνής του χρήστη με γνωστές κυματομορφές σε μια άλλη γλώσσα.

Το σύστημα της Μicrosoft ακουλουθεί εντελώς διαφορετική προσέγγιση: στο πρώτο στάδιο, μετατρέπει την ομιλία σε γραπτό κείμενο, το οποίο μεταφράζεται στη συνέχεια στα κινέζικα λέξη προς λέξη. Στο επόμενο στάδιο, το λογισμικό αναδιατάσσει τις λέξεις στη σωστή σειρά ώστε να βγάζουν νόημα, και τις εκφέρει μιμούμενο τη χροιά της φωνής του ομιλητή.

Το σύστημα, επισήμανε ο Ρασίντ, συνδυάζει διάφορες προσεγγίσεις μετάφρασης, όπως τη «μοντελοποίηση Μάρκοφ» που επιτρέπει στο σύστημα να μαθαίνει ακούγοντας πολλούς διαφορετικούς ομιλητές, καθώς και την τεχνική Deep Neural Networks, η οποία αναπτύχθηκε από τη Microsoft σε συνεργασία με το Πανεπιστήμιο του Τορόντο και βασίζεται στα λεγόμενα νευρωνικά δίκτυα, τα οποία μιμούνται την οργάνωση των νευρώνων του εγκεφάλου.

Ο Ρασίντ τόνισε πάντως ότι στη σημερινή του μορφή το σύστημα μεταφράζει λανθασμένα περίπου λέξη ανά επτά ή οκτώ. Τα λάθη είναι επομένως αρκετά, ωστόσο η ακρίβεια έχει αυξηθεί κατά 30% σε σχέση με προηγούμενες απόπειρες.

Η Microsoft, πάντως, δεν είναι η μόνη εταιρεία που ερευνά τις τεχνολογίες μηχανικής διερμηνείας. Ανάλογες τεχνολογίες αναπτύσσονται μεταξύ άλλων από τη Google και την AT&T, ενώ η ιαπωνική εταιρεία κινητής τηλεφωνίας NTT Docomo έχει παρουσιάσει ένα κινητό που επιτρέπει στους Ιάπωνες να μιλούν αγγλικά. Η διαφορά όμως είναι ότι στα συστήματα αυτά η φωνή του συστήματος έχει μηχανική χροιά.

Αναλυτικά: http://news.in.gr/science-technology/article/?aid=1231221285

Τύπος Είδησης: 

Δημοφιλη

Επαγγελματική Συμβουλευτική

Συγγραφή Βιογραφικού
Σύνταξη Επιχειρηματικού Σχεδίου

Χρησιμοποιήστε τις Online Eφαρμογές που έχει αναπτύξει το Γραφείο Διασύνδεσης Δ.Π.Θ. για

Παρουσιάσεις Εταιρειών

Εργαστηρια Δ.Π.Θ.

Αναζητήστε εργαστήρια των σχολών του ΔΠΘ και εκδηλώστε ενδιαφέρον για συνεργασία και μεταφορά τεχνολογίας

Επιχειρηματικοτητα

Followme

followme
  • Twitter
  • Facebook
  • Linkedin
  • Mixcloud
  • Instagram
  • YouTube

Newsletter

Συμπληρώστε το e-mail σας και θα λαμβάνετε περιοδικά το Δελτίο Τύπου της Ραδιοφωνικής Εκπομπής "Διασυνδεθείτε".

Παρακαλώ, όσοι διαθέτετε λογαριασμό e-mail του Δ.Π.Θ μην τον χρησιμοποιείτε για την εγγραφή σας στο newsletter της Δομής Απασχόλησης & Σταδιοδρομίας του Δ.Π.Θ.

Πλοήγηση