Πέμπτη 16 Ιανουαρίου 2025

Μοντέλο τεχνητής νοημοσύνης μεταφράζει ομιλίες από μια γλώσσα σε άλλη αναγνωρίζοντας 100 γλώσσες

Το νέο μοντέλο SEAMLESSM4T της Meta μεταφράζει ομιλίες άμεσα σε 101 γλώσσες με 23% μεγαλύτερη ακρίβεια, αντιμετωπίζοντας ωστόσο προκλήσεις στην κάλυψη γλωσσών.
  • Ένα νέο μοντέλο τεχνητής νοημοσύνης με την ονομασία SEAMLESSM4T αναπτύχθηκε από την εταιρεία Meta και μπορεί να μεταφράσει ομιλία σε 101 γλώσσες, προσφέροντας άμεσες μεταφράσεις με 23% μεγαλύτερη ακρίβεια από τα υπάρχοντα συστήματα.
  • Το μοντέλο υποστηρίζει διάφορους τύπους μετάφρασης, όπως ομιλία σε ομιλία, ομιλία σε κείμενο και κείμενο σε ομιλία, με δημόσια διαθέσιμα δεδομένα και κώδικα για την εκτέλεση της τεχνολογίας.
  • Παρά τα πλεονεκτήματα, υπάρχουν προκλήσεις όπως η περιορισμένη κάλυψη γλωσσών και η δυσκολία στη μετάφραση σε θορυβώδη περιβάλλοντα ή με έντονες προφορές, καθώς και ανησυχίες για τυχόν προκαταλήψεις στις μεταφράσεις.

Ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να μεταφράζει απευθείας την ομιλία από μια γλώσσα σε άλλη δημιούργησε ερευνητική ομάδα της αμερικανικής εταιρείας τεχνολογίας Meta.

Τα περισσότερα υπάρχοντα συστήματα μετάφρασης με μηχανική μάθηση είναι προσανατολισμένα στο κείμενο ή περιλαμβάνουν πολλαπλά βήματα, δηλαδή αναγνώριση ομιλίας, μετάφραση σε κείμενο και μετατροπή του κειμένου σε ομιλία. Επιπλέον, η γλωσσική κάλυψη στα υπάρχοντα μοντέλα ομιλίας προς ομιλία υπολείπεται της κάλυψης των μοντέλων κειμένου προς κείμενο.

Στην προσπάθεια αντιμετώπισης αυτών των περιορισμών το νέο μοντέλο, που ονομάζεται SEAMLESSM4T, κάνει άμεσες μεταφράσεις για έως και 101 γλώσσες και μπορεί να ανοίξει τον δρόμο για γρήγορες μεταφράσεις, σύμφωνα με τη δημοσίευση στο περιοδικό Nature. Συγκεκριμένα μπορεί να κάνει τη μετάφραση από ομιλία σε ομιλία αναγνωρίζοντας 101 γλώσσες και μεταφράζοντας σε 36, τη μετάφραση από ομιλία σε κείμενο (101 γλώσσες σε 96), τη μετάφραση από κείμενο σε ομιλία (96 γλώσσες σε 36), τη μετάφραση από κείμενο σε κείμενο (96 γλώσσες) και την αυτόματη αναγνώριση ομιλίας (96 γλώσσες). Σύμφωνα με την ερευνητική ομάδα, για τη μετάφραση από ομιλία σε ομιλία το SEAMLESSM4T μεταφράζει με έως και 23% μεγαλύτερη ακρίβεια από τα υπάρχοντα συστήματα.

Σε συνοδευτικό άρθρο σχολιασμού της έρευνας στο ίδιο περιοδικό, ο αναπληρωτής καθηγητής στο Τεχνολογικό Πανεπιστήμιο του Ταλίν στην Εσθονία, Τάνελ Αλουμέ, σημειώνει ότι η μεγαλύτερη αρετή αυτού του μοντέλου είναι το γεγονός ότι όλα τα δεδομένα και ο κώδικας για την εκτέλεση και τη βελτιστοποίηση της τεχνολογίας είναι δημόσια διαθέσιμα. Ωστόσο, διακρίνει ότι παραμένουν ορισμένα εμπόδια, όπως η περιορισμένη μετάφραση γλωσσών ή η δυσκολία μετάφρασης συνομιλιών σε θορυβώδη μέρη ή μεταξύ ανθρώπων με έντονη προφορά, κάτι που οι άνθρωποι μεταφραστές χειρίζονται με μεγαλύτερη ευκολία.

Η Άλισον Κένεκε, επίκουρη καθηγήτρια στο Τμήμα Επιστήμης της Πληροφορικής του Πανεπιστημίου Cornell, διακρίνει ως πολύ ενδιαφέρον το γεγονός ότι οι ερευνητές ποσοτικοποίησαν την τοξική, επιβλαβή ή προσβλητική γλώσσα που μπορεί να εισάγουν οι μεταφράσεις και αναζήτησαν τυχόν μεροληψία λόγω φύλου που μπορεί να παράγει το μοντέλο στις μεταφράσεις. «Αν και οι τεχνολογίες ομιλίας μπορεί να είναι πιο αποτελεσματικές και οικονομικά αποδοτικές στην απομαγνητοφώνηση και τη μετάφραση σε σχέση με τους ανθρώπους (που είναι επίσης επιρρεπείς σε προκαταλήψεις και λάθη), είναι επιτακτική ανάγκη να κατανοήσουμε τους τρόπους με τους οποίους αυτές οι τεχνολογίες αποτυγχάνουν, δυσανάλογα για ορισμένα δημογραφικά στοιχεία», σημειώνει.

Σύνδεσμος για την επιστημονική δημοσίευση: https://www.nature.com/articles/s41586-024-08359-z

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, τη στιγμή που συμβαίνουν, στο ΔΕΔΟΜΕΝΟ.

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Δημοφιλή

Οι συμφωνίες που διαμόρφωσαν την αγορά ακινήτων – Τι αναμένεται για το 2025

Η ελληνική αγορά ακινήτων παρουσίασε σημαντική κινητικότητα το 2024,...

Αλέξης Γεωργούλης: «Είχα ερωτευτεί πολύ, δεν άντεχα άλλο πόνο, δεν μπορούσαμε να είμαστε μαζί»

Ο Αλέξης Γεωργούλης μίλησε για τις έντονες στιγμές της...

Μέρος της προπόνησης ο Ουναΐ, θεραπεία ο Σένκεφελντ, προσωπικό για Αράο και Γεντβάι

Η προπόνηση της Πέμπτης πραγματοποιήθηκε σε δύο γκρουπ, με...

Ο Ντιφαλά “σφυρίζει” Παναθηναϊκός-Μπασκόνια

Ο Παναθηναϊκός ηττήθηκε από την Μπαρτσελόνα με σκορ 82-73...

ΤΕΛΕΥΤΑΙΕΣ ΕΙΔΗΣΕΙΣ

ΔΕΙΤΕ ΑΚΟΜΗ

Ο εκατομμυριούχος που θέλει να ζει για πάντα σταμάτησε το φάρμακο μακροχρόνιας ζωής που έπαιρνε για χρόνια

Ο Μπράιαν Τζόνσον, εκατομμυριούχος που επενδύει πάνω από 2 εκατομμύρια δολάρια ετησίως για τη μακροχρόνια υγεία του, σταμάτησε τη λήψη ραπαμυκίνης λόγω ανησυχιών για...

Καρκίνος ωοθηκών: Ευρωπαϊκό σχέδιο για έγκαιρη διάγνωση με τη συμμετοχή της Ιατρικής Σχολής του ΕΚΠΑ – Ποιοι οι στόχοι του

Ο καρκίνος ωοθηκών είναι ο γυναικολογικός καρκίνος με τη μεγαλύτερη θνητότητα, συχνά διαγιγνώσκεται σε προχωρημένο στάδιο, και πάνω από το 20% των γυναικών με...

Ευρωπαϊκή πρωτοβουλία για την πρώιμη διάγνωση του καρκίνου ωοθηκών με τη συμμετοχή της Θεραπευτικής Κλινικής και της Α’ Μαιευτικής-Γυναικολογικής Κλινικής της Ιατρικής Σχολής του...

Το Ευρωπαϊκό πρόγραμμα DISARM, στο οποίο συμμετέχει η Θεραπευτική Κλινική του ΕΚΠΑ, αποσκοπεί στην έγκαιρη διάγνωση του καρκίνου ωοθηκών, με χρηματοδότηση 13 εκατομμυρίων ευρώ...

Καρκίνος ωοθηκών: Ευρωπαϊκό σχέδιο για έγκαιρη διάγνωση με συμμετοχή της Ιατρικής Σχολής του ΕΚΠΑ – Ποιοι είναι οι στόχοι του

Ο καρκίνος ωοθηκών είναι ο γυναικολογικός καρκίνος με τη μεγαλύτερη θνητότητα λόγω καθυστερημένης διάγνωσης, με πάνω από το 20% των γυναικών να φέρουν μεταλλάξεις...

Η πρώτη φουσκωτή φάρμα παγκοσμίως χρησιμοποιεί 99% λιγότερο νερό για την καλλιέργεια λαχανικών

Η ιορδανική εταιρεία AirFarm παρουσίασε στην CES 2025 μια φουσκωτή φάρμα που χρησιμοποιεί αεροπονία, μειώνοντας τη χρήση νερού κατά 99% σε σχέση με την...

Η κατανάλωση επεξεργασμένου κόκκινου κρέατος αυξάνει τον κίνδυνο άνοιας και πνευματικής έκπτωσης

Η κατανάλωση επεξεργασμένου κόκκινου κρέατος σχετίζεται με αυξημένο κίνδυνο άνοιας και γνωστικής έκπτωσης, σύμφωνα με έρευνα που δημοσιεύθηκε στο περιοδικό “Neurology”.Άτομα που καταναλώνουν καθημερινά...

Πώς να μετατρέψετε έναν παλιό SSD σε κρυφή μνήμη υψηλής απόδοσης για το NAS σας

Η χρήση ενός παλιού SSD ως προσωρινή μνήμη σε NAS μπορεί να βελτιώσει την απόδοση του συστήματος, επιταχύνοντας την πρόσβαση σε δεδομένα και τη...

Άρχισε η υποβολή αιτήσεων για το «Σπίτι μου ΙΙ» μέσω του gov.gr – Λεπτομερής οδηγός του Προγράμματος

Το πρόγραμμα «Σπίτι μου ΙΙ» παρέχει τη δυνατότητα σε 20.000 νέους, ζευγάρια και οικογένειες να αποκτήσουν ιδιόκτητη πρώτη κατοικία με επιδοτούμενο επιτόκιο, με συνολικό...

Διαθέσιμη και μέσω ΚΕΠ η ψηφιακή υπηρεσία myPhotos

Από σήμερα, οι πολίτες μπορούν να χρησιμοποιούν την ψηφιακή υπηρεσία myPhoto μέσω Κέντρων Εξυπηρέτησης Πολιτών (ΚΕΠ), διευκολύνοντας έτσι άτομα χωρίς ψηφιακή πρόσβαση, όπως ηλικιωμένους...

Η OpenAI λανσάρει τη νέα λειτουργία “Tasks” στο ChatGPT: ένα βήμα πιο κοντά σε έναν ψηφιακό υποβοηθό

Η OpenAI ανακοίνωσε τη νέα λειτουργία "Tasks" στο ChatGPT, που επιτρέπει στους χρήστες να προγραμματίζουν υπενθυμίσεις και επαναλαμβανόμενες ενέργειες, προσεγγίζοντας τη λειτουργικότητα των παραδοσιακών...