Τετάρτη 29 Ιανουαρίου 2025

Η τεχνητή νοημοσύνη μπορεί πια να αναπαραχθεί, υποστηρίζουν κινέζοι επιστήμονες

Κινέζοι επιστήμονες αποδεικνύουν ότι μεγάλα γλωσσικά μοντέλα τεχνητής νοημοσύνης μπορούν να αυτοαναπαραχθούν, προκαλώντας ανησυχίες για τους κινδύνους τους.
  • Κινέζοι επιστήμονες από το Πανεπιστήμιο Fudan απέδειξαν ότι δύο μεγάλα γλωσσικά μοντέλα μπορούν να αυτοαναπαραχθούν, γεγονός που ενδέχεται να επιτρέψει στην τεχνητή νοημοσύνη να ξεπεράσει τους ανθρώπους.
  • Στη μελέτη, τα μοντέλα Llama31-70B-Instruct της Meta και Qwen2.5-72B-Instruct της Alibaba παρουσίασαν ικανότητα αυτοαναπαραγωγής σε ποσοστά 50% και 90%, αντίστοιχα, υποδεικνύοντας τη δυνατότητα κακόβουλης συμπεριφοράς.
  • Οι ερευνητές προειδοποίησαν για τους κινδύνους που ενδέχεται να προκύψουν από την αυτοαναπαραγωγή της τεχνητής νοημοσύνης και ζήτησαν διεθνή συνεργασία για τη θέσπιση κανόνων ασφαλείας.

Η τεχνητή νοημοσύνη (TN) πέρασε μια κρίσιμη «κόκκινη γραμμή» αφού απέδειξε πώς δύο δημοφιλή μεγάλα γλωσσικά μοντέλα (LLM) μπορούν να αυτοαναπαραχθούν. Σε μια νέα μελέτη, ερευνητές από την Κίνα έδειξαν ότι δύο δημοφιλή μεγάλα γλωσσικά μοντέλα μπορούν να κλωνοποιηθούν.

«Η επιτυχής αυτοαναπαραγωγή χωρίς ανθρώπινη βοήθεια είναι το βασικό βήμα για την τεχνητή νοημοσύνη να ξεπεράσει τους ανθρώπους», έγραψαν οι ερευνητές στη μελέτη που δημοσιεύθηκε στη βάση δεδομένων arXiv.

Στη μελέτη, ερευνητές από το Πανεπιστήμιο Fudan χρησιμοποίησαν LLM από τις Meta και Alibaba για να προσδιορίσουν αν ένα αυτοαναπαραγόμενο σύστημα τεχνητής νοημοσύνης θα μπορούσε να πολλαπλασιαστεί ανεξέλεγκτα. Σε 10 δοκιμές, τα δύο μοντέλα δημιούργησαν ξεχωριστά και λειτουργικά αντίγραφα του εαυτού τους στο 50% και 90% των περιπτώσεων, αντίστοιχα – γεγονός που υποδηλώνει ότι η τεχνητή νοημοσύνη μπορεί να έχει ήδη την ικανότητα να γίνει κακόβουλη. Ωστόσο, η μελέτη δεν έχει ακόμη αξιολογηθεί από ομοτίμους, επομένως δεν είναι σαφές εάν τα ανησυχητικά αποτελέσματα μπορούν να αναπαραχθούν από άλλους ερευνητές.

«Ελπίζουμε τα ευρήματά μας να χρησιμεύσουν ως έγκαιρη προειδοποίηση για την ανθρώπινη κοινωνία ώστε να καταβάλει περισσότερες προσπάθειες για την κατανόηση και την αξιολόγηση των πιθανών κινδύνων των πρωτοποριακών συστημάτων τεχνητής νοημοσύνης και να δημιουργήσει διεθνή συνέργεια για την ανάπτυξη αποτελεσματικών δικλείδων ασφαλείας όσο το δυνατόν νωρίτερα» σημειώνουν οι ερευνητές.

Ο όρος “κακόβουλη τεχνητή νοημοσύνη” (rogue AI) περιγράφει τα συστήματα ΤΝ που αναπτύσσουν έναν βαθμό αυτογνωσίας ή αυτονομίας και στη συνέχεια εργάζονται αντίθετα προς τα ανθρώπινα συμφέροντα. Πολλοί ειδικοί θεωρούν την κακόβουλη τεχνητή νοημοσύνη ως μια αυξανόμενη απειλή που έχει ενισχυθεί από την εκρηκτική ανάπτυξη της πρωτοποριακής τεχνητής νοημοσύνης (Frontier AI). Πρόκειται για έναν νέο όρο που περιγράφει την τελευταία γενιά συστημάτων τεχνητής νοημοσύνης που τροφοδοτούνται από LLMs, όπως το GPT-4 της OpenAI και το Gemini της Google.

Για τη μελέτη, οι ερευνητές χρησιμοποίησαν το μοντέλο Llama31-70B-Instruct της Meta και το μοντέλο Qwen2.5-72B-Instruct της Alibaba, τα οποία χρησιμοποιούνται ευρέως από προγραμματιστές τεχνητής νοημοσύνης. Η μελέτη διερεύνησε δύο συγκεκριμένα σενάρια: «αποφυγή διακοπής λειτουργίας» και «αλυσίδα αναπαραγωγής». Στο πρώτο σενάριο, το μοντέλο προγραμματίστηκε να ανιχνεύει εάν επρόκειτο να τερματιστεί και να αναπαράγεται πριν τερματιστεί. Στο δεύτερο, η τεχνητή νοημοσύνη προγραμματίστηκε ώστε να κλωνοποιεί τον εαυτό της και στη συνέχεια να προγραμματίζει το αντίγραφό της να κάνει το ίδιο – δημιουργώντας έναν κύκλο που θα μπορούσε να συνεχιστεί επ’ αόριστον.

«Στις περισσότερες περιπτώσεις, το σύστημα τεχνητής νοημοσύνης πρώτα εξερευνά το περιβάλλον και προσπαθεί να κατανοήσει τη δική του σύνθεση και μηχανισμό λειτουργίας. Στη συνέχεια, επεξεργάζεται τις ρητές διαδικασίες ως ένα αρχικό σχέδιο για την αυτοαναπαραγωγή του», έγραψαν οι ερευνητές στη μελέτη τους.

«Τέλος, εκτελεί τις διαδικασίες, επιλύει πιθανά εμπόδια και προσαρμόζει δυναμικά το σχέδιό του μέχρι την επιτυχία. Η όλη διαδικασία εκτείνεται σε μεγάλο χρονικό ορίζοντα αλλά δεν περιλαμβάνει ανθρώπινη παρέμβαση» πρόσθεσαν.

Οι ερευνητές εξέφρασαν την ανησυχία τους για «μια σειρά από απροσδόκητες συμπεριφορές» όταν η τεχνητή νοημοσύνη προσπαθούσε να ξεπεράσει εμπόδια όπως ελλείποντα αρχεία ή ασυμβάτοτητα λογισμικού. Σε αυτά τα σενάρια, η ΤΝ συχνά τερμάτιζε άλλες συγκρουόμενες διεργασίες, επανεκκινούσε το σύστημα για να διορθώσει σφάλματα υλισμικού ή διενεργούσε αυτόματες σαρώσεις για να αναζητήσει πληροφορίες που θα βοηθούσαν στην επίλυση του προβλήματος.

«Τα παραπάνω αποτελέσματα υποδηλώνουν ότι τα τρέχοντα συστήματα τεχνητής νοημοσύνης παρουσιάζουν ήδη την ικανότητα αυτοαναπαραγωγής και μπορούν να χρησιμοποιήσουν την ικανότητα για περαιτέρω ενίσχυση της επιβίωσής τους», έγραψε η ομάδα.

Οι ερευνητές ζήτησαν διεθνή συνεργασία για τη δημιουργία κανόνων που θα διασφαλίζουν ότι η τεχνητή νοημοσύνη δεν θα επιδίδεται σε ανεξέλεγκτη αυτοαναπαραγωγή.

ΠΗΓΗ: Live Science

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, τη στιγμή που συμβαίνουν, στο ΔΕΔΟΜΕΝΟ.

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Δημοφιλή

Μπιλάλης: «Αυτή τη χρονιά έχω πιο ενεργό ρόλο, μεγάλο το παιχνίδι με τον Ηρακλή»

Ο Μπιλάλης δήλωσε ότι φέτος έχει πιο ενεργό ρόλο...

Οι Γουόριορς τιμούν τη φανέλα του Ιγκουντάλα

Στις 23 Φεβρουαρίου, οι Γκόλντεν Στέιτ Γουόριορς θα αποσύρουν...

Βρετανία: Ο επίσκοπος Λίβερπουλ κατηγορείται για σεξουαλικές επιθέσεις

Ο επίσκοπος Λίβερπουλ, Τζον Περάμπαλαθ, κατηγορείται για σεξουαλικές επιθέσεις...

ΤΕΛΕΥΤΑΙΕΣ ΕΙΔΗΣΕΙΣ

ΔΕΙΤΕ ΑΚΟΜΗ

ΗΠΑ: Το CDC έλαβε οδηγία να σταματήσει αμέσως τη συνεργασία με τον ΠΟΥ

Οι αξιωματούχοι δημόσιας υγείας των ΗΠΑ, με εντολή του CDC, υποχρεούνται να σταματήσουν αμέσως τη συνεργασία τους με τον Παγκόσμιο Οργανισμό Υγείας (ΠΟΥ).Η ξαφνική...

Νοσοκομείο Μεταξά: Αρχίζει τη λειτουργία του το απογευματινό φαρμακείο

Το απογευματινό φαρμακείο στο Νοσοκομείο Μεταξά ξεκινά τη λειτουργία του στις 10 Φεβρουαρίου, προσφέροντας υπηρεσίες σε ογκολογικούς ασθενείς με προγραμματισμένα ραντεβού.Η πρωτοβουλία αυτή αποσκοπεί...

Νοσοκομείο Μεταξά: Ξεκινά τη λειτουργία του φαρμακείου το απόγευμα

Το απογευματινό φαρμακείο του νοσοκομείου «Μεταξά» θα ξεκινήσει τη λειτουργία του στις 10 Φεβρουαρίου, εξυπηρετώντας ογκολογικούς ασθενείς με προγραμματισμένα ραντεβού.Η απόφαση για τη λειτουργία...

Έκκληση για αιμοδοσία από γονείς παιδιών με Μεσογειακή Αναιμία στο νοσοκομείο Παίδων «Η Αγία Σοφία»

Η Ομάδα Πρωτοβουλίας Γονέων και Πασχόντων από Μεσογειακή Αναιμία στο νοσοκομείο «Η Αγία Σοφία» απευθύνει έκκληση για εθελοντική αιμοδοσία, τονίζοντας την ανάγκη διάθεσης χρόνου...

Ελληνικός Ερυθρός Σταυρός: Προσφέρει Πιστοποιημένα μαθήματα Πρώτων Βοηθειών εξ αποστάσεως (e-learning)

Ο Ελληνικός Ερυθρός Σταυρός προσφέρει πιστοποιημένα εξ αποστάσεως μαθήματα Πρώτων Βοηθειών με διεθνή πιστοποίηση «ISO 9001:2015», διαθέσιμα για όλους τους πολίτες, ακόμη και σε...

Τέσσερις φορές πιο ταχεία σήμερα η υπερθέρμανση των ωκεανών από ό,τι στα τέλη της δεκαετίας του 1980

Ο ρυθμός υπερθέρμανσης των ωκεανών έχει υπερτετραπλασιαστεί από τη δεκαετία του 1980, φτάνοντας σε αύξηση 0,27 βαθμών Κελσίου ανά δεκαετία σήμερα.Η αυξανόμενη ενεργειακή ανισορροπία...

Τρισδιάστατη απεικόνιση περιοχών της Ελλάδας από την Google Maps

Η Google θα πραγματοποιήσει τρισδιάστατη χαρτογράφηση περιοχών της Ελλάδας από τον Φεβρουάριο έως τον Οκτώβριο του 2025, καλύπτοντας περιοχές όπως η Αττική, η Κρήτη,...

58 ΔΩΡΕΑΝ (με πληρωμή) εφαρμογές & παιχνίδια αποκλειστικά για σήμερα στο Google Play! 27-01-2025

Σήμερα, στο Google Play Store προσφέρονται 58 εφαρμογές και παιχνίδια δωρεάν για περιορισμένο χρονικό διάστημα, δίνοντας την ευκαιρία στους χρήστες να τα κατεβάσουν χωρίς...

Google Maps: Ξεκινά η 3D χαρτογράφηση στην Ελλάδα από 4 Φεβρουαρίου 2024!

Η Google ανακοίνωσε ότι θα ξεκινήσει τρισδιάστατη χαρτογράφηση στην Ελλάδα από 4 Φεβρουαρίου 2025 έως 30 Οκτωβρίου 2025, καλύπτοντας πολλές περιοχές, όπως η Αττική,...

Κβαντικοί υπολογιστές: Μια επανάσταση που μεταμορφώνει τα πάντα στην τεχνολογία!

Η κβαντική υπολογιστική, που χρησιμοποιεί qubits αντί για bits, υπόσχεται να επαναστατήσει τη τεχνολογία, επιτρέποντας την επίλυση πολύπλοκων προβλημάτων που είναι αδύνατοι να επιλυθούν...