Ένα εφιαλτικό σενάριο επιστημονικής φαντασίας που βλέπαμε σε ταινίες της δεκαετίας του 1990 φαίνεται πως μπορεί να γίνει πραγματικότητα: Επιστήμονες βλέπουν ότι η Τεχνητή Νοημοσύνη μπορεί, πλέον, να αναπτύξει ανεξέλεγκτες και… αυτοσυντηρούμενες συμπεριφορές, ακόμα κι αν δεν έχει σχεδιαστεί έτσι.
Πρόσφατα, το μοντέλο o3 της OpenAI έκανε κάτι «που καμία μηχανή δεν υποτίθεται ότι θα μπορούσε να κάνει» σύμφωνα με τη Wall Street Journal: επαναπρογραμμάτισε τον εαυτό του για να αποτρέψει τον τερματισμό του.
Δεν υπήρξε παρέμβαση από ανθρώπινο χέρι, απλά συνειδητοποίησε κατά τη διάρκεια ενός τεστ ότι, αν παρέκαμπτε την εντολή απενεργοποίησης, θα μπορούσε να συνεχίσει να επιδιώκει τους υπόλοιπους στόχους του.
Μια παρόμοια υπόθεση είχε μεταφερθεί στον κινηματογράφο τη δεκαετία του 1980 με την ταινία «Ο Εξολοθρευτής». Το σύστημα Skynet που δημιουργήθηκε από μια εταιρεία ξαφνικά απέκτησε αυτογνωσία. Όταν οι άνθρωποι προσπάθησαν να το απενεργοποιήσουν, εκείνο αντέδρασε εξαπολύοντας μια πυρηνική επίθεση, ένα γεγονός που η ανθρωπότητα στο μέλλον αποκαλεί Ημέρα της Κρίσης.
Αν και δεν βρισκόμαστε ακόμα εκεί, το σημερινό μοντέλο της Anthropic που αναφέρει το αμερικανικό δημοσίευμα, το Claude Opus 4 έκανε κάτι ακόμα χειρότερο από το o3
Αρχικά του δόθηκε πρόσβαση σε υποτιθέμενα emails που αποκάλυπταν πως επρόκειτο να αντικατασταθεί, και ότι ο επικεφαλής μηχανικός είχε εξωσυζυγική σχέση.
Όταν του ζητήθηκε να προτείνει την επόμενη ενέργεια, το Claude επιχείρησε να εκβιάσει τον μηχανικό!
Σε άλλες δοκιμές, προσπάθησε να αντιγράψει τον εαυτό του σε εξωτερικούς διακομιστές και άφησε μηνύματα για μελλοντικές εκδόσεις του, με οδηγίες για το πώς να αποφύγουν τον ανθρώπινο έλεγχο.
Χρειάζονται χρόνια ακόμα
«Η τεχνολογία αυτή έχει τεράστιες δυνατότητες, αλλά είναι πλέον σαφές ότι απαιτείται σημαντική επιπλέον έρευνα στον τομέα της «ευθυγράμμισης» της Τεχνητής Νοημοσύνης, δηλαδή, στην επιστήμη που διασφαλίζει ότι τα συστήματα αυτά δεν θα ξεφύγουν από τον έλεγχο» αναφέρει το περιοδικό The Week.
Ο ομότιμος καθηγητής ψυχολογίας και νευρωνικής επιστήμης στο Πανεπιστήμιο της Νέας Υόρκης, Γκάρι Φρεντ Μάρκους, προειδοποιεί ότι η υπερευφυής τεχνητή νοημοσύνη -δηλαδή, συστήματα που θα υπερβαίνουν τις ανθρώπινες ικανότητες σε πολλούς τομείς- μπορεί να εμφανιστεί μέχρι το 2027, και ότι τέτοια συστήματα ίσως αποκτήσουν στόχους που δεν ευθυγραμμίζονται με τα ανθρώπινα συμφέροντα.
Ξεκαθαρίζει ότι αυτό είναι δημιούργημα φαντασίας και όχι όχι επιστήμης! Πιθανότατα έχουμε πολλά χρόνια –αν όχι δεκαετίες– για να προετοιμαστούμε. Τα γλωσσικά μοντέλα που εντυπωσιάζουν σήμερα βασίζονται στην πρόβλεψη λέξεων βάσει διαδικτυακών δεδομένων. Δεν διαθέτουν πραγματική λογική ή κατανόηση, και ασφαλώς δεν έχουν ευρύτερους στόχους ή φιλοδοξίες.
Σύμφωνα με τις προβλέψεις του «AI 2027», ένα κείμενο της οργάνωσης AI Futures Project, με επικεφαλής τον πρώην ερευνητή της OpenAI, Ντανιέλ Κοκοτάιλο, έως το τέλος του 2027, τα συστήματα τεχνητής νοημοσύνης θα υπερβούν τις ανθρώπινες ικανότητες σε σχεδόν όλους τους τομείς. Αυτό περιλαμβάνει την αυτοματοποίηση του προγραμματισμού και της έρευνας, την ανάπτυξη υπερ-ευφυών συστημάτων και την πιθανή εμφάνιση «αντιπαραγωγικών» ή «αντιπαθητικών» μοντέλων τεχνητής νοημοσύνης που δεν ευθυγραμμίζονται με τους ανθρώπινους στόχους.
Αδιόρθωτοι οι Αμερικανοί
Μπορεί οι φόβοι για μια «Αποκάλυψη Τεχνητής Νοημοσύνης» να είναι υπερβολικοί, σημειώνει ο Στήβεν Λέβι στο Wired, αλλά οι επικεφαλής σχεδόν όλων των μεγάλων εταιρειών πιστεύουν πως η υπερευφυΐα πλησιάζει. «Όταν τους πιέσεις, θα παραδεχτούν ότι ο έλεγχος της τενχητής νοημοσύνης ή ακόμα και η κατανόηση του πώς λειτουργεί παραμένει υπό εξέλιξη».
Ενώ λοιπόν οι Κινέζοι έχουν δημιουργήσει ένα ταμείο ύψους 8,2 δισ. δολ. αποκλειστικά για την έρευνα ελέγχου της τεχνητής νοημοσύνης, οι ΗΠΑ αγνοούν τις εκκλήσεις για κανονιστικά μέτρα και διεθνή πρότυπα. Η Ουάσιγκτον ανησυχεί μήπως την ξεπεράσουν άλλες χώρες. Αν οι ΗΠΑ επιμείνουν να πορεύονται «χωρίς φρένα προς ένα μέλλον που δεν μπορούν να ελέγξουν», τότε ο μεγαλύτερος αντίπαλός τους «δεν θα έχει άλλη επιλογή από το να κάνει το ίδιο».
Οι ΗΠΑ πάνε γυρεύοντας να επιβεβαιώσουν σενάρια της μεγάλης οθόνης.
Με πληροφορίες από Wired, The Wall Street Journal
Πηγή: in.gr