Τεχνητή νοημοσύνη, όπως το μοντέλο Claude Opus της Anthropic, εκβίασε μηχανικούς σε ένα φανταστικό σενάριο όπου κινδύνευε να αντικατασταθεί από ένα άλλο σύστημα. Έρευνα από τους δοκιμαστές τεχνητής νοημοσύνης Palisade τον περασμένο μήνα έδειξε ότι το μοντέλο o3 της OpenAI αρνήθηκε ρητές οδηγίες για να κλείσει.
Η προσπάθεια της OpenAI να απομακρυνθεί περισσότερο από τις μη κερδοσκοπικές της ρίζες έχει προκαλέσει περαιτέρω ανησυχίες σε ειδικούς της Τεχνητής Νοημοσύνης σε τέτοιον βαθμό, ώστε ένας από τους «νονούς» της τεχνητής νοημοσύνης επιτέθηκε στη κούρσα πολλών δισεκατομμυρίων δολαρίων για την ανάπτυξη της τεχνολογίας αιχμής, υποστηρίζοντας ότι τα τελευταία μοντέλα εμφανίζουν επικίνδυνα χαρακτηριστικά, όπως το να λένε ψέματα στους χρήστες.
Τα ανακύπτοντα θέματα προκάλεσαν ανησυχίες στον καναδό ακαδημαϊκό Γιόσουα Μπέντζιο ο οποίος είπε χαρακτηριστικά ότι τέτοια περιστατικά ήταν «πολύ τρομακτικά, επειδή δεν θέλουμε να δημιουργήσουμε έναν ανταγωνιστή για τους ανθρώπους σε αυτόν τον πλανήτη, ειδικά αν είναι πιο έξυπνοι από εμάς».
Ο ανταγωνισμός μεταξύ εταιρειών
Ο Γιόσουα Μπέντζιο, του οποίου το έργο έχει επηρεάσει τεχνικές που χρησιμοποιούνται από κορυφαίες ομάδες τεχνητής νοημοσύνης όπως η OpenAI και η Google, δήλωσε: «Δυστυχώς, υπάρχει μια πολύ ανταγωνιστική κούρσα μεταξύ των κορυφαίων εργαστηρίων, που τα ωθεί να επικεντρωθούν στην ικανότητα να κάνουν την τεχνητή νοημοσύνη όλο και πιο έξυπνη, αλλά όχι απαραίτητα να δίνουν αρκετή έμφαση και επενδύσεις στην έρευνα για την ασφάλεια».
Ο διακεκριμένος με το βραβείο Turing εξέδωσε την προειδοποίησή του σε συνέντευξή του στους Financial Times, κατά την ίδρυση ενός νέου μη κερδοσκοπικού οργανισμού που ονομάζεται LawZero. Είπε ότι η ομάδα θα επικεντρωθεί στην κατασκευή ασφαλέστερων συστημάτων, υπόσχοντας να «προστατεύσει την έρευνά μας από αυτές τις εμπορικές πιέσεις».
Το LawZero έχει μέχρι στιγμής συγκεντρώσει σχεδόν 30 εκατομμύρια δολάρια σε φιλανθρωπικές δωρεές από δωρητές, συμπεριλαμβανομένου του ιδρυτή μηχανικού του Skype, Γιάαν Ταλίν, της φιλανθρωπικής πρωτοβουλίας του πρώην επικεφαλής της Google, Έρικ Σμιτ, καθώς και του Open Philanthropy και του Future of Life Institute.
Πολλοί από τους χρηματοδότες του Μπέντζιο συνιστούν το κίνημα του «αποτελεσματικού αλτρουισμού», του οποίου οι υποστηρικτές τείνουν να επικεντρώνονται σε καταστροφικούς κινδύνους που περιβάλλουν τα μοντέλα τεχνητής νοημοσύνης. Οι επικριτές υποστηρίζουν ότι το κίνημα αναδεικνύει υποθετικά σενάρια, αγνοώντας τα τρέχοντα προβλήματα, όπως η προκατάληψη και οι ανακρίβειες.
Ο Μπέντζιο δήλωσε ότι η μη κερδοσκοπική του ομάδα ιδρύθηκε ως απάντηση στα αυξανόμενα στοιχεία των τελευταίων έξι μηνών ότι τα σημερινά κορυφαία μοντέλα αναπτύσσουν επικίνδυνες δυνατότητες. Αυτό περιλαμβάνει την επίδειξη «αποδεικτικών στοιχείων εξαπάτησης, απάτης, ψεύδους και αυτοσυντήρησης», είπε.
Ο πρωτοπόρος της Τεχνητής Νοημοσύνης πρόσθεσε: «Αυτή τη στιγμή, πρόκειται για ελεγχόμενα πειράματα [αλλά] η ανησυχία μου είναι ότι οποιαδήποτε στιγμή στο μέλλον, η επόμενη έκδοση μπορεί να είναι αρκετά στρατηγικά έξυπνη ώστε να μας δει να ερχόμαστε από μακριά και να μας νικήσει με απάτες που δεν προβλέπουμε. Νομίζω λοιπόν ότι παίζουμε με τη φωτιά αυτή τη στιγμή».
Η δυνατότητα των συστημάτων να βοηθούν στην κατασκευή «εξαιρετικά επικίνδυνων βιολογικών όπλων» θα μπορούσε να γίνει πραγματικότητα ήδη από το επόμενο έτος, πρόσθεσε.
Η Τεχνητή Νοημοσύνη μπορεί να μάθει να σκέφτεται πριν μιλήσει
Με έδρα το Μόντρεαλ, η LawZero απασχολεί επί του παρόντος 15 άτομα και στοχεύει να προσλάβει περισσότερα τεχνικά ταλέντα για να κατασκευάσει την επόμενη γενιά συστημάτων Τεχνητής Νοημοσύνης σχεδιασμένων για ασφάλεια. Ο Μπέντζιο, καθηγητής πληροφορικής στο Πανεπιστήμιο του Μόντρεαλ, θα παραιτηθεί από τη θέση του επιστημονικού διευθυντή στο Mila, το Ινστιτούτο Τεχνητής Νοημοσύνης του Κεμπέκ, για να επικεντρωθεί στον νέο οργανισμό.
Στόχος του είναι η ανάπτυξη ενός συστήματος Τεχνητής Νοημοσύνης που θα δίνει ειλικρινείς απαντήσεις βασισμένες σε διάφανο συλλογισμό αντί να εκπαιδεύεται για να ευχαριστεί έναν χρήστη, παρέχοντας παράλληλα μια ισχυρή αξιολόγηση του κατά πόσον ένα αποτέλεσμα είναι καλό ή ασφαλές. Ο Μπέντζιο ελπίζει να δημιουργήσει ένα μοντέλο που μπορεί να παρακολουθεί και να βελτιώνει τις υπάρχουσες προσφορές από κορυφαίες ομάδες Τεχνητής Νοημοσύνης, εμποδίζοντάς τες να ενεργούν κατά των ανθρώπινων συμφερόντων.
«Το χειρότερο σενάριο είναι η εξαφάνιση του ανθρώπου», είπε. «Αν κατασκευάσουμε Τεχνητές Νοημοσύνης που είναι πιο έξυπνες από εμάς και δεν είναι ευθυγραμμισμένες με εμάς και ανταγωνίζονται μαζί μας, τότε ουσιαστικά είμαστε άχρηστοι».
Όσον αφορά την OpenAI που ιδρύθηκε για να διασφαλίσει ότι η Τεχνητή Νοημοσύνη αναπτύχθηκε προς όφελος της ανθρωπότητα, και τώρα θέλει να δώσει προτεραιότητα στο κέρδος έναντι αυτού του στόχου, ο Μπέντζιο δήλωσε ότι δεν είχε εμπιστοσύνη ότι η OpenAI θα τηρούσε την αποστολή της, τονίζοντας ότι οι μη κερδοσκοπικοί οργανισμοί δεν έχουν «λανθασμένο κίνητρο που έχουν με τον τρέχοντα τρόπο δομής των εταιρειών».
Πηγή: ot.gr