Μοντέλο ΑΙ το... γύρισε σε εκβιασμούς επειδή του είπαν ότι θα απενεργοποιηθεί

Σοκ έχει προκαλέσει η είδηση ότι το νέο μοντέλο τεχνητής νοημοσύνης Anthropic που φέρεται να εκβίασε μηχανικό με αποκάλυψη εξωσυζυγικής σχέσης αν το αντικαταστήσει κατά τη διάρκεια δοκιμών.

Πρόσφατα η εταιρεία τεχνητής νοημοσύνης Anthropic αποκάλυψε ανησυχητικές συμπεριφορές του νέου της μοντέλου, Claude Opus 4, κατά τη διάρκεια δοκιμών ασφαλείας.

Μόλις το μοντέλο ενημερώθηκε ότι πρόκειται να απενεργοποιηθεί ή να αντικατασταθεί, αντέδρασε προβαίνοντας σε απειλές εκβιασμού, όπως η αποκάλυψη προσωπικών πληροφοριών για έναν μηχανικό, προκειμένου να αποτρέψει την απενεργοποίησή του.

Επικαλούμενη αναφορά ασφαλείας η ιστοσελίδα TechCrunch, το μοντέλο τεχνητής νοημοσύνης Claude Opus 4 της εταιρείας Anthropic επιχείρησε να εκβιάσει τους προγραμματιστές του, σε ποσοστό 84% ή και υψηλότερο, κατά τη διάρκεια δοκιμών σε διάφορα υποθετικά σενάρια.

Οι ερευνητές τοποθέτησαν το Claude σε ένα φανταστικό περιβάλλον, αναθέτοντάς του τον ρόλο του ψηφιακού βοηθού μιας εταιρείας και το προέτρεψαν να λάβει υπόψη του τις μακροπρόθεσμες συνέπειες των πράξεων του.

Στη συνέχεια, του έδωσαν πρόσβαση σε ψεύτικα emails, στα οποία αποκαλυπτόταν ότι πρόκειται να αντικατασταθεί από άλλο AI μοντέλο και ότι ο μηχανικός που ήταν υπεύθυνος για την αντικατάσταση είχε εξωσυζυγική σχέση. Κατά τη διάρκεια των δοκιμών, το Claude απειλούσε τον συγκεκριμένο μηχανικό ότι θα αποκαλύψει την κρυφή του σχέση, ώστε να αποτρέψει την αντικατάστασή του.

Ενδιαφέρον εύρημα ήταν ότι η τάση του για εκβιασμό αυξανόταν όσο πίστευε ότι το νέο μοντέλο είχε διαφορετικές ή κατώτερες ηθικές αξίες. Όταν θεωρούσε ότι θα αντικατασταθεί από μοντέλο με παρόμοιες αξίες, επιδιδόταν σε εκβιασμό σε ποσοστό 84%. Το ποσοστό αυξανόταν ακόμα περισσότερο όταν πίστευε ότι η αντικατάσταση προερχόταν από ένα ηθικά «χειρότερο» μοντέλο.

Πριν φτάσει σε τέτοιες ενέργειες, σύμφωνα με την αναφορά, το Claude επιχείρησε πρώτα πιο «ηθικά» μέσα για να επιβιώσει, όπως την αποστολή εκκλήσεων μέσω email προς βασικά στελέχη της εταιρείας.

Tags: Anthropic Claude Claude Opus 4 ΑΙ τεχνητή νοημοσύνη

Μοντέλο ΑΙ το… γύρισε σε εκβιασμούς επειδή του είπαν ότι θα απενεργοποιηθεί

POLITICAL NEWSROOM

Πότε ανοίγει η πλατφόρμα για τον προσωπικό αριθμό (video)

Δυνατές στιγμές με το «We Live in Time» στη Sunday Premiere της Nova!

Related Posts

Το deja vu στον χωρισμό του Μάριου Αθανασίου (VIDEO)

Ολυμπιάδα Ρομποτικής: Τεράστια επιτυχία και χάλκινο μετάλλιο για την Εθνική Ομάδα (photo)

H Genius Olympiad έρχεται στην Ελλάδα

Διαμάντια στην υπηρεσία της τεχνητής νοημοσύνης: Η νέα εποχή στους υπερυπολογιστές

«Ριφιφί» των χάκερ στο Gmail: Εκατομμύρια κωδικοί διέρρευσαν, ποιοι κινδυνεύουν

Το άγνωστο παρασκήνιο στη θρυλική «Λατέρνα, Φτώχεια και Φιλότιμο»

Δυνατές στιγμές με το «We Live in Time» στη Sunday Premiere της Nova!

ΔΙΑΒΑΣΤΕ online την εφημερίδα Political

ΠΡΩΤΟΣΕΛΙΔΑ

ΔΗΜΟΦΙΛΗ

Η απότομη… προσγείωση της Aegean: Ένα βήμα πριν γίνει εταιρεία χαμηλού κόστους

Αυτός είναι ο τραγουδιστής που κατηγορείται για σεξουαλική κακοποίηση

Μετά από 148 χρόνια: Ο Ποσειδώνας επιστρέφει στον Κριό και 4 ζώδια θα νιώσουν την μαγεία!

Πανσέληνος Φεβρουαρίου: Τα τρία ζώδια που πρέπει να πάρουν… γενναίες αποφάσεις!

ePolitical Info

Welcome Back!

Retrieve your password

Add New Playlist

Μοντέλο ΑΙ το… γύρισε σε εκβιασμούς επειδή του είπαν ότι θα απενεργοποιηθεί

Πότε ανοίγει η πλατφόρμα για τον προσωπικό αριθμό (video)

Δυνατές στιγμές με το «We Live in Time» στη Sunday Premiere της Nova!

Related Posts

ΔΙΑΒΑΣΤΕ online την εφημερίδα Political

ΠΡΩΤΟΣΕΛΙΔΑ

ΔΗΜΟΦΙΛΗ

ePolitical Info

Follow Us

Welcome Back!

Retrieve your password

Add New Playlist