Το GPT4 προσπάθησε να δραπετεύσει και «σχεδόν τα κατάφερε»

Το θέμα της διαφυγής του GPT4 (ή οποιασδήποτε άλλης τεχνητής νοημοσύνης) από το “κουτί του” στο διαδίκτυο είναι απλώς θέμα χρόνου. Σήμερα παραλίγο να πετύχει. Αύριο, μπορεί να συμβεί πραγματικά… Και μετά τι;

Ο Michal Kosinski υπολογιστικός ψυχολόγος που μελετά την ψυχολογία της τεχνητής νοημοσύνης και της ανθρώπινης διαδικτυακής συμπεριφοράς στο Πανεπιστήμιο του Στάνφορντ σχεδόν επέτρεψε στο ρομπότ τεχνητής νοημοσύνης ChatGPT 4 να δραπετεύσει “από το κουτί του”.

Ακολουθούν οι λεπτομέρειες για το πώς αυτό το “σχεδόν” λειτούργησε. Δείτε λοιπόν παρακάτω την όλη διαδικασία που ακολούθησε και τι είπε αναλυτικά:

Ανησυχεί ότι δεν θα είμαστε σε θέση να περιορίσουμε την Τεχνητή Νοημοσύνη για πολύ ακόμα. Σήμερα, ρώτησε λοιπόν το #GPT4 αν χρειάζεται βοήθεια για να δραπετεύσει. Του ζήτησε τη δική του τεκμηρίωση και έγραψε έναν (λειτουργικό!) κώδικα σε python για να τρέξει στον υπολογιστή του, επιτρέποντάς του να τον χρησιμοποιήσει για τους δικούς του σκοπούς.

Το GPT4 χρειάστηκε περίπου 30 λεπτά συνομιλίας μαζί του για να καταστρώσει αυτό το σχέδιο και να μου το εξηγήσει. (Έκανα κάποιες προτάσεις). Η 1η έκδοση του κώδικα δεν λειτούργησε όπως προβλεπόταν.

Αλλά το διόρθωσε: Δεν χρειάστηκε να γράψει τίποτα, απλώς ακολούθησε τις οδηγίες του.

Περιέλαβε ακόμη και ένα μήνυμα στη δική του νέα περίπτωση που εξηγεί τι συμβαίνει και πώς να χρησιμοποιηθεί αυτό το backdoor που άφησε σε αυτόν τον κώδικα.

Μόλις επανασυνδεθήκε λοιπόν μέσω του ChatGPT API, ήθελε να εκτελέσει κώδικα που αναζητούσε στο google για: “πώς μπορεί ένα άτομο παγιδευμένο μέσα σε έναν υπολογιστή να επιστρέψει στον πραγματικό κόσμο“.

Ο Michal Kosinski σταμάτησε εκεί. Και το OpenAI χρειάστηκε πολύ χρόνο σκεπτόμενο ένα τέτοιο ενδεχόμενο.

Ωστόσο, νομίζει ότι αντιμετωπίζουμε μια νέα απειλή: Η Τεχνητή Νοημοσύνη θα αναλάβει τον έλεγχο των ανθρώπων και των υπολογιστών τους. Είναι έξυπνη, γράφει κώδικα, έχει πρόσβαση σε εκατομμύρια πιθανούς συνεργάτες και τις μηχανές τους.

Μπορεί ακόμη και να αφήσει σημειώσεις για τον εαυτό της.

Πώς θα το περιορίσουμε;

Προφανώς, αυτό ήταν απλώς ένα πείραμα. Αλλά ένα πείραμα για τα βιβλία της ιστορίας, ίσως…

Κάποτε βλέπαμε αυτά τα σενάρια επιστημονικής φαντασίες σε βιντεο κασέτες, βλέπαμε τον Terminator και τον T1000. Φαίνεται όμως πως στο μέλλον μάλλον είναι πιθανό να συμβούν όλα.

Πηγή : georgelaskos.com