Επιστήμη

Πώς η Τεχνητή Νοημοσύνη γνωρίζει πράγματα που κανείς δεν της έμαθε

Από

23 Μαΐου, 2023

1403

Πηγή: Scientific American, Ριζοσπάστης

Επιμέλεια: Σταύρος Ξενικουδάκης

Ολοι αντιλαμβάνονται ότι η εφαρμογή της Τεχνητής Νοημοσύνης (ΤΝ) θα προκαλέσει αλλαγές στην ανθρώπινη εργασία. Αλλά αν στον σοσιαλισμό θα μπορούσε να συμβάλει π.χ. στην εφαρμογή του 7ωρου – 5ήμερου – 35ωρου, στον καπιταλισμό, όπου η εργατική δύναμη είναι εμπόρευμα, στη λεγόμενη αγορά εργασίας, οι επιπτώσεις θα είναι δυσάρεστες για τους εργαζόμενους. Ωστόσο κανείς δεν ξέρει πώς ακριβώς θα επιδράσουν σε όλες τις πλευρές της κοινωνικής ζωής και διάρθρωσης το ChatGPT της «OpenAI» και της «Microsoft» και οι άλλες εκδοχές ΤΝ, που ήδη προωθούνται από άλλα μονοπώλια, όπως ο όμιλος «Alphabet» (Google). Ενας λόγος που δεν το γνωρίζουμε είναι πως ούτε οι κατασκευαστές τους ξέρουν επακριβώς τι συμβαίνει στο εσωτερικό αυτών των συστημάτων. Σύμφωνα με ορισμένους ειδικούς, αρκετές δοκιμές χρήσης τους δίνουν την εντύπωση ότι αναπτύσσουν κάποιας μορφής εσωτερικά μοντέλα του πραγματικού κόσμου, όπως κάνει και ο ανθρώπινος εγκέφαλος, αλλά με διαφορετικό τρόπο.

Οι επιστήμονες που δουλεύουν στην ανάπτυξη της ΤΝ καταλαβαίνουν πολύ καλά το GPT (Παραγωγικός Προεκπαιδευμένος Μετασχηματιστής) – θεμέλιο του ChatGPT – και τα άλλα Μεγάλα Γλωσσικά Μοντέλα (ΜΓΜ). Τα μοντέλα αυτά βασίζονται σε ένα σύστημα μηχανικής μάθησης, που αποκαλείται νευρωνικό δίκτυο. Τέτοια δίκτυα έχουν δομή, που βασίζεται σε γενικές γραμμές στον τρόπο με τον οποίο συνδέονται οι νευρώνες στον ζωικό εγκέφαλο. Ο κώδικας γι’ αυτά τα προγράμματα είναι σχετικά απλός και όχι ιδιαίτερα εκτενής. Δημιουργεί έναν αυτοδιορθωνόμενο αλγόριθμο, που επιλέγει την πιο πιθανή λέξη για τη συμπλήρωση μιας φράσης, αξιοποιώντας προηγούμενη κοπιώδη στατιστική ανάλυση εκατοντάδων γιγαμπάιτ κειμένου από το Διαδίκτυο και όχι μόνο. Επιπλέον εκπαίδευση του συστήματος επιτρέπει την παρουσίαση των αποτελεσμάτων με τη μορφή διαλόγου. Με μια έννοια, αυτό που κάνουν είναι να αναμασούν ό,τι έχουν μάθει. Λειτουργούν ως «στοχαστικοί παπαγάλοι».

Αναδυόμενες ικανότητες

Πάντως, το γεγονός πως το GPT και άλλα συστήματα ΤΝ φαίνεται να εκτελούν εργασίες για τις οποίες δεν εκπαιδεύτηκαν, εκδηλώνοντας «αναδυόμενες ικανότητες», έχει ξαφνιάσει ακόμη και ερευνητές οι οποίοι γενικά βλέπουν με σκεπτικισμό τον θόρυβο για τα ΜΓΜ. Τα μοντέλα αυτά έχουν μεταξύ άλλων την ικανότητα να συντάσσουν κώδικα προγραμματισμού, πράγμα εντυπωσιακό, αλλά όχι απρόσμενο, καθώς υπάρχουν τεράστιες ποσότητες κώδικα στο Διαδίκτυο, για να τον μιμηθούν.

Αν και τα ΜΓΜ λειτουργούν με τη βοήθεια υπολογιστή, τα ίδια δεν είναι υπολογιστές. Δεν διαθέτουν κρίσιμα στοιχεία των υπολογιστών, όπως η λειτουργική μνήμη. Σε μια έμμεση αναγνώριση ότι το GPT δεν θα πρέπει να μπορεί να εκτελέσει κώδικα που παράγει, η «OpenAI» εισήγαγε στη λειτουργία του ένα εξειδικευμένο εργαλείο, που είναι απαραίτητο να προστεθεί ώστε το chatbot να αποκτήσει την ικανότητα αυτή. Ομως, ορισμένα πειράματα που έγιναν χωρίς αυτήν την πρόσθετη δυνατότητα, π.χ. για την εύρεση του 83ου αριθμού Φιμπονάτσι, δείχνουν ότι ίσως με κάποιον τρόπο αξιοποίησε τους μηχανισμούς για την εύρεση των σωστών επόμενων λέξεων, ώστε να κάνει υπολογισμούς με αριθμούς, θυμίζοντας τον τρόπο που η φύση επαναχρησιμοποιεί υπάρχουσες δυνατότητες για να επιτελεστούν νέες λειτουργίες. Αυτά είναι βεβαίως εικασίες, καθώς δεν μπορεί να δοθεί επακριβής εξήγηση για τον τρόπο λειτουργίας των ΜΓΜ.

Σε μελέτη που πραγματοποίησαν ερευνητές του Πανεπιστημίου Χάρβαρντ με μια μικρότερη εκδοχή του νευρωνικού δικτύου του GPT, το εκπαίδευσαν με εκατομμύρια ακολουθίες κινήσεων του παιχνιδιού στρατηγικής Othello, μέχρι που έγινε ένας σχεδόν τέλειος παίχτης. Μετά πείραξαν κάποιους «νευρώνες» του δικτύου αλλάζοντας το χρώμα ορισμένων πιονιών, όπως θα πείραζαν ανθρώπινους εγκεφαλικούς νευρώνες και το δίκτυο προσάρμοσε τις παραπέρα κινήσεις του ανάλογα. Συμπέραναν ότι το νευρωνικό δίκτυο του μίνι GPT πρέπει να είχε με κάποιον τρόπο μάθει τους κανόνες του Othello και να έβρισκε την καλύτερη επόμενη κίνηση με βάση αυτούς. Υπό μια έννοια είχε συναγάγει τη δομή ενός συστήματος του εξωτερικού κόσμου και δεν περιοριζόταν απλώς σε απλές κινήσεις του παιχνιδιού. Θα μπορούσε, βέβαια, να πει κανείς ότι στην εκτίμηση αυτή υπάρχει μια δόση ανθρωπομορφισμού.

Αναπαράσταση

Σε ένα κάπως πιο ξεκάθαρο πείραμα, ερευνητές του MIT (Τεχνολογικό Ινστιτούτο της Μασαχουσέτης) μελέτησαν νευρωνικά δίκτυα που έπαιζαν ένα παιχνίδι βασισμένο σε κείμενο. Το τροφοδοτούσαν με φράσεις του τύπου «το κλειδί βρίσκεται μέσα στο σεντούκι του θησαυρού», ακολουθούμενες από φράσεις όπως «παίρνεις το κλειδί». Διαπίστωσαν ότι το δίκτυο κωδικοποιούσε μεταβλητές που αντιστοιχούσαν στο «σεντούκι» και στο «εσύ (σ.σ. παίρνεις)», με καθεμιά να έχει την ιδιότητα να κατέχει το κλειδί ή όχι και τις μεταβλητές να ενημερώνονται μετά από κάθε φράση που τροφοδοτούνταν στο σύστημα. Το σύστημα δεν είχε ανεξάρτητο τρόπο να καταλάβει τι είναι ένα σεντούκι ή ένα κλειδί, ωστόσο ξεχώρισε τις έννοιες που χρειαζόταν για να ανταποκριθεί στο έργο που του τέθηκε. Οι επιστήμονες συμπέραναν απ’ αυτό ότι υπάρχει κάποια αναπαράσταση της εξωτερικής κατάστασης μέσα στο μοντέλο.

Στους επιστήμονες κάνει εντύπωση πόσο πολλά μπορούν να μάθουν τα ΜΓΜ από το κείμενο. Ερευνητές διαπίστωσαν ότι αυτά τα δίκτυα ενσωματώνουν περιγραφές χρωμάτων από το Διαδίκτυο και κατασκευάζουν εσωτερικές αναπαραστάσεις των χρωμάτων. Οταν συναντούν τη λέξη «κόκκινο» την επεξεργάζονται όχι σαν ένα αφηρημένο σύμβολο, αλλά ως έννοια που έχει συγκεκριμένη σχέση με όλες τις αποχρώσεις του κόκκινου. Για να το αποδείξουν προσπάθησαν να αποπροσανατολίσουν το σύστημα λέγοντάς του ότι το κόκκινο είναι στην πραγματικότητα παρόμοιο με το πράσινο. Αντί μετά απ’ αυτό να παπαγαλίσει μια λαθεμένη απάντηση, οι χρωματικοί υπολογισμοί του δικτύου άλλαξαν κατάλληλα, ώστε να συνεχίσει να δίνει τους σωστούς συσχετισμούς χρωμάτων.

Μετεκπαίδευση

Αλλοι ειδικοί σημειώνουν την ικανότητα των ΜΓΜ να μαθαίνουν ακόμη και μετά τη …βασική εκπαίδευσή τους, καθώς αυτή η εκπαίδευση απαιτεί υπολογιστικά έντονες διαδικασίες κατά τις οποίες οι εκπαιδευτές τροφοδοτούν το σύστημα με τεράστιο όγκο δεδομένων, που διαμορφώνει τις εσωτερικές διασυνδέσεις του νευρωνικού δικτύου. Ωστόσο, το ChatGPT δείχνει να μαθαίνει από κάθε αλληλεπίδραση με τους χρήστες του και μετά την εκπαίδευσή του. Αξιοποιώντας αυτό το γεγονός, πολλοί πειθαναγκάζουν το σύστημα να υπερβεί τους κανόνες που του έχουν τεθεί και να δώσει πληροφορίες που του έχει απαγορευθεί να δίνει ή να δώσει απαντήσεις πιο δημιουργικές από τις τυπικές, που δίνει όταν ερωτάται ευθέως.

Ενα άλλο είδος μάθησης κατά τη διαδικασία συμβαίνει όταν ζητηθεί από το δίκτυο να περιγράψει κάθε βήμα της συλλογιστικής του. Τότε γίνεται καλύτερο σε προβλήματα λογικής και αριθμητικής, που απαιτούν πολλαπλά βήματα. Ερευνα του 2022 είχε δείξει ότι η μάθηση κατά τη διαδικασία είναι παρόμοια με την υπολογιστική διαδικασία τυπικής μάθησης, που ονομάζεται κάθοδος με βάση την κλίση. Ομως, αυτή η διαδικασία δεν προγραμματίστηκε στο νευρωνικό δίκτυο. Την ανακάλυψε μόνο του, χωρίς βοήθεια. Ερευνητές εκτιμούν ότι τα ΜΓΜ ίσως έχουν και άλλες ικανότητες που κανείς δεν έχει ανακαλύψει μέχρι τώρα, καθώς κάθε φορά που ελέγχουν για μια ικανότητα την οποία μπορούν να ποσοτικοποιήσουν, την εντοπίζουν στα μοντέλα.

Αν και τα ΜΓΜ δεν μπορούν να θεωρηθούν Τεχνητή Γενική Νοημοσύνη (ΤΓΝ), δηλαδή μηχανές που πετυχαίνουν την ευρηματικότητα των ζωικών εγκεφάλων, οι ικανότητές τους που ανακαλύπτονται από μέρα σε μέρα κάνουν ορισμένους ειδικούς να εκτιμούν ότι η ΤΓΝ είναι πιο κοντά απ’ ό,τι πίστευαν πολλοί. Η αρθρωτή δομή που έχει δώσει η «OpenAI» στο ChatGPT, σύμφωνα με ορισμένους, μοιάζει με τη δομή του ανθρώπινου εγκεφάλου και η προσάρτηση στο chatbot διαφόρων επεκτάσεων, μπορεί να οδηγήσει προς μια παρόμοια με την ανθρώπινη εξειδίκευση λειτουργιών.

Λάθος δρόμος

Την ίδια ώρα, ερευνητές ανησυχούν επειδή η δυνατότητά τους να μελετήσουν τέτοια συστήματα περιορίζεται διαρκώς. Η «OpenAI» δεν έχει αποκαλύψει τις λεπτομέρειες του σχεδιασμού και της εκπαίδευσης του GPT-4, καθώς αποτελεί το όπλο που χρησιμοποιεί η «Microsoft» στον ανταγωνισμό της με την «Google» και άλλα μονοπώλια. Η έλλειψη διαφάνειας δεν βλάπτει μόνο τους ερευνητές. Περιορίζει και τις προσπάθειες κατανόησης των κοινωνικών επιπτώσεων που θα προκύψουν από τη σπουδή υιοθέτησης της τεχνολογίας ΤΝ στο κυνήγι του κέρδους. Η διαφάνεια γι’ αυτά τα μοντέλα είναι το πιο σημαντικό πράγμα, ώστε να εξασφαλιστεί η ασφάλειά τους, εκτιμούν επιστήμονες.

Στο μεταξύ, η «Google» ανακοίνωσε πριν από μερικές μέρες ότι επίκειται η ενσωμάτωση λειτουργιών ΤΝ στη μηχανή αναζήτησής της, με τη διατύπωση οποιουδήποτε ερωτήματος σε αυτή να εμφανίζει και μια απάντηση από το δικό της chatbot. Ανακοίνωσε επίσης το PaLM 2, το δικό της ΜΓΜ, με το οποίο θα ανταγωνιστεί το GPT-4. Σκοπεύει ακόμη να επεκτείνει την πρόσβαση στο chatbot Bard, που λειτουργεί εκτός της μηχανής αναζήτησης της «Google» και να ενσωματώσει ΤΝ στη λειτουργία των Google Maps. Την ώρα που οι όμιλοι ανταγωνίζονται χωρίς κανένα φραγμό ποιος θα προλάβει να πιάσει την καλύτερη θέση στο «τρένο» της ΤΝ, σε μια φαρσοκωμωδία που μόνο στον καπιταλισμό μπορεί να συναντήσει κανείς, ο επικεφαλής της «OpenAI», Σαμ Αλτμαν, καταθέτοντας σε επιτροπή του αμερικανικού Κογκρέσου δήλωσε ότι «ένας από τους μεγαλύτερους φόβους μου είναι μήπως η συγκεκριμένη τεχνολογία προκαλέσει σοβαρή ζημιά στην κοινωνία». Πρόσθεσε μάλιστα ότι «αν η Τεχνητή Νοημοσύνη πάρει τον λάθος δρόμο, τότε ”τη βάψαμε” όλοι μας»!

Πώς η Τεχνητή Νοημοσύνη γνωρίζει πράγματα που κανείς δεν της έμαθε

ΠΛΟΗΓΗΣΗ

ΛΙΣΤΑ ΕΠΙΚΟΙΝΩΝΙΑΣ