Τα συστήματα τεχνητής νοημοσύνης (ΤΝ), όπως το chatbot ChatGPT, έχουν εξελιχθεί τόσο πολύ που πλέον σχεδόν φτάνουν ή ξεπερνούν τις ανθρώπινες επιδόσεις σε εργασίες όπως η κατανόηση κειμένου, η ταξινόμηση εικόνων και τα μαθηματικά σε επίπεδο ανταγωνισμού, σύμφωνα με μια νέα έκθεση (βλ. “Ταχεία πρόοδος”). Η ταχεία πρόοδος στην ανάπτυξη αυτών των συστημάτων σημαίνει επίσης ότι πολλά κοινά κριτήρια αναφοράς και δοκιμές για την αξιολόγησή τους καθίστανται γρήγορα παρωχημένα.
Αυτά είναι μερικά μόνο από τα κορυφαία ευρήματα της έκθεσης Artificial Intelligence Index Report 2024, η οποία δημοσιεύθηκε στις 15 Απριλίου από το Institute for Human-Centered Artificial Intelligence του Πανεπιστημίου Stanford στην Καλιφόρνια. Η έκθεση καταγράφει τη ραγδαία πρόοδο των συστημάτων μηχανικής μάθησης κατά την τελευταία δεκαετία.
Ειδικότερα, σύμφωνα με την έκθεση, νέοι τρόποι αξιολόγησης της τεχνητής νοημοσύνης – για παράδειγμα, η αξιολόγηση των επιδόσεών τους σε πολύπλοκα καθήκοντα, όπως η αφαίρεση και η συλλογιστική – είναι όλο και πιο αναγκαίοι. “Πριν από μια δεκαετία, οι δείκτες αναφοράς θα εξυπηρετούσαν την κοινότητα για 5-10 χρόνια”, ενώ τώρα συχνά καθίστανται άσχετοι σε λίγα μόλις χρόνια, λέει ο Nestor Maslej, κοινωνικός επιστήμονας στο Στάνφορντ και αρχισυντάκτης του AI Index. “Ο ρυθμός κέρδους ήταν εκπληκτικά γρήγορος”.
Ο ετήσιος Δείκτης Τεχνητής Νοημοσύνης του Στάνφορντ, ο οποίος δημοσιεύθηκε για πρώτη φορά το 2017, καταρτίζεται από μια ομάδα ακαδημαϊκών και ειδικών της βιομηχανίας για την αξιολόγηση των τεχνικών δυνατοτήτων, του κόστους, της ηθικής και άλλων στοιχείων του τομέα, με στόχο την ενημέρωση των ερευνητών, των φορέων χάραξης πολιτικής και του κοινού. Η φετινή έκθεση, η οποία έχει έκταση άνω των 400 σελίδων και η οποία διορθώθηκε και αυστηροποιήθηκε με τη βοήθεια εργαλείων τεχνητής νοημοσύνης, σημειώνει ότι η ρύθμιση που σχετίζεται με την τεχνητή νοημοσύνη στις Ηνωμένες Πολιτείες αυξάνεται κατακόρυφα. Ωστόσο, η έλλειψη τυποποιημένων αξιολογήσεων για την υπεύθυνη χρήση της ΤΝ καθιστά δύσκολη τη σύγκριση των συστημάτων όσον αφορά τους κινδύνους που ενέχουν.
Η αυξανόμενη χρήση της ΤΝ στην επιστήμη υπογραμμίζεται επίσης στη φετινή έκδοση: για πρώτη φορά, αφιερώνει ένα ολόκληρο κεφάλαιο στις επιστημονικές εφαρμογές, αναδεικνύοντας έργα όπως το Graph Networks for Materials Exploration (GNoME), ένα έργο της Google DeepMind που στοχεύει να βοηθήσει τους χημικούς να ανακαλύψουν υλικά, και το GraphCast, ένα άλλο εργαλείο της DeepMind, το οποίο κάνει ταχεία πρόγνωση του καιρού.
Η σημερινή έκρηξη της τεχνητής νοημοσύνης – που βασίζεται σε νευρωνικά δίκτυα και αλγορίθμους μηχανικής μάθησης – χρονολογείται από τις αρχές της δεκαετίας του 2010. Έκτοτε, ο τομέας έχει επεκταθεί ραγδαία. Για παράδειγμα, ο αριθμός των έργων κωδικοποίησης ΤΝ στο GitHub, μια κοινή πλατφόρμα για την ανταλλαγή κώδικα, αυξήθηκε από περίπου 800 το 2011 σε 1,8 εκατομμύρια πέρυσι. Και οι δημοσιεύσεις σε περιοδικά σχετικά με την ΤΝ περίπου τριπλασιάστηκαν κατά την ίδια περίοδο, αναφέρει η έκθεση
Μεγάλο μέρος της εργασίας αιχμής στον τομέα της τεχνητής νοημοσύνης γίνεται στη βιομηχανία: ο τομέας αυτός παρήγαγε 51 αξιόλογα συστήματα μηχανικής μάθησης πέρυσι, ενώ οι ακαδημαϊκοί ερευνητές συνεισέφεραν 15. “Η ακαδημαϊκή εργασία μετατοπίζεται στην ανάλυση των μοντέλων που προέρχονται από τις εταιρείες – κάνοντας μια βαθύτερη κατάδυση στις αδυναμίες τους”, λέει ο Raymond Mooney, διευθυντής του AI Lab στο Πανεπιστήμιο του Τέξας στο Όστιν, ο οποίος δεν συμμετείχε στην έκθεση.
Αυτό περιλαμβάνει την ανάπτυξη σκληρότερων δοκιμών για την αξιολόγηση των οπτικών, μαθηματικών και ακόμη και ηθικών-συλλογιστικών ικανοτήτων των μεγάλων γλωσσικών μοντέλων (LLM), τα οποία τροφοδοτούν τα chatbots. Ένα από τα πιο πρόσφατα τεστ είναι το Graduate-Level Google-Proof Q&A Benchmark (GPQA)1 , το οποίο αναπτύχθηκε πέρυσι από μια ομάδα στην οποία συμμετείχε ο ερευνητής μηχανικής μάθησης David Rein στο Πανεπιστήμιο της Νέας Υόρκης.
Το GPQA, που αποτελείται από περισσότερες από 400 ερωτήσεις πολλαπλής επιλογής, είναι δύσκολο: Οι επιστήμονες διδακτορικού επιπέδου μπορούσαν να απαντήσουν σωστά στις ερωτήσεις του τομέα τους σε ποσοστό 65% των περιπτώσεων. Οι ίδιοι μελετητές, όταν προσπάθησαν να απαντήσουν σε ερωτήσεις εκτός του τομέα τους, σημείωσαν μόνο 34%, παρά το γεγονός ότι είχαν πρόσβαση στο Διαδίκτυο κατά τη διάρκεια του τεστ (η τυχαία επιλογή των απαντήσεων θα έδινε βαθμολογία 25%). Από πέρυσι, τα συστήματα τεχνητής νοημοσύνης σημείωσαν περίπου 30-40%. Φέτος, λέει ο Rein, το Claude 3 – το τελευταίο chatbot που κυκλοφόρησε από την εταιρεία AI Anthropic, με έδρα το Σαν Φρανσίσκο της Καλιφόρνιας – σημείωσε περίπου 60%. “Ο ρυθμός προόδου είναι αρκετά σοκαριστικός για πολλούς ανθρώπους, συμπεριλαμβανομένου και εμού”, προσθέτει ο Rein. “Είναι αρκετά δύσκολο να φτιάξεις ένα σημείο αναφοράς που να επιβιώνει για περισσότερα από μερικά χρόνια”.
Κόστος επιχείρησης
Καθώς οι επιδόσεις εκτοξεύονται στα ύψη, το ίδιο συμβαίνει και με το κόστος. Το GPT-4 – το LLM που τροφοδοτεί το ChatGPT και το οποίο κυκλοφόρησε τον Μάρτιο του 2023 από την εταιρεία OpenAI με έδρα το Σαν Φρανσίσκο – φέρεται να κόστισε 78 εκατομμύρια δολάρια για την εκπαίδευσή του. Το chatbot Gemini Ultra της Google, που ξεκίνησε τον Δεκέμβριο, κόστισε 191 εκατομμύρια δολάρια. Πολλοί άνθρωποι ανησυχούν για τη χρήση ενέργειας αυτών των συστημάτων, καθώς και για την ποσότητα νερού που απαιτείται για την ψύξη των κέντρων δεδομένων που συμβάλλουν στη λειτουργία τους. “Αυτά τα συστήματα είναι εντυπωσιακά, αλλά είναι επίσης πολύ αναποτελεσματικά”, λέει ο Maslej.
Το κόστος και η χρήση ενέργειας για τα μοντέλα τεχνητής νοημοσύνης είναι υψηλά σε μεγάλο βαθμό επειδή ένας από τους κύριους τρόπους για να γίνουν τα σημερινά συστήματα καλύτερα είναι να γίνουν μεγαλύτερα. Αυτό σημαίνει την εκπαίδευσή τους σε όλο και μεγαλύτερα αποθέματα κειμένου και εικόνων. Το AI Index σημειώνει ότι ορισμένοι ερευνητές ανησυχούν πλέον για το ενδεχόμενο να ξεμείνουν από δεδομένα εκπαίδευσης. Πέρυσι, σύμφωνα με την έκθεση, το μη κερδοσκοπικό ερευνητικό ινστιτούτο Epoch προέβλεψε ότι μπορεί να εξαντλήσουμε τα αποθέματα γλωσσικών δεδομένων υψηλής ποιότητας ήδη από φέτος. (Ωστόσο, η πιο πρόσφατη ανάλυση του ινστιτούτου δείχνει ότι το 2028 είναι μια καλύτερη εκτίμηση).
Οι ηθικές ανησυχίες σχετικά με τον τρόπο κατασκευής και χρήσης της τεχνητής νοημοσύνης αυξάνονται επίσης. “Οι άνθρωποι είναι πολύ πιο νευρικοί για την τεχνητή νοημοσύνη από ποτέ, τόσο στις Ηνωμένες Πολιτείες όσο και σε ολόκληρο τον κόσμο”, λέει ο Maslej, ο οποίος βλέπει σημάδια αυξανόμενου διεθνούς χάσματος. “Υπάρχουν πλέον ορισμένες χώρες που είναι πολύ ενθουσιασμένες με την Τεχνητή Νοημοσύνη και άλλες που είναι πολύ απαισιόδοξες”.
Στις Ηνωμένες Πολιτείες, η έκθεση σημειώνει μια απότομη αύξηση του ενδιαφέροντος. Το 2016, υπήρχε μόλις ένας αμερικανικός κανονισμός που αναφερόταν στην ΤΝ- πέρυσι, υπήρχαν 25. “Μετά το 2022, υπάρχει μια μαζική έξαρση στον αριθμό των νομοσχεδίων που σχετίζονται με την ΤΝ και έχουν προταθεί” από τους φορείς χάραξης πολιτικής, λέει ο Maslej.
Η ρυθμιστική δράση επικεντρώνεται όλο και περισσότερο στην προώθηση της υπεύθυνης χρήσης της ΤΝ. Παρόλο που αναδύονται δείκτες αναφοράς που μπορούν να βαθμολογήσουν μετρήσεις όπως η ειλικρίνεια, η προκατάληψη και ακόμη και η συμπάθεια ενός εργαλείου ΤΝ, δεν χρησιμοποιούν όλοι τα ίδια μοντέλα, λέει ο Maslej, γεγονός που καθιστά δύσκολες τις διασταυρούμενες συγκρίσεις. “Αυτό είναι ένα πραγματικά σημαντικό θέμα”, λέει. “Πρέπει να φέρουμε την κοινότητα κοντά σε αυτό”.
Πηγή: kinitanea.gr