Ερευνητική ομάδα έχει αναπτύξει ένα νέο τύπο μοντέλου τεχνητής νοημοσύνης (AI) που μπορεί να κάνει πιο σύνθετους συλλογισμούς σε σχέση με τα περισσότερα μεγάλα γλωσσικά μοντέλα (LLM) όπως το ChatGPT, με πολύ καλύτερη απόδοση σε βασικά κριτήρια αξιολόγησης. Η νέα τεχνητή νοημοσύνη, που ονομάζεται ιεραρχικό μοντέλο συλλογιστικής (HRM), είναι εμπνευσμένη από το πώς παράγει σκέψη ο ανθρώπινος εγκέφαλος — τον τρόπο με τον οποίο διαφορετικές περιοχές του εγκεφάλου ενσωματώνουν πληροφορίες σε διαφορετικές χρονικές περιόδους (από χιλιοστά του δευτερολέπτου έως λεπτά).
Επιστήμονες της Sapient, μιας εταιρείας τεχνητής νοημοσύνης στη Σιγκαπούρη, αναφέρουν ότι αυτό το μοντέλο συλλογιστικής μπορεί να επιτύχει καλύτερη απόδοση και να λειτουργεί πιο αποτελεσματικά. Αυτό οφείλεται στο γεγονός ότι το μοντέλο χρειάζεται λιγότερες παραμέτρους και παραδείγματα εκπαίδευσης. Το μοντέλο HRM έχει 27 εκατομμύρια παραμέτρους και χρησιμοποιεί 1.000 δείγματα εκπαίδευσης, σύμφωνα με τους επιστήμονες σε μια μελέτη που αναρτήθηκε στις 26 Ιουνίου στη βάση δεδομένων προεκτύπωσης arXiv (η οποία δεν έχει ακόμη αξιολογηθεί από ομότιμους). Συγκριτικά, τα πιο προηγμένα LLM έχουν δισεκατομμύρια ή ακόμη και τρισεκατομμύρια παραμέτρους. Αν και δεν έχει δημοσιοποιηθεί ο ακριβής αριθμός, ορισμένες εκτιμήσεις υποδηλώνουν ότι το πρόσφατα κυκλοφορημένο GPT-5 έχει μεταξύ 3 τρισεκατομμυρίων και 5 τρισεκατομμυρίων παραμέτρων.
Ένας νέος τρόπος σκέψης για την τεχνητή νοημοσύνη
Όταν οι ερευνητές δοκίμασαν το HRM στο benchmark ARC-AGI — μια γνωστή δύσκολη εξέταση που στοχεύει να ελέγξει πόσο κοντά βρίσκονται τα μοντέλα στην επίτευξη γενικής τεχνητής νοημοσύνης (AGI) — το σύστημα πέτυχε εντυπωσιακά αποτελέσματα, σύμφωνα με τη μελέτη.
Το HRM σημείωσε 40,3% στο ARC-AGI-1, σε σύγκριση με 34,5% για το o3-mini-high της OpenAI, 21,2% για το Claude 3.7 της Anthropic και 15,8% για το Deepseek R1. Στην πιο δύσκολη δοκιμή ARC-AGI-2, το HRM σημείωσε 5% έναντι 3% του o3-mini-high, 1,3% του Deepseek R1 και 0,9% του Claude 3.7.
Τα πιο προηγμένα LLM χρησιμοποιούν συλλογιστική αλυσίδας σκέψης (CoT), στην οποία ένα σύνθετο πρόβλημα αναλύεται σε πολλαπλά, πολύ απλούστερα ενδιάμεσα βήματα που εκφράζονται σε φυσική γλώσσα. Μιμείται τη διαδικασία της ανθρώπινης σκέψης αναλύοντας περίπλοκα προβλήματα σε εύπεπτα κομμάτια.
Ωστόσο, οι επιστήμονες της Sapient υποστηρίζουν στη μελέτη ότι η CoT έχει σημαντικά μειονεκτήματα, συγκεκριμένα «εύθραυστη ανάλυση εργασιών, εκτεταμένες απαιτήσεις δεδομένων και υψηλή καθυστέρηση».
Αντ’ αυτού, το HRM εκτελεί διαδοχικές εργασίες συλλογιστικής σε ένα μόνο βήμα, χωρίς καμία ρητή εποπτεία των ενδιάμεσων βημάτων, μέσω δύο ενοτήτων. Μια ενότητα υψηλού επιπέδου είναι υπεύθυνη για τον αργό, αφηρημένο σχεδιασμό, ενώ μια ενότητα χαμηλού επιπέδου χειρίζεται γρήγορους και λεπτομερείς υπολογισμούς. Αυτό είναι παρόμοιο με τον τρόπο με τον οποίο ο ανθρώπινος εγκέφαλος επεξεργάζεται τις πληροφορίες σε διαφορετικές περιοχές.
Λειτουργεί εφαρμόζοντας επαναληπτική βελτίωση — μια τεχνική υπολογισμού που βελτιώνει την ακρίβεια μιας λύσης με την επαναλαμβανόμενη βελτίωση μιας αρχικής προσέγγισης — σε διάφορες σύντομες εκρήξεις «σκέψης». Κάθε έκρηξη εξετάζει εάν η διαδικασία της σκέψης πρέπει να συνεχιστεί ή να υποβληθεί ως «τελική» απάντηση στην αρχική ερώτηση.
Το HRM πέτυχε σχεδόν τέλεια απόδοση σε απαιτητικές εργασίες, όπως σύνθετα παζλ Sudoku — τα οποία τα συμβατικά LLM δεν μπορούσαν να ολοκληρώσουν — καθώς και στην εύρεση της βέλτιστης διαδρομής σε λαβύρινθους.
Η μελέτη δεν έχει υποβληθεί σε αξιολόγηση από ομότιμους, αλλά οι διοργανωτές του benchmark ARC-AGI προσπάθησαν να αναπαράγουν τα αποτελέσματα οι ίδιοι, αφού οι επιστήμονες της μελέτης δημοσίευσαν το μοντέλο τους ως ανοιχτό λογισμικό στο GitHub.
ΠΗΓΗ: tanea.gr
The post Ποιο ChatGPT; Νέα τεχνητή νοημοσύνη σκέφτεται όπως ο άνθρωπος appeared first on SciNews.eu.