Σε μια νέα έκθεση που εξετάζει τη δυνητική συμβολή της ΑΙ στην οικονομία, η OpenAI αξιολόγησε τις επιδόσεις μοντέλων της ίδιας και των ανταγωνιστών της σε μια σειρά επαγγελμάτων. Η ανάλυση δείχνει ότι οι μηχανές δεν έχουν φτάσει ακόμα το επίπεδο των κορυφαίων επαγγελματιών, κλείνει όμως την ψαλίδα με ταχύτητα.
Σε αντίθεση με προηγούμενες αξιολογήσεις που αφορούσαν ακαδημαϊκά προβλήματα και διαγωνισμούς που προγραμματισμού, η έκθεση της OpenAI βασίστηκε στην νέα αξιολόγηση GDPval, η οποία εξετάζει τις επιδόσεις των μοντέλων τεχνητής νοημοσύνης σε «εργασίες του πραγματικού κόσμου με οικονομική αξία.
Το τεστ ονομάστηκε έτσι επειδή τα 44 επαγγέλματα επιλέχθηκαν αφορούν τις 9 βιομηχανίες με τη μέγιστη συμβολή στο αμερικανικό ΑΕΠ (GDP).
Από τα μοντέλα που εξετάστηκαν (GPT‑4o, o4-mini, OpenAI o3, GPT‑5, Claude Opus 4.1, Gemini 2.5 Pro και Grok 4), η OpenAI παραδέχεται ότι το Claude Opus 4.1 είχε γενικά τις καλύτερες επιδόσεις, ειδικά στη μορφοποίηση εγγράφων, αν και το ChatGPT-5 αρίστευσε στην ακρίβεια, όπως για παράδειγμα στην εύρεση πληροφοριών.
Η έκθεση διαπιστώνει επίσης ότι, σε γενικές γραμμές, οι επιδόσεις των μοντέλων βελτιώνονται γραμμικά και έχουν υπερδιπλασιαστεί από την άνοιξη του 2024, όταν παρουσιάστηκε το ChatGPY-4o.
Τα επαγγέλματα που κινδυνεύουν περισσότερο
Οι επιδόσεις της ΑΙ ως ποσοστό του επιπέδου των κορυφαίων επαγγελματικών.
Κατά φθίνουσα σειρά κινδύνου:
- Υπάλληλοι γκισέ και ενοικιάσεων: 81%
- Διευθυντές πωλήσεων: 79%
- Υπάλληλοι αποθήκης, παραλαβών και απογραφών: 76%
- Επιμελητές κειμένων (editors): 75%
- Προγραμματιστές λογισμικού: 70%
- Ιδιωτικοί ντετέκτιβ και ερευνητές: 70%
- Ελεγκτές κανονιστικής συμμόρφωσης: 69%
- Επόπτες πωλήσεων (εκτός λιανεμπορίου): 69%
- Εκπρόσωποι πωλήσεων χονδρικής και βιομηχανίας (εκτός τεχνικών/επιστημονικών προϊόντων): 68%
- Γενικοί διευθυντές λειτουργιών: 67%
- Διευθυντές ιατρικών και υγειονομικών υπηρεσιών: 65%
- Αγοραστές και υπεύθυνοι προμηθειών: 64%
- Προσωπικοί χρηματοοικονομικοί σύμβουλοι: 64%
- Διευθυντές διοικητικών υπηρεσιών: 62%
- Εκπρόσωποι εξυπηρέτησης πελατών: 59%
- Επόπτες πωλήσεων λιανεμπορίου: 59%
- Επόπτες παραγωγής και λειτουργιών: 58%
- Νοσηλευτές πρακτικής (nurse practitioners): 56%
- Μεσίτες ακινήτων: 54%
- Αναλυτές ειδήσεων, ρεπόρτερ και δημοσιογράφοι: 53%
- Διευθυντές συστημάτων πληροφορικής: 52%
- Επόπτες αστυνομικών και ντετέκτιβ: 49%
- Εκπρόσωποι πωλήσεων χονδρικής και βιομηχανίας (τεχνικών/επιστημονικών προϊόντων): 47%
- Δικηγόροι: 46%
- Ειδικοί διαχείρισης έργων: 42%
- Κοινωνικοί λειτουργοί παιδιών, οικογένειας και σχολείων: 42%
- Ιατρικοί γραμματείς και διοικητικοί βοηθοί: 42%
- Πωλητές χρηματοοικονομικών προϊόντων, μετοχών και εμπορευμάτων: 42%
- Επόπτες γραφείων και διοικητικής υποστήριξης: 41%
- Αναλυτές επενδύσεων: 41%
- Εργαζόμενοι σε χώρους αναψυχής: 37%
- Εγγεγραμμένοι νοσηλευτές: 37%
- Διαχειριστές ακινήτων και κοινοτήτων: 34%
- Οικονομικοί διευθυντές: 32%
- Παραγωγοί και σκηνοθέτες: 31%
- Τεχνικοί ήχου και βίντεο: 30%
- Υπάλληλοι υποδοχής (concierges): 29%
- Υπάλληλοι παραγγελιών: 28%
- Πράκτορες πωλήσεων ακινήτων: 27%
- Φαρμακοποιοί: 26%
- Λογιστές και ελεγκτές: 24%
- Μηχανολόγοι μηχανικοί: 23%
- Βιομηχανικοί μηχανικοί: 17%
- Μοντέρ κινηματογράφου και βίντεο: 17%
Ο διευθύνων σύμβουλος της OpenAI Σαμ Άλτμαν έχει παραδεχτεί ότι η ΑΙ μπορεί να αντικαταστήσει τους ανθρώπους σε κάποια επαγγέλματα.
Η έκθεση ωστόσο εκτιμά ότι η μετάβαση δεν θα είναι τόσο ραγδαία, επισημαίνοντας ότι «οι καινοτόμες τεχνολογίες, από το Διαδίκτυο έως τα smartphone, χρειάζονται περισσότερο από μια δεκαετία από τη σύλληψή τους για να περάσουν σε ευρεία εφαρμογή.
Πηγή: in.gr
Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις.