Ανοιχτά δεδομένα και το μαύρο κουτί της Τεχνητής Νοημοσύνης

Η Τεχνητή Νοημοσύνη (AI) συγκεντρώνει το τελευταίο καιρό τα βλέμματα με νέα εργαλεία όπως το ChatGPT και το DALL-E 2 , αλλά είναι ήδη εδώ και έχει σημαντικές επιπτώσεις στη ζωή μας. Όλο και περισσότερο βλέπουμε την επιβολή του νόμου, την ιατρική περίθαλψη, τα σχολεία και τους χώρους εργασίας να στρέφονται στο μαύρο κουτί της τεχνητής νοημοσύνης για να λάβουν αποφάσεις που αλλάζουν τη ζωή – μια τάση που θα πρέπει να αμφισβητούμε σε κάθε βήμα.

Τα τεράστια και συχνά μυστικά σύνολα δεδομένων πίσω από αυτήν την τεχνολογία, που χρησιμοποιούνται για την εκπαίδευση της τεχνητής νοημοσύνης με μηχανική μάθηση, συνοδεύονται και από επιπτώσεις. Τα δεδομένα που συλλέγονται μέσω της επιτήρησης και της εκμετάλλευσης θα αντικατοπτρίζουν συστημικές προκαταλήψεις και θα «μαθεύονται» στη διαδικασία. Στη χειρότερη μορφή τους, τα τσιτάτα της τεχνητής νοημοσύνης και της μηχανικής μάθησης χρησιμοποιούνται για να κάνουν «tech wash» σε αυτή την προκατάληψη, επιτρέποντας στους ισχυρούς να υποστηρίξουν καταπιεστικές πρακτικές πίσω από την υποτιθέμενη αντικειμενικότητα του κώδικα.

Ήρθε η ώρα να ανοίξουμε αυτά τα μαύρα κουτιά. Η υιοθέτηση συλλογικά διατηρούμενων συνόλων Ανοιχτών Δεδομένων στην ανάπτυξη της τεχνητής νοημοσύνης δεν θα ήταν μόνο όφελος για τη διαφάνεια και την υπευθυνότητα για αυτά τα εργαλεία, αλλά θα επιτρέψει στα επίδοξα υποκείμενα να δημιουργήσουν τη δική τους καινοτόμο και ενδυναμωτική εργασία και έρευνα. Πρέπει να διεκδικήσουμε ξανά αυτά τα δεδομένα και να αξιοποιήσουμε τη δύναμη μιας δημοκρατικής και ανοιχτής επιστήμης για να οικοδομήσουμε καλύτερα εργαλεία και έναν καλύτερο κόσμο.

Σκουπίδια μέσα, Ευαγγέλιο έξω ?

Η Μηχανική Μάθηση είναι ένα ισχυρό εργαλείο και υπάρχουν πολλές εντυπωσιακές περιπτώσεις χρήσης: όπως η αναζήτηση σημείων ζωής στον Άρη ή η κατασκευή συνθετικών αντισωμάτων . Αλλά στον πυρήνα τους αυτοί οι αλγόριθμοι είναι τόσο «έξυπνοι» όσο και τα δεδομένα που τροφοδοτούν. Ξέρετε το ρητό: «σκουπίδια μέσα, σκουπίδια έξω». Η Μηχανική Μάθηση βασίζεται τελικά σε δεδομένα εκπαίδευσης για να μάθει πώς να κάνει καλές εικασίες—η λογική πίσω από την οποία είναι συνήθως άγνωστη ακόμη και στους προγραμματιστές. Αλλά ακόμη και οι καλύτερες εικασίες δεν πρέπει να εκληφθούν ως ευαγγέλιο.

Τα πράγματα γίνονται ζοφερά όταν αυτή η συγκαλυμμένη λογική χρησιμοποιείται για τη λήψη αποφάσεων που αλλάζουν τη ζωή. Εξετάστε τον αντίκτυπο των εργαλείων πρόβλεψης αστυνόμευσης , τα οποία είναι χτισμένα σε μια βάση διαβόητων ανακριβών και μεροληπτικών δεδομένων εγκλήματος . Αυτή η αναζήτηση για “μελλοντικά εγκλήματα” με δυνατότητα τεχνητής νοημοσύνης είναι ένα τέλειο παράδειγμα του πώς αυτό το νέο εργαλείο ξεπλένει μεροληπτικά δεδομένα της αστυνομίας σε προκατειλημμένη αστυνόμευση – με αλγόριθμους να δίνουν έμφαση σε ήδη υπερβολικά αστυνομευμένες γειτονιές. Αυτή η αυτοεκπληρούμενη προφητεία εκτυλίσσεται ακόμη και για να προβλέψει την εγκληματικότητα από το σχήμα του προσώπου σας . Στη συνέχεια, κατά τον καθορισμό της εγγύησης σε μετρητά , ένας άλλος αλγόριθμος μπορεί να ορίσει την τιμή χρησιμοποιώντας δεδομένα γεμάτα με τις ίδιες ρατσιστικές και ταξικές προκαταλήψεις.

Ευτυχώς, οι νόμοι περί διαφάνειας επιτρέπουν στους ερευνητές να εντοπίσουν και να επιστήσουν την προσοχή σε αυτά τα ζητήματα. Στοιχεία εγκλήματος, έγγραφα και όλα αυτά, διατίθενται συχνά στο κοινό. Αυτή η ίδια διαφάνεια δεν αναμένεται από ιδιωτικούς φορείς όπως ο εργοδότης σας , ο σπιτονοικοκύρης σας ή το σχολείο σας .

Η απάντηση δεν είναι απλώς να δημοσιοποιηθούν όλα αυτά τα δεδομένα. Κάποια μοντέλα τεχνητής νοημοσύνης εκπαιδεύονται σε νόμιμα ευαίσθητες πληροφορίες, ακόμη και αν είναι διαθέσιμες στο κοινό . Είναι τοξικά περιουσιακά στοιχεία που προέρχονται από ένα μείγμα επιτήρησης και υποχρεωτικών γνωστοποιήσεων δεδομένων. Η προετοιμασία αυτών των δεδομένων είναι από μόνη της αμφίβολη, καθώς συχνά βασίζεται σε στρατούς εργαζομένων που υφίστανται υψηλή εκμετάλλευση, χωρίς τρόπους για την επισήμανση προβλημάτων με τα δεδομένα ή την επεξεργασία τους. Και παρά τους πολλούς ισχυρισμούς “μυστικής συνταγής”, η ανωνυμοποίηση αυτών των μεγάλων συνόλων δεδομένων είναι πολύ δύσκολη και ίσως ακόμη και αδύνατη , και οι επιπτώσεις μιας παραβίασης θα επηρέαζαν δυσανάλογα τους ανθρώπους που παρακολουθήθηκαν και εκμεταλλεύτηκαν για την παραγωγή της.

Αντίθετα, η υιοθέτηση ανοιχτών συνόλων δεδομένων που διατηρούνται από κοινού θα ενδυναμώσει τους επιστήμονες δεδομένων, οι οποίοι είναι ήδη ειδικοί σε θέματα διαφάνειας και απορρήτου που σχετίζονται με δεδομένα, να τα διατηρούν πιο ηθικά. Με τη συγκέντρωση πόρων με αυτόν τον τρόπο, η συναινετική και διαφανής συλλογή δεδομένων θα βοηθούσε στην αντιμετώπιση αυτών των προκαταλήψεων, αλλά θα ξεκλειδώσει το δημιουργικό δυναμικό της ανοιχτής επιστήμης για το μέλλον της τεχνητής νοημοσύνης.

Ένα ανοιχτό και ενδυναμωτικό μέλλον της τεχνητής νοημοσύνης

Όπως βλέπουμε αλλού στην Ανοικτή Πρόσβαση , αυτή η κατάργηση των φραγμών και των paywalls βοηθά τα άτομα με λιγότερους πόρους να έχουν πρόσβαση και να αποκτήσουν τεχνογνωσία. Το αποτέλεσμα θα μπορούσε να είναι ένα οικοσύστημα όπου η τεχνητή νοημοσύνη δεν εξυπηρετεί απλώς τους έχοντες έναντι των μη εχόντων, αλλά στο οποίο όλοι μπορούν να επωφεληθούν από την ανάπτυξη αυτών των εργαλείων.

Το λογισμικό ανοιχτού κώδικα έχει αποδείξει εδώ και καιρό τη δύναμη της συγκέντρωσης πόρων και του συλλογικού πειραματισμού. Το ίδιο ισχύει και για τα Ανοιχτά Δεδομένα—η καθιστώντας τα δεδομένα ανοιχτά προσβάσιμα μπορεί να εντοπίσει ελλείμματα και να επιτρέψει στους ανθρώπους να χτίσουν ο ένας τη δουλειά του άλλου πιο δημοκρατικά. Η σκόπιμη μεροληψία δεδομένων (ή «δηλητηρίαση δεδομένων») είναι δυνατή και αυτή η ανήθικη συμπεριφορά συμβαίνει ήδη σε λιγότερο διαφανή συστήματα και είναι πιο δύσκολο να ενοπιθσθεί. Αν και μια κίνηση προς τη χρήση Ανοιχτών Δεδομένων στην ανάπτυξη τεχνητής νοημοσύνης θα βοηθούσε στον μετριασμό των μεροληψιών και των ψευδών ισχυρισμών, δεν είναι πανάκεια. Ακόμη και επιβλαβή και μυστικά εργαλεία μπορούν να κατασκευαστούν με καλά δεδομένα.

Ωστόσο, ένα ανοιχτό σύστημα για την ανάπτυξη τεχνητής νοημοσύνης, από δεδομένα, κώδικα, έως δημοσίευση, μπορεί να αποφέρει πολλά ανθρωπιστικά οφέλη, όπως η χρήση της τεχνητής νοημοσύνης στην ιατρική έρευνα που σώζει ζωές . Η ικανότητα επανάχρησης και γρήγορης συνεργασίας στην ιατρική έρευνα μπορεί να επιταχύνει την ερευνητική διαδικασία και να αποκαλύψει χαμένες ανακαλύψεις στα δεδομένα. Το αποτέλεσμα? Εργαλεία για σωτήρια ιατρική διάγνωση και θεραπείες για όλους τους ανθρώπους, μετριάζοντας τις φυλετικές, διακρίσεις φύλου και άλλες προκαταλήψεις στην ιατρική έρευνα .

Τα Ανοιχτά Δεδομένα κάνουν τα δεδομένα να λειτουργούν για τους ανθρώπους. Ενώ η τεχνογνωσία και οι πόροι που απαιτούνται για τη μηχανική μάθηση παραμένουν εμπόδιο για πολλούς, τα έργα πληθοπορισμού όπως το Open Oversight ενδυναμώνουν ήδη τις κοινότητες κάνοντας πληροφορίες σχετικά με την επιβολή του νόμου ορατή και διαφάνεια. Το να μπορούν να συλλέγουν, να χρησιμοποιούν και να αναμιγνύουν δεδομένα για να φτιάξουν τα δικά τους εργαλεία, φέρνει την έρευνα AI από τους κλειδωμένα συρτάρια στους δρόμους και καταστρέφει τις καταπιεστικές ανισορροπίες ισχύος.

Τα Ανοιχτά Δεδομένα δεν αφορούν μόνο την πρόσβαση στα δεδομένα. Πρόκειται για τον εναγκαλισμό των προοπτικών και της δημιουργικότητας όλων των ανθρώπων για να τεθούν οι βάσεις για μια πιο δίκαιη και δίκαιη κοινωνία. Πρόκειται για την κατάργηση της συλλογής δεδομένων εκμετάλλευσης και τη διασφάλιση ότι όλοι επωφελούνται από το μέλλον της τεχνητής νοημοσύνης.

Πηγή άρθρου: https://www.eff.org/