Τα υδατογραφήματα στην Τεχνητή Νοημοσύνη δεν μπορούν να αντιμετωπίσουν την παραπληροφόρηση

Η δημιουργική τεχνητή νοημοσύνη επιτρέπει στους ανθρώπους να παράγουν σωρούς πάνω σε σωρούς εικόνων και λέξεων πολύ γρήγορα. Θα ήταν ωραίο αν υπήρχε κάποιος τρόπος να διακρίνουμε αξιόπιστα το περιεχόμενο που δημιουργείται από AI από το περιεχόμενο που δημιουργείται από τον άνθρωπο. Θα βοηθούσε τους ανθρώπους να αποφύγουν τις ατελείωτες διαμάχες με bots στο διαδίκτυο ή να πιστέψουν τι υποτίθεται ότι δείχνει μια ψεύτικη εικόνα. Μια κοινή πρόταση είναι ότι οι μεγάλες εταιρείες θα πρέπει να ενσωματώσουν υδατογραφήματα στα αποτελέσματα των AI τους. Για παράδειγμα, αυτό θα μπορούσε να περιλαμβάνει τη λήψη μιας εικόνας και την ανεπαίσθητη αλλαγή πολλών εικονοστοιχείων με τρόπο που δεν είναι ανιχνεύσιμος στο μάτι αλλά ανιχνεύσιμος από ένα πρόγραμμα υπολογιστή. Ή θα μπορούσε να περιλαμβάνει την εναλλαγή λέξεων για συνώνυμα με προβλέψιμο τρόπο, ώστε το νόημα να παραμείνει αμετάβλητο, αλλά ένα πρόγραμμα θα μπορούσε εύκολα να προσδιορίσει ότι το κείμενο δημιουργήθηκε από μια τεχνητή νοημοσύνη.

Δυστυχώς, τα συστήματα υδατογράφησης είναι απίθανο να λειτουργήσουν. Μέχρι στιγμής, τα περισσότερα έχουν αποδειχθεί εύκολο να αφαιρεθούν και είναι πιθανό τα μελλοντικά σχήματα να έχουν παρόμοια προβλήματα.

Ένα είδος υδατογραφήματος είναι ήδη κοινό για ψηφιακές εικόνες. Οι ιστότοποι εικόνων στοκ συχνά επικαλύπτουν κείμενο σε μια εικόνα που το καθιστά ως επί το πλείστον άχρηστο για δημοσίευση. Αυτό το είδος υδατογραφήματος είναι ορατό και είναι ελαφρώς δύσκολο να αφαιρεθεί, καθώς απαιτεί ορισμένες δεξιότητες επεξεργασίας φωτογραφιών.

A photograph of plants on a mountainside, with repeated text covering it in a light colored font. The text describes the licensing terms, CC-BY.

Οι εικόνες μπορούν επίσης να έχουν μεταδεδομένα που επισυνάπτεται από μια κάμερα ή ένα πρόγραμμα επεξεργασίας εικόνας, συμπεριλαμβανομένων πληροφοριών όπως η ημερομηνία, η ώρα και η τοποθεσία λήψης μιας φωτογραφίας, οι ρυθμίσεις της κάμερας ή ο δημιουργός μιας εικόνας. Αυτά τα μεταδεδομένα είναι διακριτικά, αλλά μπορούν να προβληθούν εύκολα με κοινά προγράμματα. Επίσης αφαιρούνται εύκολα από ένα αρχείο. Για παράδειγμα, οι ιστότοποι μέσων κοινωνικής δικτύωσης συχνά αφαιρούν αυτόματα τα μεταδεδομένα όταν οι άνθρωποι ανεβάζουν εικόνες, τόσο για να αποτρέψουν τους χρήστες να αποκαλύψουν κατά λάθος την τοποθεσία τους όσο και απλώς για να εξοικονομήσουν χώρο αποθήκευσης.

Ένα χρήσιμο υδατογράφημα για εικόνες τεχνητής νοημοσύνης θα χρειαζόταν δύο ιδιότητες:

Θα πρέπει να συνεχίσει να είναι ανιχνεύσιμο μετά την περικοπή, την περιστροφή ή την επεξεργασία μιας εικόνας με διάφορους τρόπους.
Δεν θα μπορούσε να είναι εμφανές όπως το υδατογράφημα σε δείγματα εικόνων στοκ, επειδή οι εικόνες που προέκυψαν δεν θα ήταν πολύ χρήσιμες σε κανέναν.

Μια απλή τεχνική είναι να χειριστείτε τα λιγότερο αντιληπτά κομμάτια μιας εικόνας. Για παράδειγμα, για έναν άνθρωπο θεατή αυτά τα δύο τετράγωνα έχουν την ίδια απόχρωση:

Two green boxes of nearly identical shades

Αλλά για έναν υπολογιστή είναι προφανές ότι διαφέρουν κατά ένα μόνο bit: #93c47d έναντι 93c57d. Κάθε εικονοστοιχείο μιας εικόνας αντιπροσωπεύεται από έναν ορισμένο αριθμό δυαδικών ψηφίων και μερικά από αυτά κάνουν μεγαλύτερη αντιληπτική διαφορά από άλλα. Με το χειρισμό αυτών των λιγότερο σημαντικών κομματιών, ένα πρόγραμμα υδατογραφήματος μπορεί να δημιουργήσει ένα μοτίβο που δεν θα βλέπουν οι θεατές, αλλά ένα πρόγραμμα ανίχνευσης υδατογραφήματος. Εάν αυτό το μοτίβο επαναλαμβάνεται σε ολόκληρη την εικόνα, το υδατογράφημα είναι ακόμη ανθεκτικό στην περικοπή. Ωστόσο, αυτή η μέθοδος έχει ένα σαφές ελάττωμα: η περιστροφή ή η αλλαγή μεγέθους της εικόνας είναι πιθανό να καταστρέψει κατά λάθος το υδατογράφημα.

Υπάρχουν πιο εξελιγμένες προτάσεις υδατογράφησης που είναι ανθεκτικές σε μια ευρύτερη ποικιλία κοινών επεξεργασιών. Ωστόσο, οι προτάσεις για υδατογράφηση τεχνητής νοημοσύνης πρέπει να περάσουν μια πιο σκληρή πρόκληση. Πρέπει να είναι στιβαρές απέναντι σε κάποιον που γνωρίζει για το υδατογράφημα και θέλει να το εξαλείψει. Το άτομο που θέλει να αφαιρέσει ένα υδατογράφημα δεν περιορίζεται σε κοινές επεξεργασίες, αλλά μπορεί να χειριστεί απευθείας το αρχείο εικόνας. Για παράδειγμα, εάν ένα υδατογράφημα κωδικοποιείται στα λιγότερο σημαντικά κομμάτια μιας εικόνας, κάποιος θα μπορούσε να το αφαιρέσει ορίζοντας απλώς όλα τα λιγότερο σημαντικά bit στο 0 ή σε μια τυχαία τιμή (1 ή 0) ή σε μια τιμή που προβλέπεται αυτόματα βάσει σε γειτονικά pixel. Οπως ακριβώς προσθέτωντας ένα υδατογράφημα,αφαιρώντας ένα υδατογράφημα με αυτόν τον τρόπο δίνει μια εικόνα που μοιάζει βασικά με την αρχική, τουλάχιστον στο ανθρώπινο μάτι.

Ερχόμενοι στο πρόβλημα από την αντίθετη κατεύθυνση, ορισμένες εταιρείες επεξεργάζονται τρόπους να αποδείξουν ότι μια εικόνα προήλθε από κάμερα («αυθεντικότητα περιεχομένου»). Αντί να επισημαίνουν τις εικόνες που δημιουργούνται με τεχνητή νοημοσύνη, προσθέτουν μεταδεδομένα σε εικόνες που δημιουργούνται από κάμερα και χρησιμοποιούν κρυπτογραφικές υπογραφές για να αποδείξουν ότι τα μεταδεδομένα είναι γνήσια. Αυτή η προσέγγιση είναι πιο εφαρμόσιμη από την υδατογράφηση εικόνων που δημιουργούνται με τεχνητή νοημοσύνη, καθώς δεν υπάρχει κίνητρο για την αφαίρεση του σήματος. Στην πραγματικότητα, υπάρχει το αντίθετο κίνητρο: οι εκδότες θα ήθελαν να διατηρήσουν αυτά τα μεταδεδομένα, επειδή βοηθούν να διαπιστωθεί ότι οι εικόνες τους είναι «πραγματικές». Αλλά εξακολουθεί να είναι ένα τρομερά περίπλοκο σχέδιο, καθώς η αλυσίδα της επαληθευσιμότητας πρέπει να διατηρηθεί μέσω όλου του λογισμικού που χρησιμοποιείται για την επεξεργασία φωτογραφιών. Και οι περισσότερες κάμερες δεν θα παράγουν ποτέ αυτά τα μεταδεδομένα, πράγμα που σημαίνει ότι η απουσία τους δεν μπορεί να χρησιμοποιηθεί για να αποδειχθεί ότι μια φωτογραφία είναι ψεύτικη.

Συγκρίνοντας το υδατογράφημα με την αυθεντικότητα του περιεχομένου, το υδατογράφημα στοχεύει στον εντοπισμό ή την επισήμανση (ορισμένων) ψεύτικων εικόνων. Η αυθεντικότητα του περιεχομένου στοχεύει στον εντοπισμό ή τη σήμανση (κάποιων) πραγματικών εικόνων. Καμία προσέγγιση δεν είναι ολοκληρωμένη, καθώς οι περισσότερες από τις εικόνες στο Διαδίκτυο δεν θα έχουν ούτε υδατογράφημα ούτε μεταδεδομένα αυθεντικότητας περιεχομένου.

	Watermarking	Content authenticity
AI images	Marked	Unmarked
(Some) camera images	Unmarked	Marked
Everything else	Unmarked	Unmarked

Υδατογραφήματα βασισμένα σε κείμενο

Το πρόβλημα της υδατοσήμανσης είναι ακόμη πιο δύσκολο για τη δημιουργική τεχνητή νοημοσύνη που βασίζεται σε κείμενο. Παρόμοιες τεχνικές μπορούν να επινοηθούν. Για παράδειγμα, ένα AI θα μπορούσε ενισχύει την πιθανότητα ορισμένων λέξεων, δίνοντας στον εαυτό του ένα λεπτό ύφος κειμένου που θα περνούσε απαρατήρητο τις περισσότερες φορές, αλλά θα μπορούσε να αναγνωριστεί από ένα πρόγραμμα με πρόσβαση στη λίστα λέξεων. Αυτό θα ήταν ουσιαστικά μια έκδοση υπολογιστή για τον προσδιορισμό της πατρότητας των δώδεκα αμφισβητούμενων δοκιμίων στο The Federalist Papers αναλύοντας τις συνήθεις επιλογές λέξεων του Μάντισον και του Χάμιλτον.

Αλλά η δημιουργία ενός ανεξίτηλου κειμένου υδατογραφήματος είναι πολύ πιο δύσκολο έργο από το να ξεχωρίσεις τα γραπτά του Χάμιλτον από του Μάντισον, καθώς το υδατογράφημα πρέπει να είναι ανθεκτικό σε κάποιον που τροποποιεί το κείμενο που προσπαθεί να το αφαιρέσει. Οποιοδήποτε υδατογράφημα που βασίζεται στην επιλογή λέξης είναι πιθανό να νικηθεί από κάποια αναδιατύπωση. Αυτή η αναδιατύπωση θα μπορούσε ακόμη και να πραγματοποιηθεί από μια εναλλακτική τεχνητή νοημοσύνη, ίσως λιγότερο εξελιγμένη από αυτή που δημιούργησε το αρχικό κείμενο, αλλά δεν υπόκειται σε απαίτηση υδατογράφησης.

Υπάρχει επίσης ένα πρόβλημα εάν τα εργαλεία για τον εντοπισμό υδατογραφημένου κειμένου είναι δημόσια διαθέσιμα ή μυστικά. Η δημοσιοποίηση των εργαλείων ανίχνευσης παρέχει ένα πλεονέκτημα σε όσους θέλουν να αφαιρέσουν το υδατογράφημα, επειδή μπορούν να επεξεργάζονται επανειλημμένα το κείμενο ή την εικόνα τους έως ότου το εργαλείο ανίχνευσης δώσει μια πλήρη σαφήνεια. Αλλά το να τα είναι αυτά μυστικά τα καθιστά δραματικά λιγότερο χρήσιμα, επειδή κάθε αίτημα ανίχνευσης πρέπει να αποστέλλεται σε οποιαδήποτε εταιρεία παρήγαγε το υδατογράφημα. Αυτό θα απαιτούσε ενδεχομένως από τους ανθρώπους να μοιράζονται ιδιωτική επικοινωνία εάν ήθελαν να ελέγξουν για υδατογράφημα. Και θα εμπόδιζε τις προσπάθειες των εταιρειών μέσων κοινωνικής δικτύωσης να επισημαίνουν αυτόματα περιεχόμενο που δημιουργείται από τεχνητή νοημοσύνη σε κλίμακα, καθώς θα έπρεπε να εκτελούν κάθε ανάρτηση πέρα από τις μεγάλες εταιρείες τεχνητής νοημοσύνης.

Δεδομένου ότι τα αποτελέσματα κειμένου από τα τρέχοντα AI δεν είναι υδατογραφημένα, έχουν εμφανιστεί υπηρεσίες όπως το GPTZero και το TurnItIn, που ισχυρίζονται ότι μπορούν να ανιχνεύσουν περιεχόμενο που δημιουργείται από AI ούτως ή άλλως. Αυτά τα εργαλεία ανίχνευσης είναι τόσο ανακριβή ώστε να έχουν γινει επικίνδυνα, και έχουν ήδη οδηγήσει σε ψευδείς κατηγορίες για λογοκλοπή.

Τέλος, εάν η υδατογράφηση τεχνητής νοημοσύνης πρόκειται να αποτρέψει εκστρατείες παραπληροφόρησης που χρηματοδοτούνται από κράτη, είναι σημαντικό να έχουμε κατά νου ότι αυτές οι κρατικές υπηρεσίες μπορούν εύκολα να αναπτύξουν σύγχρονη τεχνικές, και πιθανότατα θα το κάνουν στο εγγύς μέλλον. Μια εκστρατεία παραπληροφόρησης που χρηματοδοτείται από το κράτος είναι απίθανο να είναι τόσο ευγενική ώστε να υδατογραφήσει το αποτέλεσμα της.

Η υδατογράφηση του περιεχομένου που δημιουργείται με τεχνητή νοημοσύνη είναι μια εύκολη λύση για το ακανθώδες πρόβλημα της παραπληροφόρησης. Και τα υδατογραφήματα μπορεί να είναι χρήσιμα σε κατανόηση αναδημοσιευμένου περιεχομένου όπου δεν υπάρχει παραπλανητική πρόθεση. Ωστόσο, η έρευνα για την υδατογράφηση για την τεχνητή νοημοσύνη μόλις ξεκινά, και ενώ δεν υπάρχει κανένας σοβαρός λόγος να πιστεύουμε ότι θα πετύχει, και υπάρχουν κάποιοι καλοί λόγοι να πιστεύουμε ότι τελικά θα αποτύχει.

Πηγή άρθρου: https://www.eff.org/

Υδατογραφήματα βασισμένα σε κείμενο

Leave a Comment Cancel reply