Τις τελευταίες μέρες τo GitHub προκάλεσε μια μεγάλη αναταραχή στον χώρο του Ελεύθερου Λογισμικού, με την έναρξη λειτουργίας του Copilot. Το Copilot είναι μια εφαρμογή τεχνητής νοημοσύνης εκπαιδευμένη σε πηγαίο κώδικα και κείμενα που διατίθενται από το κοινό και παράγει προτάσεις κώδικα σε προγραμματιστές σε πραγματικό χρόνο.
Δεδομένου ότι το Copilot χρησιμοποιεί ως εκπαιδευτικό υλικό τα πολυάριθμα αποθετήρια GitHub που διανέμονται με άδειες copyleft όπως η GPL, μερικοί σχολιαστές κατηγορούν το GitHub για παραβίαση πνευματικών δικαιωμάτων, επειδή το ίδιο το Copilot δεν κυκλοφορεί με άδεια copyleft, και θα προσφέρεται ως υπηρεσία επί πληρωμή μετά από μια δοκιμαστική φάση. Η διαμάχη αγγίζει ταυτόχρονα πολλά ακανθώδη ζητήματα πνευματικών δικαιωμάτων. Αυτό που είναι εκπληκτικό για την τρέχουσα συζήτηση είναι ότι οι εκκλήσεις για την ευρύτερη δυνατή ερμηνεία των πνευματικών δικαιωμάτων προέρχονται τώρα από την κοινότητα του Ελεύθερου Λογισμικού.
Οι άδειες Copyleft δεν επωφελούνται από αυστηρότερους νόμους περί πνευματικών δικαιωμάτων
Οι άδειες Copyleft είναι μια ευφυής εφεύρεση με την οποία, ο χώρος του Ελεύθερου Λογισμικού έχει χρησιμοποιήσει τα πνευματικά δικαιώματα για την προώθηση της ελεύθερης ανταλλαγής πολιτισμού και καινοτομίας. Έργα με άδεια χρήσης copyleft μπορούν να αντιγραφούν, να τροποποιηθούν και να διανεμηθούν από όλους, και αντίγραφα ή παράγωγα έργα μπορούν με τη σειρά τους να επαναχρησιμοποιηθούν υπό τους ίδιους όρους άδειας. Αυτό δημιουργεί έναν ενάρετο κύκλο, χάρη στον οποίο όλο και περισσότερες καινοτομίες είναι ανοιχτές στο ευρύ κοινό. Τα πνευματικά δικαιώματα, τα οποία έχουν σχεδιαστεί για να εγγυώνται την αποκλειστικότητα έναντι των δημιουργιών, χρησιμοποιούνται εδώ για να αποτρέψουν τον περιορισμό της πρόσβασης σε παράγωγα έργα.
Ωστόσο, είναι επίσης σαφές ότι δεν θα υπάρχει ανάγκη για άδειες copyleft σε κώδικα λογισμικού από τρίτους προγραμματιστές, εάν τα πνευματικά δικαιώματα δεν εγγυώνται στους κατόχους δικαιωμάτων υψηλό βαθμό αποκλειστικού ελέγχου των πνευματικών δημιουργιών αρχικά. Εάν δεν ήταν δυνατόν να απαγορευτεί η χρήση και η τροποποίηση του κώδικα λογισμικού μέσω πνευματικών δικαιωμάτων, τότε δεν θα υπήρχε ανάγκη για άδειες που εμποδίζουν τους προγραμματιστές να κάνουν χρήση αυτών των δικαιωμάτων απαγόρευσης (φυσικά, οι άδειες ελεύθερου λογισμικού θα εξακολουθούν να εκπληρώνουν τη σημαντική λειτουργία που απαιτεί συμβατική δημοσίευση τροποποιημένου πηγαίου κώδικα). Αυτός είναι ο λόγος για τον οποίο είναι τόσο παράλογο όταν οι λάτρεις της copyleft υποστηρίζουν την επέκταση των πνευματικών δικαιωμάτων. Οποιαδήποτε επέκταση των δικαιωμάτων απαγόρευσης όχι μόνο ενισχύει την επιβολή των αδειών copyleft, αλλά και τις πολύ πιο διαδεδομένες άδειες πνευματικών δικαιωμάτων, οι οποίες στοχεύουν στην επίτευξη ακριβώς των αντίθετων αποτελεσμάτων.
Αλλά αυτό ακριβώς συμβαίνει στην τρέχουσα συζήτηση για το Copilot του GitHub. Επειδή μια μεγάλη εταιρεία – δηλαδή η μητρική εταιρεία του GitHub η Microsoft – ωφελείται από την ανάλυση του ελεύθερου λογισμικού και δημιουργεί μια εμπορική υπηρεσία σε αυτήν, η ιδέα της χρήσης νόμου περί πνευματικών δικαιωμάτων για να απαγορεύσει τη Microsoft να κάνει λόγο μπορεί να φαίνεται προφανής στους λάτρεις της copyleft. Ωστόσο, με αυτόν τον τρόπο, απαιτείται ουσιαστικά η επέκταση των πνευματικών δικαιωμάτων σε δράσεις που δεν καλύπτονται από πνευματικά δικαιώματα. Αυτές οι επεκτάσεις θα έχουν θανατηφόρες συνέπειες για την ανοιχτή κουλτούρα που επιδιώκουν να προωθήσουν οι άδειες copyleft.
Υπάρχουν δύο κύριες εκδοχές της κριτικής στο GitHub για την έναρξη του Copilot. Ορισμένοι επικρίνουν την ίδια τη χρήση του ελεύθερου λογισμικού ως αρχικό υλικό για μια εμπορική εφαρμογή AI. Άλλοι επικεντρώνονται στην ικανότητα του Copilot να παράγει αποτελέσματα βάσει των εκπαιδευτικών δεδομένων. Μπορεί κανείς να βρει και τα δύο ηθικά κατακριτέα, αλλά τα πνευματικά δικαιώματα δεν παραβιάζονται κατά τη διαδικασία.
Η εξόρυξη κειμένου και δεδομένων δεν αποτελεί παραβίαση πνευματικών δικαιωμάτων
Στο βαθμό που απλώς το scraping of code χωρίς την άδεια των συγγραφέων επικρίνεται, αξίζει να σημειωθεί ότι η απλή ανάγνωση και επεξεργασία πληροφοριών δεν είναι μια πράξη σχετική με πνευματικά δικαιώματα που απαιτεί άδεια: Αν πάω σε ένα βιβλιοπωλείο, βγάλω ένα βιβλίο από το ράφι και αρχίσω να το διαβάζω, δεν παραβιάζω πνευματικά δικαιώματα. Το γεγονός ότι η εξόρυξη περιεχομένου για την εκπαίδευση μιας τεχνητής νοημοσύνης εισέρχεται καθόλου στο πεδίο των πνευματικών δικαιωμάτων είναι επειδή η ψηφιακή τεχνολογία απαιτεί την παραγωγή αντιγράφων περιεχομένου για την επεξεργασία του. Η αντιγραφή είναι ουσιαστικά μια πράξη που σχετίζεται με πνευματικά δικαιώματα. Πολλές από τις συγκρούσεις μεταξύ πνευματικών δικαιωμάτων και ψηφιακής τεχνολογίας προκύπτουν από αυτό το γεγονός. Ευτυχώς, οι υπεύθυνοι χάραξης πολιτικής και τα δικαστήρια έχουν από καιρό αναγνωρίσει ότι η ψηφιακή τεχνολογία θα ήταν εντελώς άχρηστη εάν κάθε τεχνικό αντίγραφο απαιτούσε άδεια. Σε διαφορετική περίπτωση,άτομα που ακούνε μουσική με ψηφιακά ακουστικά βαρηκοΐας θα πρέπει πρώτα να αποκτήσουν άδεια για αυτήν. Οι πάροχοι διαδικτύου θα πρέπει να παρέχουν άδεια για κάθε πιθανό έργο που προστατεύεται από πνευματικά δικαιώματα που ανταλλάσσουν οι πελάτες τους μεταξύ τους.
Ήδη από το 2001, η ΕΕ επέτρεψε τέτοιες προσωρινές, εφήμερες πράξεις αντιγραφής, οι οποίες αποτελούν μέρος μιας τεχνικής διαδικασίας, χωρίς περιορισμούς – παρά τις διαμαρτυρίες της βιομηχανίας ψυχαγωγίας εκείνη την εποχή. Δυστυχώς, αυτή η εξαίρεση πνευματικών δικαιωμάτων του 2001 αρχικά επέτρεπε μόνο προσωρινή, δηλαδή παροδική, αντιγραφή περιεχομένου που προστατεύεται από πνευματικά δικαιώματα. Ωστόσο, πολλές τεχνικές διεργασίες απαιτούν πρώτα τη δημιουργία ενός σώματος αναφοράς στο οποίο το περιεχόμενο αποθηκεύεται μόνιμα για περαιτέρω επεξεργασία. Αυτή η αναγκαιότητα χρησιμοποιείται εδώ και πολύ καιρό από ακαδημαϊκούς εκδότες για να αποτρέψει τους ερευνητές από τη λήψη μεγάλων ποσοτήτων άρθρων που προστατεύονται από πνευματικά δικαιώματα για αυτοματοποιημένη ανάλυση. Αν και αυτοί οι μελετητές είχαν νόμιμη πρόσβαση στο περιεχόμενο, για παράδειγμα μέσω συνδρομής από το πανεπιστήμιο τους, οι εκδότες προσπάθησαν να αποκλείσουν συμβατικά ή τεχνικά τη δημιουργία εταιρείας αναφοράς. Σύμφωνα με τους εκδότες, οι ερευνητές έπρεπε να διαβάσουν τα άρθρα μόνο με τα μάτια τους και όχι με τεχνικά βοηθήματα. Οι μέθοδοι έρευνας που βασίζονται σε μηχανή, όπως οι ψηφιακές ανθρωπιστικές επιστήμες, υπέφεραν σε μεγάλο βαθμό από αυτήν την πρακτική.
Κάτω από το σύνθημα «Το δικαίωμα στην ανάγνωση είναι το δικαίωμα στο δικό μου», οι ερευνητικές ενώσεις με έδρα την ΕΕ ζήτησαν επομένως ρητή άδεια στον ευρωπαϊκό νόμο περί πνευματικών δικαιωμάτων για τη λεγόμενη εξόρυξη κειμένου και δεδομένων, δηλαδή τη μόνιμη αποθήκευση έργων που προστατεύονται από πνευματικά δικαιώματα για αυτοματοποιημένους σκοπούς. ανάλυση. Η εκστρατεία ήταν επιτυχής, για την αγωνία των ακαδημαϊκών εκδοτών. Από την οδηγία της ΕΕ για τα πνευματικά δικαιώματα του 2019, επιτρέπεται η εξόρυξη κειμένου και δεδομένων. Ακόμα και όταν πρόκειται για εμπορικές χρήσεις, οι κάτοχοι δικαιωμάτων που δεν επιθυμούν την αποξένωση των έργων τους που προστατεύονται από πνευματικά δικαιώματα για εξόρυξη δεδομένων πρέπει να εξαιρεθούν σε μορφή αναγνώσιμη από μηχανή, όπως το robots.txt Σύμφωνα με την ευρωπαϊκή νομοθεσία περί πνευματικών δικαιωμάτων, η εξόρυξη κώδικα με άδεια GPL ή οποιουδήποτε άλλου έργου που προστατεύεται από πνευματικά δικαιώματα, είναι νόμιμη, ανεξάρτητα από την άδεια που χρησιμοποιείται. Στις ΗΠΑ, η απόξεση εμπίπτει σε ορθή χρήση, αυτό ήταν σαφές τουλάχιστον από την υπόθεση Google Books
Ο κώδικας που δημιουργείται από μηχανή δεν είναι παράγωγο έργο
Ορισμένοι σχολιαστές βλέπουν το GitHub Copilot ως παραβίαση πνευματικών δικαιωμάτων, επειδή το πρόγραμμα όχι μόνο χρησιμοποιεί κώδικα λογισμικού που προστατεύεται από πνευματικά δικαιώματα, μεγάλο μέρος του οποίου δημοσιεύεται ως GPL, ως εκπαιδευτικό υλικό, αλλά παράγει επίσης κώδικα λογισμικού. Σύμφωνα με τους κριτικούς, αυτός ο κώδικας είναι ένα παράγωγο έργο των συνόλων δεδομένων εκπαίδευσης επειδή η AI δεν θα μπορούσε να δημιουργήσει τον κώδικα χωρίς τα δεδομένα εκπαίδευσης. Σε μερικές περιπτώσεις, το Copilot αναπαράγει επίσης σύντομα αποσπάσματα από τα σύνολα δεδομένων εκπαίδευσης, σύμφωνα με τις Συχνές Ερωτήσεις του GitHub.
Αυτή η λογική είναι επικίνδυνη από δύο απόψεις: Από τη μία πλευρά, υποδηλώνει ότι ακόμη και η αναπαραγωγή των μικρότερων αποσπασμάτων προστατευμένων έργων συνιστά παραβίαση πνευματικών δικαιωμάτων. Αυτή δεν είναι η περίπτωση. Αυτή η χρήση είναι σχετική μόνο σύμφωνα με τη νομοθεσία περί πνευματικών δικαιωμάτων, εάν το απόσπασμα που χρησιμοποιείται είναι με τη σειρά του πρωτότυπο και αρκετά μοναδικό για να φτάσει το όριο της πρωτοτυπίας. Διαφορετικά, οι συγκρούσεις πνευματικών δικαιωμάτων θα προέκυπταν συνεχώς όταν δύο συγγραφείς χρησιμοποιούν την ίδια ασήμαντη δήλωση ανεξάρτητα ο ένας από τον άλλο, όπως “οι Bucks νίκησαν τους Hawks και πηγάινουν στους τελικούς του NBA” ή “i = i + 1”. Τα σύντομα αποσπάσματα κώδικα που αναπαράγει το Copilot από τα εκπαιδευτικά δεδομένα είναι απίθανο να φτάσουν στο όριο της πρωτοτυπίας. Ακριβώς επειδή τα πνευματικά δικαιώματα προστατεύουν μόνο πρωτότυπα αποσπάσματα, οι εκδότες τύπου στην ΕΕ έχουν πιέσει επιτυχώς τα δικά τους δικαιώματα πνευματικής ιδιοκτησίας που δεν απαιτούν πρωτοτυπία ως προϋπόθεση για προστασία. Στόχος τους είναι να απαγορεύσουν την εμφάνιση μεμονωμένων προτάσεων από άρθρα τύπου από μηχανές αναζήτησης. Αυτή ακριβώς η προβληματική απαίτηση υποστηρίζεται από την κοινότητα του Ελεύθερου Λογισμικού όταν απαιτεί απόλυτο έλεγχο των μικρότερων αποσπασμάτων κώδικα λογισμικού.
Από την άλλη πλευρά, το επιχείρημα ότι τα outputs του GitHub Copilot είναι παράγωγα έργα των δεδομένων εκπαίδευσης βασίζεται στην υπόθεση ότι μια μηχανή μπορεί να παράγει έργα. Αυτή η υπόθεση είναι λανθασμένη και αντιπαραγωγική. Ο νόμος περί πνευματικών δικαιωμάτων έχει εφαρμοστεί ποτέ μόνο σε πνευματικές δημιουργίες – όπου δεν υπάρχει δημιουργός, δεν υπάρχει έργο. Αυτό σημαίνει ότι κώδικας που δημιουργείται από μηχανή όπως αυτός του GitHub Copilot δεν είναι καθόλου έργο σύμφωνα με τη νομοθεσία περί πνευματικών δικαιωμάτων, επομένως δεν είναι παράγωγο έργο. To output ενός μηχανήματος απλά δεν πληροί τις προϋποθέσεις για προστασία πνευματικών δικαιωμάτων – είναι στο δημόσιο κτήμα. Αυτά είναι καλά νέα για το ανοιχτό κίνημα και όχι κάτι που χρειάζεται διόρθωση.
Όσοι υποστηρίζουν ότι το αποτέλεσμα της Copilot είναι παράγωγο των δεδομένων εκπαίδευσης μπορεί να το κάνει επειδή ελπίζουν ότι θα τοποθετήσει αυτές τις εκδόσεις υπό τους όρους αδειοδότησης της GPL. Όμως, η δυσάρεστη παρενέργεια μιας τέτοιας επέκτασης των πνευματικών δικαιωμάτων θα ήταν ότι όλο το άλλο περιεχόμενο που δημιουργείται από AI θα προστατεύεται επίσης από τα πνευματικά δικαιώματα. Τι θα σταματούσε τότε μια μουσική βιομηχανία να εκπαιδεύσει ένα AI με τον κατάλογο μουσικής της για να δημιουργεί αυτόματα κάθε μελωδία που μπορεί να φανταστεί και να απαγορεύσει τη χρήση της από τρίτους; Τι θα εμπόδιζε τους εκδότες να παράγουν εκατομμύρια προτάσεις και να ιδιωτικοποιήσουν τη γλώσσα στη διαδικασία;
Στον Παγκόσμιο Οργανισμό Πνευματικής Ιδιοκτησίας (WIPO), οι εταιρείες ήδη ασκούν πιέσεις για επέκταση των πνευματικών δικαιωμάτων σε έργα που δημιουργούνται από μηχανήματα. Σύμφωνα με το WIPO : «Ο κύριος στόχος αυτών των ερωτημάτων είναι εάν το υφιστάμενο σύστημα πνευματικής ιδιοκτησίας πρέπει να τροποποιηθεί για να παρέχει ισορροπημένη προστασία για έργα και εφευρέσεις που δημιουργούνται από μηχανήματα», οι κύριοι δικαιούχοι μιας τέτοιας επέκτασης των πνευματικών δικαιωμάτων θα είναι οι μεγάλες εταιρείες τεχνολογίας που είναι στην καλύτερη θέση για την ανάπτυξη και κλιμάκωση εφαρμογών AI. Όπως η Microsoft.
Πηγή άρθρου: https://juliareda.eu/