ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Πως ο ανοιχτός κώδικας οδηγεί τις εξελίξεις στον σημασιολογικό ιστό

Ο Σημασιολογικός Ιστός, ένας όρος που επινοήθηκε από τον εφευρέτη του World Wide Web (WWW) Sir Tim Berners-Lee, αναφέρεται στην ιδέα ότι όλες οι πληροφορίες σε όλες τις ιστοσελίδες του Διαδικτύου πρέπει να είναι σε θέση να διαλειτουργούν και να επικοινωνούν. Αυτό το όραμα, ενός ιστού γνώσεων που παρέχει πληροφορίες σε όποιον το θέλει, συνεχίζει να εμφανίζεται και να αναπτύσσεται.

Στην πρώτη γενιά του WWW, Web 1.0, οι περισσότεροι άνθρωποι ήταν καταναλωτές περιεχομένου, και η παρουσία στο διαδίκτυο αποτελούσε μια σειρά από στατικές σελίδες HTML. Οι ιστότοποι είχαν βιβλία επισκεπτών και φόρμες HTM, αλλά παρόλο που η HTML παρέχει δομή και σύνταξη στον ιστό, δεν παρέχει νόημα. Επομένως το Web 1.0 δεν μπορούσε να εισάγει νόημα στους τεράστιους πόρους του WWW.

Ακολούθησε το Web 2.0 και το περιεχομένου που δημιουργείται από τους χρήστες, όπως  τα blogs, τα wikis, η κοινή χρήση βίντεο,  τα κοινωνικά μέσα κ.λπ. Το δυναμικά δημιουργούμενο περιεχόμενο δημιούργησε αμφίδρομη αλληλεπίδραση. Σε ιστότοπους όπως το Flickr και το Twitter χρησιμοποιήθηκαν ετικέτες που δημιουργήθηκαν από τον χρήστη (που ονομάζονται folksonomies) για την οργάνωση περιεχομένου σε κατηγορίες. Ενώ αυτό αντιπροσωπεύει μια τεράστια βελτίωση τόσο στην διεπαφή όσο και στην αλληλεπίδραση μέσω του Web 1.0, δεν είναι το πλήρες επίπεδο αλληλεπίδρασης που οραματιζόταν με τον ορισμό του Σημασιολογικού Ιστού, ο Berners-Lee.

Η επείγουσα ανάγκη για υλοποίηση του Σημασιολογικού Ιστού έχει προκύψει με το ταχέως αναπτυσσόμενο Διαδίκτυο των πραγμάτων (IoT), καθώς κάθε μία από αυτές τις συσκευές αποτελεί έναν ιστό σημασιολογικών δεδομένων που μπορούν να αναζητηθούν με τα κατάλληλα εργαλεία. Η διασταύρωση της τεχνητής νοημοσύνης, των μεγάλων δεδομένων, του IoT και των συνδεδεμένων τεχνολογιών  δημιουργεί την ευκαιρία να αντλήσουμε περισσότερο νόημα και πλαίσιο από τα δεδομένα που μοιραζόμαστε στον όλο και πιο διασυνδεδεμένο κόσμο μας. Καθώς αυτός ο ιστός δεδομένων συνεχίζει να αναπτύσσεται, χρειαζόμαστε εργαλεία και πλαίσια λογισμικού για τη δημιουργία και ανάγνωση αυτών των πληροφοριών.


Αρχιτεκτονική του Σημασιολογικού Ιστού

Το World Wide Web  Consortium (W3C) έχει εντοπίσει μια στοίβα λογισμικού συμπληρωματικών συνόλων δεδομένων που ενσωματώνονται στο περιεχόμενο ιστού και μπορούν να ταυτοποιηθούν και να ερωτηθούν με το κατάλληλο λογισμικό. Αυτό το νέο οικοσύστημα πληροφοριών ορίζεται από μια θεωρητική στοίβα που αποτελείται από Uniform Resource Identifiers (URIs), σειρές χαρακτήρων που προσδιορίζουν έναν πόρο. Περιλαμβάνει επίσης το Unicode, την ψηφιακή αναπαράσταση χαρακτήρων που επιτρέπει την προβολή του περιεχομένου ιστού σε διαφορετικές γλώσσες. Άλλα βασικά στοιχεία της βάσης της στοίβας είναι τα εξής:

  • Η Extensible Markup Language (XML) που είναι ενσωματωμένη σε αυτά τα έγγραφα ιστού καθιερώνει μια κοινή σύνταξη που περιγράφει το περιεχόμενο που παρέχεται.
  • Το Resource Description Framework (RDF)ορίζεται από το W3C ως “ένας ευέλικτος και επεκτάσιμος τρόπος για την αντιπροσώπευση πληροφοριών σχετικά με τους πόρους του Παγκόσμιου Ιστού και χρησιμοποιείται για να αντιπροσωπεύει, μεταξύ άλλων, προσωπικές πληροφορίες, κοινωνικά δίκτυα, μεταδεδομένα για ψηφιακά αντικείμενα, καθώς και Παρέχουν ένα μέσο ενσωμάτωσης σε διαφορετικές πηγές πληροφοριών. “
  • Η Web Ontology Language (OWL είναι μια σημασιολογική γλώσσα σήμανσης που έχει σχεδιαστεί για να περιγράφει τις σχέσεις μεταξύ των πραγμάτων και μπορεί να χρησιμοποιηθεί από άλλα προγράμματα για την ερμηνεία των παρεχόμενων δεδομένων.
  • Το SPARQL (προφέρεται “”sparkle” ) είναι το πρωτόκολλο και η γλώσσα για ερωτήματα RDF που εξάγει τα ενσωματωμένα δεδομένα RDF που βρίσκονται στον ιστό. Σύμφωνα με τη Wikipedia, το “SPARQL επιτρέπει στους χρήστες να γράφουν queries ενάντια σε  ‘key-value’ δεδομένα ή πιο συγκεκριμένα δεδομένα που είναι σύμφωνα με τι RDF specification του W3C.”

Προγράμματα ανοιχτού κώδικα που προωθούν τον Σημασιολογικό Ιστό

Πώς μια ιστοσελίδα ξεχωρίζει πληροφορίες; Πώς μπορεί το περιεχόμενο του ιστού να μιλήσει κυριολεκτικά με άλλο περιεχόμενο με τρόπο που ο παραλήπτης γνωρίζει την πρόθεσή μου; Πώς μπορούν, για παράδειγμα, να αναζητηθούν πληροφορίες σε αρχεία κειμένου και πολυμέσων του wiki για να προσδιοριστούν τα ενεργά έργα που πραγματοποιήθηκαν το 2016; Ένα εργαλείο ανοιχτού κώδικα που επιτρέπει αυτό το είδος αλληλεπίδρασης είναι το Semantic MediaWiki.

Επιπλέον, αναπτύσσεται ένας ολοένα και αυξανόμενος κατάλογος έργων ανοιχτού κώδικα για την εξαγωγή νοήματος από τον Σημασιολογικό Ιστό. Αυτό περιλαμβάνει την DBpedia, έργο που αποσκοπεί στην εξαγωγή δομημένου περιεχομένου από τη Wikipedia. Τα Creative Commons χρησιμοποιούν δεδομένα RDF για την ενσωμάτωση πληροφοριών άδειας χρήσης σε ιστοσελίδες και αρχεία MP3. Τα Simple Knowledge Organization Systems (SKOS) χρησιμοποιούνται στις εφαρμογές των θησαυρών όπως το Unesco Thesaurus. Η  Apache Jena είναι μια εφαρμογή ανοιχτού κώδικα της SPARQL. Ένα ακόμη πλαίσιο ανοιχτού κώδικα που υλοποιεί το SPARQL είναι το Eclipse RDF4J.

https://opensource.com

Leave a Comment