ΑΞΕΙΔ

English version English version

ΑΞΕΙΔ – Αποτίμηση της Αξιοπιστίας Ειδήσεων σε Κοινωνικά Δίκτυα Επιρροής (Assessment of News Reliability in Social Networks of Influence), δράση ΕΔΒΜ34

Διάρκεια προγράμματος: Απρίλιος 2018 – Ιανουάριος 2020

Η ραγδαία εξάπλωση του διαδικτύου στον σύγχρονο κόσμο δημιουργεί νέες διόδους ανταλλαγής πληροφοριών και ειδήσεων μεταξύ των χρηστών του. Καθιερωμένα Μ.Μ.Ε., ειδησεογραφικές οργανώσεις καθώς και πλήθος ιδιωτών έχουν στη διάθεσή τους σύγχρονα μέσα που τους επιτρέπουν την διάδοση ειδήσεων και απόψεων σε ένα ευρύτατο κοινό ενώ κάθε χρήστης του διαδικτύου μπορεί να ενημερώνεται άμεσα από οποιαδήποτε πηγή του κόσμου για τα τεκταινόμενα. Η διαμόρφωση της κοινής γνώμης έχει αποκτήσει νέα διάσταση καθώς ο όγκος των νέων ειδήσεων και η ταχύτητα διάδοσής τους αλλάζουν τους κανόνες λειτουργίας που έχουν εδραιωθεί εδώ και δεκαετίες.

Ωστόσο, τα νέα βήματα διάδοσης ειδήσεων και απόψεων δεν στερούνται μειονεκτημάτων και κινδύνων. Η έλλειψη μηχανισμών ταυτοποίησης των ατόμων που δημοσιεύουν τις απόψεις τους επιτρέπει την εξάπλωση ψευδών ειδήσεων. Επιπλέον, η ανάγκη των επίσημων Μ.Μ.Ε. για αύξηση της επισκεψιμότητας των διαδικτυακών τόπων τους, και κατά συνέπεια των εσόδων τους, οδηγεί συχνά στη δημοσίευση άρθρων με πηχυαίους και προκλητικούς τίτλους αμφιβόλου εγκυρότητας με σκοπό τον εντυπωσιασμό των αναγνωστών θέτοντας, έτσι, υπό αμφισβήτηση την αντικειμενικότητάς τους. Πολλοί ισχυρίζονται ότι η ανεμπόδιστη διάδοση ειδήσεων συμβάλλει στην διαμόρφωση πιο εμπεριστατωμένης και εγκυρότερης κοινής γνώμης, ωστόσο τα συχνά φαινόμενα ψευδών και παραπλανητικών ειδήσεων επιβάλλουν την περαιτέρω έρευνα του συγκεκριμένου ισχυρισμού.

Εικόνα 1: Οι παράγοντες επιρροής για κάθε ΜΜΕ από τα κοινοβουλευτικά κόμματα. Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.

Στόχος της παρούσας έρευνας ήταν η σαφής διατύπωση των εννοιών της αντικειμενικότητας (bias) και της εγκυρότητας (credibility) καθώς και η αποτίμησή τους με αριθμητικούς όρους σε έναν γράφημα διάδοσης ειδήσεων του διαδικτύου. Τα δεδομένα της έρευνάς μας προήλθαν από ένα δημοφιλές μέσο κοινωνικής δικτύωσης και διάδοσης απόψεων. Για την ανάλυση των δεδομένων και τους κανόνες καθορισμού του γραφήματος διάδοσης χρησιμοποιήθηκαν σύγχρονοι αλγόριθμοι από το πεδίο της θεωρίας γραφημάτων ενώ για την μελέτη και τον υπολογισμό των εννοιών της αντικειμενικότητας και της εγκυρότητας εφαρμόστηκαν διαδεδομένες τεχνικές κατάταξη κόμβων και τεχνικές από τη δυναμική απόψεων.

Η καινοτομία της έρευνάς βασίστηκε στη χρήση σύγχρονων αλγορίθμων και εννοιών για την μελέτη της ενημέρωσης και, συγκεκριμένα, της ποιότητας των ειδήσεων. Με την έρευνά μας προσαρμόσαμε πρόσφατες έννοιες σε μια μελέτη περίπτωσης ενός δημοφιλούς μέσου κοινωνικής δικτύωσης εστιάζοντας στον ελληνικό χώρο ενημέρωσης και με τη χρήση αλγορίθμων από διαφορετικά επιστημονικά πεδία αποτιμήσαμε σύνθετα χαρακτηριστικά του. Η έρευνά μας βασίστηκε σε δημόσια δεδομένα και μελετήσαμε γραφοθεωρητικά σύνθετες έννοιες όπως η αντικειμενικότητα στο σύγχρονο ειδησεογραφικό τοπίο.

Πορεία και Αποτελέσματα Έρευνας

Στο αρχικό στάδιο της έρευνας θέσαμε ως στόχο την μελέτη της πολιτικής πληροφορίας που ενυπάρχει στη δομή των μέσων κοινωνικής δικτύωσης. Το ζητούμενο της μελέτης μας εστίαζε στην εξακρίβωση της ύπαρξης πολιτικής πληροφορίας καθώς και στην ανάλυση της ποιότητάς της. Θεωρήσαμε ότι αυτό το βήμα θα θεμελίωνε τα μετέπειτα βήματα της έρευνάς μας καθώς η πιθανή ύπαρξη αξιοποιήσιμης πληροφορίας θα καθιστούσε έγκυρη την προσέγγισή μας για την αποτίμηση της αντικειμενικότητας.

Το μέσο κοινωνικής δικτύωσης που επιλέχθηκε ήταν το Twitter και οριοθετήσαμε ως πλαίσιο μελέτης το ελληνικό πολιτικό σκηνικό. Οι λόγοι που μας οδήγησαν στην επιλογή του συγκεκριμένου μέσου σχετίζονται αφενός με την πρωτοφανή παρουσία και επίδραση του Twitter στα πολιτικά τεκταινόμενα παγκοσμίως και αφετέρου με την δυνατότητα που προσφέρει για άντληση δημοσίως διαθέσιμων δεδομένων. Μετά από ενδελεχή έρευνα καθορίσαμε τους κόμβους ενδιαφέροντος (Nodes of Interest, NOIs) που σχετίζονται με το ελληνικό πολιτικό σκηνικό. Συγκεκριμένα, θεωρήσαμε ότι οι εκλεγμένοι βουλευτές της τότε ενεργής Βουλής Των Ελλήνων (Απρίλιος 2018) καθώς και τα Μέσα Μαζικής Ενημέρωσης (ΜΜΕ) με πανελλήνια κάλυψη και πολιτικό περιεχόμενο ήταν κατάλληλοι κόμβοι για την άντληση πολιτικής πληροφορίας. Μέσω των παρεχόμενων υπηρεσιών άντλησης του Twitter (Twitter Developer Platform), καταρτίσαμε ένα σύνολο δεδομένων (dataset) το οποίο περιείχε αποκλειστικά τους επιλεγμένους κόμβους και τις συνδέσεις με τους ακόλουθούς τους (followers). Το κίνητρο μας για την επιλογή των συγκεκριμένων τύπων δεδομένων (δηλ. των σχέσεων κόμβου-ακόλουθου) ήταν η ύποθεσή μας ότι η δομή των σχέσεων μεταξύ χρηστών του μέσου αρκεί για την αποτύπωση και εξαγωγή αξιοποιήσιμης πληροφορίας. Επιπρόσθετα, η εστίαση στους ακόλουθους των κόμβων ενδιαφέροντος ενισχύει τον ισχυρισμό μας για ύπαρξη εγγενούς πληροφορίας καθώς οι κόμβοι αυτοί δεν μπορούν να επιλέξουν τους χρήστες που τους ακολουθούν.

Σε μια πρώτη προσέγγιση ανάλυσης του συνόλου δεδομένων, εφαρμόσαμε δημοφιλής αλγόριθμους κατάταξης (classification algorithms) με σκοπό να ερευνήσουμε κατά πόσο οι συνδέσεις ενός χρήστη-ακόλουθου με τους κόμβους ενδιαφέροντος μπορούσαν να χρησιμοποιηθούν για την πρόβλεψη της σύνδεσής του με άλλους κόμβους ενδιαφέροντος. Η βασική ιδέα της προσέγγισής μας συνοψίζεται στο γνωμικό “Δείξε μου τους φίλους σου για να σου πω ποιος είσαι” ή αλλιώς, κατά την πιο αρμόζουσα εκδοχή του για την περίπτωσή μας, “Δείξε μου ποιον ακολουθείς για να εκτιμήσω ποιον άλλον ακολουθείς“. Τα αποτελέσματα των πειραμάτων μας επιβεβαίωσαν την υπόθεσή μας για την ύπαρξη αξιοποιήσιμης πληροφορίας. Ενδεικτικά, στις Εικόνες 2 & 3 εμφανίζονται οι παράγοντες συσχέτισης των αποτελεσμάτων που προέκυψαν από πειράματα για την πρόβλεψη σύνδεσης μεταξύ χρηστών και κομμάτων. Αναλυτικότερη περιγραφή των πειραμάτων και παρουσίαση των αποτελεσμάτων υπάρχει στη σχετική δημοσίευση (Briola 2018).


Εικόνα 2: Γράφημα με τα αποτελέσματα συσχέτισης ως προς το πολιτικό κόμμα που ακολουθεί ένας χρήστης. Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.
Εικόνα 3: Γράφημα με τα αποτελέσματα συσχέτισης ως προς τους πολιτικούς που ακολουθεί ένας χρήστης. Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.

Μια δεύτερη προσέγγιση κατά την ανάλυση του συνόλου δεδομένων αφορούσε την αναπαράσταση τους με όρους γράφων. Οι σχέσεις μεταξύ των κόμβων ενδιαφέροντος (NOIs) και των ακόλουθών τους (followers) θεωρήθηκαν ως ακμές ενός διμερούς γράφου (bipartite graph) με δύο υποσύνολα κόμβων, το πρώτο για τους κόμβους ενδιαφέροντος και το δεύτερο για τους ακόλουθούς τους. Με την εφαρμογή προβολών (projections) πάνω στο υποσύνολο των κόμβων ενδιαφέροντος και με τη χρήση ενός ευρέους φάσματος συναρτήσεων στάθμισης (weighting functions) δημιουργήσαμε πλήρεις γράφους που περιείχαν μόνο τους κόμβους ενδιαφέροντος, γεγονός που μας επέτρεψε να εφαρμόσουμε αλγόριθμους από άλλα ερευνητικά πεδία και να εξάγουμε τους βαθμούς συσχέτισης μεταξύ των κόμβων αυτών. Συγκεκριμένα, με την εφαρμογή αλγόριθμων συσταδοποίησης (clustering algorithms) διαμορφώσαμε ομάδες κόμβων για τους εκλεγμένους βουλευτές και τις αντιπαραβάλαμε με τις κοινοβουλευτικές ομάδες στις οποίες πραγματικά ανήκουν. Η Εικόνα 4 απεικονίζει το αποτέλεσμα τους αλγορίθμου συσταδοποίησης όπου ο αριθμός κάθε κόμβου αντιστοιχεί στην Κοινοβουλευτική Ομάδα στην οποία ανήκει ενώ η απόχρωση του υποδηλώνει την ομάδα στην οποία κατατάχθηκε από τον αλγόριθμο.


Εικόνα 4: Αποτέλεσμα αλγόριθμου συσταδοποίησης (clustering algorithm) σε προβολή του συνόλου δεδομένων. Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.

Παράλληλα με τον αλγόριθμο συσταδοποίησης, εφαρμόσαμε μια μέθοδο εκτίμησης επίλυσης του προβλήματος ελάχιστης γραμμικής παράθεσης (minimum linear arrangement) με σκοπό να τοποθετήσουμε τους κόμβους των βουλευτών στον μονοδιάστατο χώρο. Κίνητρο μας για αυτήν την προσέγγιση ήταν η αντιπαραβολή του αποτελέσματος με τον πολιτικό άξονα αριστεράς – δεξιάς και η εξαγωγή πιθανής συσχέτισης μεταξύ τους. Η Εικόνα 5 παρουσιάζει ενδεικτικά το αποτέλεσμα της εφαρμογής του αλγορίθμου στην προσέγγισή μας σε αντιπαραβολή με την βέλτιστη τοποθέτηση των Κοινοβουλευτικών Ομάδων ως προς το αποτέλεσμα. Αναλυτικότερη παρουσίαση των πειραμάτων και των αποτελεσμάτων υπάρχει στη σχετική δημοσίευση (Stamatelatos 2018).


Εικόνα 5: Λωρίδα τοποθέτησης βουλευτών (επάνω) με την μέθοδο εκτίμησης επίλυσης του προβλήματος ελάχιστης γραμμικής παράθεσης (minimum linear arrangement) και λωρίδα τοποθέτησης κοινοβουλευτικών ομάδων (κάτω) που προσεγγίζει το αποτέλεσμα του πειράματός μας. Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.

Με αφορμή τη φύση των δεδομένων που συλλέξαμε από το Twitter, εφαρμόσαμε ένα δημοφιλές μοντέλο από το πεδίο της διάχυσης απόψεων με σκοπό να αποτιμήσουμε τους παράγοντες επιρροής τόσο των βουλευτών όσο και των μέσων μαζικής ενημέρωσης από τα κοινοβουλευτικά κόμματα. Το μοντέλο DeGroot έχει εφαρμοστεί σε πλειάδα ερευνών για την ανάλυση δεδομένων πολιτικού χαρακτήρα. Συγκεκριμένα, οι προβολές που προέκυψαν από το σύνολο δεδομένων μας ερμηνεύτηκαν με όρους κοινωνικού δικτύου όπου διαχέονται απόψεις και με την εφαρμογή του μοντέλου DeGroot με πεισματάρηδες κόμβους (stubborn agents) μπορέσαμε να αντλήσουμε τους παράγοντες επιρροής και να αναλύσουμε σύνθετα ζητήματα όπως είναι η αμεροληψία (impartiality) των ΜΜΕ. Στην Εικόνα 1 απεικονίζονται οι παράγοντες επιρροής των ΜΜΕ από τα κοινοβουλευτικά κόμματα ενώ στην Εικόνα 6 εμφανίζεται η κατάταξη των ΜΜΕ ως προς το βαθμό αμεροληψίας τους, όπως προέκυψε μετά από την εφαρμογή της τεχνικής μας. Αναλυτικότερες λεπτομέρειες υπάρχουν διαθέσιμες στις σχετικές δημοσιεύσεις (Gyftopoulos 2020, Stamatelatos 2020).


Εικόνα 6: Κατάξη των ΜΜΕ με βάση τις απαντήσεις από οκτώ (8) πολιτικούς επιστήμονες (επάνω) και κατάταξη των ΜΜΕ με βάση τους παράγοντες επιρροής που προέκυψαν με την ανάλυση DeGroot (κάτω). Δεδομένα από το Twitter σχετικά με την ελληνική πολιτική-ειδησεογραφική σκηνή τον Απρίλιο 2018.

Δημοσιεύσεις

  • @article{gyftopoulos2020twitter, title={A Twitter-based approach of news media impartiality in multipartite political scenes}, author={Gyftopoulos, Sotirios and Drosatos, George and Stamatelatos, Giorgos and Efraimidis, Pavlos S}, journal={Social Network Analysis and Mining}, volume={10}, number={36}, pages={36}, year={2020}, doi = {10.1007/s13278-020-00642-x}, url = {https://link.springer.com/article/10.1007%2Fs13278-020-00642-x}, publisher={Springer} }
  • @article{STAMATELATOS2020102172, title = {Revealing the political affinity of online entities through their Twitter followers}, journal = {Information Processing & Management}, volume = {57}, number = {2}, pages = {102172}, year = {2020}, issn = {0306-4573}, doi = {10.1016/j.ipm.2019.102172}, url = {http://www.sciencedirect.com/science/article/pii/S0306457319305023}, author = {Giorgos Stamatelatos and Sotirios Gyftopoulos and George Drosatos and Pavlos S. Efraimidis}, keywords = {Social network analysis, Twitter followers, News media, Political affinity} }
  • @inproceedings{Briola:2018, author = {Briola, Helen and Drosatos, George and Stamatelatos, Giorgos and Gyftopoulos, Sotirios and Efraimidis, Pavlos S.}, title = {Privacy Leakages about Political Beliefs through Analysis of Twitter Followers}, booktitle = {Proceedings of the 22nd Pan-Hellenic Conference on Informatics (PCI 2018)}, year = {2018}, isbn = {978-1-4503-6610-6/18/11}, location = {Athens, Greece}, pages = {1--6}, numpages = {6}, doi = {10.1145/3291533.3291557}, publisher = {ACM}, address = {New York, NY, USA}, keywords = {Social network analysis, Privacy leakages, Political beliefs, Twitter followers} }
  • @inproceedings{stamatelatos2018deriving, title={Deriving the Political Affinity of Twitter Users from Their Followers}, author={Stamatelatos, Giorgos and Gyftopoulos, Sotirios and Drosatos, George and Efraimidis, Pavlos S}, booktitle={Proceedings of the 11th IEEE International Conference on Social Computing}, doi = {10.1109/BDCloud.2018.00173}, year={2018}, organization={IEEE} }