Από πού έρχονται οι ειδήσεις?

Chris Gioran bio photo By Chris Gioran

Θέλω να κάνεις ένα πείραμα μαζί μου. Θέλω να φανταστείς ότι κάποιος που δεν γνωρίζεις έρχεται και σου λέει κάτι εξωφρενικό, κάτι το οποίο δεν θεωρείς δυνατό ότι μπορεί να συμβεί - ας πούμε, ότι διαπιστώθηκε πως τελικά ο Χάρυ Πόττερ είναι Ινδιάνος, ή ότι το κράτος αρνείται να εφαρμόσει τις αποφάσεις των δικαστηρίων. Πράγματα τα οποία δεν χωράνε στην σφαίρα της πραγματικότητας.

Σε αυτό το σενάριο, ποια θα ήταν μία ερώτηση την οποία όλοι θα κάναμε?

“Πού το έμαθες?”

Αργά ή γρήγορα, εξισώνουμε την αξιοπιστία μίας είδησης με την αξιοπιστία της πηγής. Αν κάποιος γνωστός μας λέει πληροφορίες που είναι γενικά ακριβείς, τότε ειδήσεις από αυτόν τις αντιμετωπίζουμε με περισσότερη καλή πίστη από ότι αυτές που διαδίδει ο τρελός της γειτονιάς. Ακόμη και στην περίπτωση του τρελού όμως, αν μας πει ότι υπάρχουν βουλευτές που δηλώνουν μηδέν (αριθ: 0) εισόδημα και μας δείξει το site της Βουλής ως αποδεικτικό, τότε δεν μπορούμε παρά να τον πιστέψουμε. Αν, αντίστοιχα, ο αξιόπιστος γνωστός υποστηρίξει πως υπάρχουν δεινόσαυροι στο φεγγάρι, θα δυσκολευτούμε να το δεχτούμε και μάλλον θα ζητήσουμε κάποιου είδους απόδειξη.

Το οποίο μας φέρνει σε μία ενδιαφέρουσα ερώτηση. Πόσο αξιόπιστα είναι τα ελληνικά ειδησεογραφικά site?

Ας πάρουμε για παράδειγμα ένα από τα πιο δημοφιλή site στην Ελλάδα, το in.gr από τον Δημοσιογραφικό Οργανισμό Λαμπράκη (ΔΟΛ), το οποίο με βάση τo alexa.com είναι 17ο σε επισκεψιμότητα στην Ελλάδα (την ημερομηνία συγγραφής). Ορίστε ένα παράδειγμα του πως το in.gr αναφέρει τις πηγές του.

Παράδειγμα αναφοράς πηγής στο in.gr

Σε αυτό το παράδειγμα, η είδηση έρχεται από την αίθουσα σύνταξης του ΔΟΛ, με πληροφορίες από το Αθηναϊκό-Μακεδονικό πρακτορείο ειδήσεων (ΑΜΠΕ). Αυτό σημαίνει ότι η ομάδα σύνταξης του ΔΟΛ πήρε αυτή την είδηση από το ΑΜΠΕ, την άλλαξε κάπως και την δημοσίευσε στο site του.

Πόσο αξιόπιστο λοιπόν είναι το ΑΜΠΕ?

Προτού απαντήσουμε αυτό το ερώτημα, ας πούμε τι είναι το ΑΜΠΕ.

Το ΑΜΠΕ, όπως λέει και η Βικιπεδία, είναι εδώ και πάνω από έναν αιώνα ο εθνικός δημοσιογραφικός οργανισμός της Ελλάδας. Η τελευταία τροποποίηση του καθεστώτος λειτουργίας του έγινε το 2008 με το Προεδρικό διάταγμα 191/2008, το οποίο δημιουργεί το ΑΠΕ-ΜΠΕ συνενώνοντας το Αθηναϊκό πρακτορείο με το Μακεδονικό πρακτορείο. Αν διαβάσετε το προεδρικό διάταγμα θα δείτε ότι κάθε άποψη λειτουργίας του πρακτορείου ελέγχεται από το κράτος, ξεκινώντας από την σύσταση του διοικητικού συμβουλίου και καταλήγοντας στον προϋπολογισμό. Με άλλα λόγια, το ΑΜΠΕ ελέγχεται και χρηματοδοτείται από το κράτος (ορίστε, για παράδειγμα έγκριση για 1.650.000 ευρώ, προς το ΑΠΕ-ΜΠΕ τον Απρίλιο του 2013, για πληρωμή των αποδοχών του προσωπικού του).

Όλα αυτά σημαίνουν ότι το ΑΜΠΕ είναι κρατικό όργανο το οποίο έχει ως αποστολή να παράγει και να μοιράζει ειδήσεις. Τίποτα στην προηγούμενη πρόταση δεν είναι εικασία, τίποτα δεν είναι κρυφό ή αντικανονικό.

Το αν είναι γνωστό ευρέως ή όχι είναι άλλη υπόθεση. Εγώ τουλάχιστον δεν το ήξερα πριν αρχίσω να ερευνώ αυτό το άρθρο. Και εδώ θα κάνω μία λιγάκι πονηρή ερώτηση: ποια νομίζεις ότι είναι η αξιοπιστία, η αμεροληπτότητα και η αντικειμενικότητα του κρατικού οργανισμού ειδήσεων? Δεν θα την απαντήσω για εσένα, απλά αναρωτήσου.

Μα δεν διαβάζω το ΑΜΠΕ - δεν ήξερα καν ότι υπάρχει

Αυτή ήταν η αρχική αντίδρασή μου. Εντάξει, “ξέρω” πως ότι ειδήσεις λέει η ΕΡΤ (ή η ΝΕΡΙΤ ή όπως θα την λένε αύριο) έρχονται με την έγκριση του κράτους και τείνω να μην τους δίνω μεγάλη βαρύτητα. Αντ’ αυτού προτιμώ μη κρατικά μέσα ενημέρωσης, τα οποία δεν εξαρτώνται από κρατική χρηματοδότηση και όποιες συνέπειες μπορεί να έχει αυτή.

Μη κρατικά μέσα λοιπόν. Όπως ας πούμε το in.gr? Ή την Καθημερινή? Ή την Ελευθεροτυπία?

Σωστά. Αλλά παραπάνω είδαμε ένα παράδειγμα από τον ΔΟΛ που χρησιμοποίησε σαν πηγή του το ΑΜΠΕ. Αντίστοιχα παραδείγματα υπάρχουν και στην Καθημερινή, την Ελευθεροτυπία και άλλα ελληνικά δημοσιογραφικά site. Πόσο εκτεταμένη είναι άραγε η χρήση του ΑΜΠΕ σαν πηγή ειδήσεων από ιδιωτικά ενημερωτικά μέσα?

Απαντώντας στο αρχικό ερώτημα - από πού έρχονται, τελικά, οι ειδήσεις?

Αυτή η απορία μου προέκυψε πριν από ένα μήνα περίπου. Άρχισα λοιπόν να καταγράφω για κάθε site πόσα άρθρα αναφέρουν την πηγή των πληροφοριών τους και ποια είναι αυτή.

Τα site που επέλεξα ήταν

Γιατί αυτά? Υπάρχουν πολλά ακόμη site που προσφέρουν ενημέρωση - zougla.gr, enikos.gr, iefimerida.gr, news247.gr κλπ. Το πρόβλημα με όλα αυτά είναι πως, εκτός του ότι ο σχεδιασμός των σελίδων τους με φέρνει σε όρια επιληψίας, σε ελάχιστες περιπτώσεις αναφέρουν πληροφορίες για την προέλευση του περιεχομένου τους. Θα ήθελα να έχω ένα πιο ολοκληρωμένο δείγμα της ελληνικής πραγματικότητας αλλά χωρίς τεχνικές λεξικολογικής και χρονικής ανάλυσης δεν γίνεται.

Ας ασχοληθούμε με αυτούς τους τρεις λοιπόν. Ποια είναι τα δεδομένα του τελευταίου μήνα?

Τα νούμερα - τα οποία είναι χρήσιμα να ξέρεις για να καταλάβεις το συμπέρασμα

Αρχικά, να σου πω το ποσοστό ειδήσεων εγχώριου ενδιαφέροντος οι οποίες έρχονται από το ΑΜΠΕ, ανά site (βασισμένο σε 4224 άρθρα):

  • in.gr : 36%
  • Καθημερινή : 33%
  • Ελευθεροτυπία : 7% (ή 52%, δείτε παρακάτω)

Προτού πάμε παρακάτω, να σημειώσω ότι η περίπτωση της Ελευθεροτυπίας είναι αναξιόπιστη - την περιλαμβάνω σαν παράδειγμα κακής ποιότητας δεδομένων, αν και απείρως κάλυτερη από άλλα site. Το πρόβλημα είναι πως σε σύνολο 867 άρθρων της Ελευθεροτυπίας, μόνο τα 127 έχουν οποιαδήποτε αναφορά σε πηγή - τα υπόλοιπα δεν αναφέρουν προέλευση. Στις περιπτώσεις που αναφέρεται πηγή, υπάρχουν παραδείγματα όπως “newsroom enet” ή κάτι σχετικό, που σημαίνει ότι υπάρχει δυνατότητα αναφοράς από την Ελευθεροτυπία, απλά δεν το συνηθίζει. Ενδιαφέρον είναι ότι σε αυτά τα 127 άρθρα, τα 66 είναι από ΑΜΠΕ, ανεβάζοντας το ποσοστό σε 52%. Τα δεδομένα σε αυτή τη περίπτωση δεν μπορούν να οδηγήσουν σε κάποιο συμπέρασμα, πέραν του ότι στο 88% των άρθρων της η Ελευθεροτυπία δεν θεωρεί απαραίτητο να αναφέρει από πού παίρνει τις πληροφορίες της.

Κατά μέσο όρο λοιπόν, το 1/3 των ειδήσεων από αυτά τα 3 site έρχονται, άμεσα ή έμμεσα, από μία κρατικά ελεγχόμενη πηγή. Αυτό φυσικά από μόνο του δεν κάνει αυτούς τους οργανισμούς φερέφωνα της κυβέρνησης. Οι ειδήσεις αυτές είναι κυρίως βραχυπρόθεσμου ενδιαφέροντος και ανήκουν σε αυτό που λέγεται “ροή” - κείμενα που αναφέρουν με ελάχιστο άμεσο σχολιασμό κάποιο περιστατικό της επικαιρότητας. Με άλλα λόγια, η πρακτική αυτή είναι υπερασπίσιμη ως “κοινή δημοσιογραφική τακτική” που εξασφαλίζει άμεση ενημέρωση με χαμηλό κόστος.

Εντάξει λοιπόν, ένα μέρος των ειδήσεων έχει πηγή το κράτος. Πού είναι το πρόβλημα?

Σε όλα αυτά δεν με ενοχλεί τόσο το ότι το κράτος έχει τη δική του πηγή ειδήσεων. Κάθε σύστημα εξουσίας χρειάζεται ένα μέσο για έλεγχο εντυπώσεων και ενίοτε διάδοση προπαγάνδας. Είναι αναμενόμενο. Όταν όμως αυτή η πηγή χρησιμοποιείται από ανεξάρτητους δημοσιογράφους για κάλυψη της επικαιρότητας, αρχίζω να αμφισβητώ τόσο το ήθος τους όσο και την ανεξαρτησία τους.

Αξίζει να αναρωτηθείς το εξής. Τα 2/3 των άρθρων τα οποία δεν είναι κρατικής προέλευσης, τι περιεχόμενο έχουν? Δεν μπορώ να κάνω μία απόλυτη δήλωση γιατί άνθρωπος είμαι, μπορεί να μου έχει ξεφύγει κάτι. Αλλά με βεβαιότητα μπορώ να πω ότι δεν έχω δει ποτέ ένα άρθρο το οποίο να είναι προϊόν δημοσιογραφικής έρευνας - όλα τα κείμενα είναι είτε γνώμες επί των γεγονότων που μοιράζει το ΑΜΠΕ είτε αναπαραγωγή περιεχομένου άλλων σελίδων ή εφημερίδων του εξωτερικού. Αν το πω διαφορετικά, το κρατικής προέλευσης 1/3 των άρθρων είναι το μόνο ποσοστό που προσφέρει ενημέρωση. Δυσκολεύομαι να συμφιλιώσω αυτή τη συμπεριφορά με το λειτούργημα που περιμένω από τη δημοσιογραφία.

Τελικά

1800 λέξεις ίσως είναι πολλές για να περιγραφεί κάτι που δεν προκαλεί σοκ και δέος - γιατί, τελικά, ποιος εμπιστεύεται τους δημοσιογράφους σήμερα? Ο λόγος για τον οποίο έγραψα το παρών δεν είναι για να κατηγορήσω τον Λαμπράκη ή τον Τεγόπουλο - τα νούμερα το κάνουν αυτό χωρίς τη βοήθειά μου. Είναι ένας πρόλογος που παραθέτει τα ενδιαφέροντά μου για το άμεσο μέλλον, ξεκινώντας με την κατανόηση και περιγραφή του προβλήματος: γιατί οι δημοσιογράφοι δεν χαίρουν εμπιστοσύνης και τι μπορούμε να κάνουμε σαν κοινωνία για αυτό.


Πως το έκανα (λίγα λόγια για την μεθοδολογία συλλογής που ακολούθησα)

Ακολουθεί μία βασική ανάλυση του κώδικα που έγραψα και χρησιμοποίησα για να μαζέψω τα δεδομένα που αναφέρω σε αυτό το άρθρο. Το κάνω για 2 λόγους.

Αρχικά, γιατί σας διηγήθηκα μία ιστορία βασισμένη σε αριθμούς. Προσπάθησα να εξηγήσω τι σημαίνουν αυτά τα νούμερα και να βγάλω κάποια συμπεράσματα. Επομένως, η αξιοπιστία της διήγησής μου είναι τόσο υψηλή όσο η αξιοπιστία των αριθμών που χρησιμοποίησα. Δεν υπάρχει καλύτερος τρόπος να σας πείσω για την ορθότητα των σκέψεών μου από το να σας δείξω πως προέκυψαν τα δεδομένα μου και πως μπορούν να αναπαραχθούν.

Κατά δεύτερο, ελπίζω κάποιος να διαβάσει τον κώδικα και να εμπνευστεί να κάνει κάτι καλύτερο. Αν και δεν νομίζω ότι υπάρχουν λάθη στην μικρή εφαρμογή που έγραψα, πάντα κάποιος μπορεί να προτίνει τρόπους που τα νούμερα μπορούν να γίνουν πιο επεξηγηματικά ή να πουν μία διαφορετική ιστορία. Κάθε γραμμή κώδικα που γράφω την κάνω πάντα διαθέσιμη, και δεν θα μπορούσα να κάνω διαφορετικά σε αυτή την περίπτωση.

Η βάση δεδομένων που κρατά όλες τις πληροφορίες από τότε που ξεκίνησα αυτή την έρευνα και που χρησιμοποίησα για αυτό το άρθρο είναι διαθέσιμη σε όποιον τη ζητήσει.

Ας αρχίσουμε λοιπόν το τεχνικό κομμάτι - πολύ φοβάμαι ότι αν δεν γνωρίζετε προγραμματισμό τα παρακάτω δεν θα σας γίνουν ιδιαίτερα κατανοητά. Ίσως, αν ζητηθεί, να κάνω κάποια στιγμή μία πιο προσιτή ανάλυση.

Αρχικά, το script είναι γραμμένο σε Ruby και είναι διαθέσιμο εδώ. Η βασική λειτουργία έχει ως εξής.

Για κάθε ένα από τα 3 site ανοίγονται τα RSS feeds τα οποία είναι διαθέσιμα από την αρχική τους σελίδα. Και τα 3 site κάνουν διαθέσιμα feeds ανά κατηγορία - αρχικά έκανα parse το συνολικό feed που επίσης και τα 3 προσφέρουν αλλά το πλήθος των άρθρων που είναι αδιάφορα ήταν πολύ μεγάλο και δυσχέραινε την κατηγοριοποίηση. Για αυτό το λόγο λαμβάνω τα feeds μόνο των κατηγοριών που σχετίζονται με την ελληνική πραγματικότητα.

Κάθε ένα feed γίνεται parse από το Nokogiri gem και εξάγονται τα links προς τις ιστορίες, καθώς και άλλα ενδιαφέροντα metadata, όπως η ημερομηνία, ο τίτλος και το GUID. Το τελευταίο είναι και το κλειδί στην βάση. Πρωτού γίνει retrieve το άρθρο γίνεται μια αναζήτηση στη βάση για το κλειδί - αν είναι παρών, το άρθρο υπάρχει ήδη και παρακάμπτεται.

Αν το άρθρο δεν είναι στη βάση, γίνεται ένα CSS query στην HTML αναπαράσταση για ένα path το οποίο έχω πειραματικά διαπιστώσει πως μοναδικά χαρακτηρίζει το πεδίο που περιέχει την αναφορά προς την πηγή. Αυτό είναι διαφορετικό για κάθε site, φυσικά. Στην περίπτωση της Enet η κατάσταση είναι λιγάκι hit and miss, γιατί έχουν σποραδικά πηγές χωρίς να τους δίνουν κάποιο identifier που να είναι parseable - είναι απλά, καμμιά φορά, στο τελευταίο div του κυρίως άρθρου. Γενικά, αυτή η πηγή είναι η πιο αναξιόπιστη με τα περισσότερα false negatives.

Όταν τελειώσει η εξαγωγή της πηγής, το άρθρο αποθηκεύεται στην βάση με τα metadata από το RSS feed, την πηγή καθώς και το site και την κατηγορία που ανήκει όπως αυτά ορίζονται από το URL του RSS feed.

Η βάση είναι ένα sqlite3 instance το οποίο γράφεται απ’ ευθείας από το script. Το schema είναι ένας πίνακας με ένα row για κάθε άρθρο χωρίς καμία κανονικοποίηση. Το schema βρίσκεται στην αρχή του script σαν definition για το data mapper gem που χρησιμοποιώ σαν ORM.