Το Reddit ανακοίνωσε την Τρίτη ότι θα αναθεωρήσει ένα πρότυπο ιστού για να αποτρέψει την αυτοματοποιημένη απόξεση δεδομένων στην πλατφόρμα του. Η κίνηση αυτή είναι μια απάντηση σε αναφορές ότι νεοσύστατες επιχειρήσεις τεχνητής νοημοσύνης παρακάμπτουν τους υφιστάμενους κανόνες για να συλλέγουν περιεχόμενο για τα συστήματά τους. Η εταιρεία μέσων κοινωνικής δικτύωσης πρόκειται να επικαιροποιήσει το Πρωτόκολλο Αποκλεισμού Ρομπότ, κοινώς γνωστό ως "robots.txt", το οποίο υπαγορεύει τα μέρη ενός ιστότοπου στα οποία μπορούν να έχουν πρόσβαση οι αυτοματοποιημένοι ανιχνευτές.
Η απόφαση έρχεται εν μέσω ανησυχιών σχετικά με τις εταιρείες τεχνητής νοημοσύνης που φέρονται να κάνουν λογοκλοπή περιεχομένου από εκδότες για να δημιουργήσουν περιλήψεις που δημιουργούνται από τεχνητή νοημοσύνη χωρίς την κατάλληλη απόδοση ή άδεια. Τα επικαιροποιημένα μέτρα του Reddit θα περιλαμβάνουν τη διατήρηση του περιορισμού του ρυθμού για τον έλεγχο του όγκου των αιτημάτων που μπορεί να κάνει ένας χρήστης, καθώς και τον αποκλεισμό μη αναγνωρισμένων bots και crawlers από τη συλλογή δεδομένων από τον ιστότοπο.
Η χρήση του "robots.txt" έχει αποκτήσει μεγάλη σημασία καθώς οι εκδότες προσπαθούν να προστατεύσουν το περιεχόμενό τους από το να χρησιμοποιείται από εταιρείες τεχνολογίας για την εκπαίδευση αλγορίθμων τεχνητής νοημοσύνης και τη δημιουργία περιλήψεων για ορισμένα ερωτήματα αναζήτησης χωρίς αποζημίωση. Την περασμένη εβδομάδα, η TollBit, μια νεοσύστατη εταιρεία αδειοδότησης περιεχομένου, απέστειλε επιστολή στους εκδότες αποκαλύπτοντας ότι πολλές εταιρείες τεχνητής νοημοσύνης είχαν παρακάμψει το πρότυπο ιστού για να αποκόψουν περιεχόμενο από τους ιστότοπους των εκδοτών.
Μια έρευνα του Wired νωρίτερα τον Ιούνιο υπέδειξε ότι η εταιρεία αναζήτησης AI Perplexity μπορεί να έχει παρακάμψει τα μέτρα για τον αποκλεισμό του web crawler της μέσω του "robots.txt". Σε ένα σχετικό περιστατικό, το Forbes κατηγόρησε την Perplexity νωρίτερα τον Ιούνιο ότι είχε αντιγράψει τις ερευνητικές της ιστορίες για χρήση σε συστήματα γεννητικής τεχνητής νοημοσύνης χωρίς να τις αναγνωρίσει.
Παρά την αυστηροποίηση της πρόσβασης, το Reddit επιβεβαίωσε ότι ερευνητές και φορείς όπως το Internet Archive θα εξακολουθούν να έχουν πρόσβαση στο περιεχόμενό του, υπό την προϋπόθεση ότι η χρήση τους είναι μη εμπορική. Αυτό διασφαλίζει ότι ενώ η εταιρεία λαμβάνει μέτρα για την προστασία του περιεχομένου της από μη εξουσιοδοτημένη απόξεση, συνεχίζει να υποστηρίζει νόμιμες ερευνητικές και αρχειακές δραστηριότητες.
Το Reuters συνέβαλε σε αυτό το άρθρο.Aυτό το άρθρο μεταφράστηκε με τη βοήθεια της τεχνητής νοημοσύνης. Για περισσότερες πληροφορίες, δείτε τους Όρους Χρήσης