💎 Δείτε τις πιο υγιείς εταιρείες στη σημερινή αγοράΈναρξη

Το Reddit σφίγγει την πρόσβαση για να αποτρέψει τους scrapers δεδομένων

Δημοσιεύτηκε 25.06.2024, 11:58 μ.μ
© Reuters.

Το Reddit ανακοίνωσε την Τρίτη ότι θα αναθεωρήσει ένα πρότυπο ιστού για να αποτρέψει την αυτοματοποιημένη απόξεση δεδομένων στην πλατφόρμα του. Η κίνηση αυτή είναι μια απάντηση σε αναφορές ότι νεοσύστατες επιχειρήσεις τεχνητής νοημοσύνης παρακάμπτουν τους υφιστάμενους κανόνες για να συλλέγουν περιεχόμενο για τα συστήματά τους. Η εταιρεία μέσων κοινωνικής δικτύωσης πρόκειται να επικαιροποιήσει το Πρωτόκολλο Αποκλεισμού Ρομπότ, κοινώς γνωστό ως "robots.txt", το οποίο υπαγορεύει τα μέρη ενός ιστότοπου στα οποία μπορούν να έχουν πρόσβαση οι αυτοματοποιημένοι ανιχνευτές.

Η απόφαση έρχεται εν μέσω ανησυχιών σχετικά με τις εταιρείες τεχνητής νοημοσύνης που φέρονται να κάνουν λογοκλοπή περιεχομένου από εκδότες για να δημιουργήσουν περιλήψεις που δημιουργούνται από τεχνητή νοημοσύνη χωρίς την κατάλληλη απόδοση ή άδεια. Τα επικαιροποιημένα μέτρα του Reddit θα περιλαμβάνουν τη διατήρηση του περιορισμού του ρυθμού για τον έλεγχο του όγκου των αιτημάτων που μπορεί να κάνει ένας χρήστης, καθώς και τον αποκλεισμό μη αναγνωρισμένων bots και crawlers από τη συλλογή δεδομένων από τον ιστότοπο.

Η χρήση του "robots.txt" έχει αποκτήσει μεγάλη σημασία καθώς οι εκδότες προσπαθούν να προστατεύσουν το περιεχόμενό τους από το να χρησιμοποιείται από εταιρείες τεχνολογίας για την εκπαίδευση αλγορίθμων τεχνητής νοημοσύνης και τη δημιουργία περιλήψεων για ορισμένα ερωτήματα αναζήτησης χωρίς αποζημίωση. Την περασμένη εβδομάδα, η TollBit, μια νεοσύστατη εταιρεία αδειοδότησης περιεχομένου, απέστειλε επιστολή στους εκδότες αποκαλύπτοντας ότι πολλές εταιρείες τεχνητής νοημοσύνης είχαν παρακάμψει το πρότυπο ιστού για να αποκόψουν περιεχόμενο από τους ιστότοπους των εκδοτών.

Μια έρευνα του Wired νωρίτερα τον Ιούνιο υπέδειξε ότι η εταιρεία αναζήτησης AI Perplexity μπορεί να έχει παρακάμψει τα μέτρα για τον αποκλεισμό του web crawler της μέσω του "robots.txt". Σε ένα σχετικό περιστατικό, το Forbes κατηγόρησε την Perplexity νωρίτερα τον Ιούνιο ότι είχε αντιγράψει τις ερευνητικές της ιστορίες για χρήση σε συστήματα γεννητικής τεχνητής νοημοσύνης χωρίς να τις αναγνωρίσει.

Παρά την αυστηροποίηση της πρόσβασης, το Reddit επιβεβαίωσε ότι ερευνητές και φορείς όπως το Internet Archive θα εξακολουθούν να έχουν πρόσβαση στο περιεχόμενό του, υπό την προϋπόθεση ότι η χρήση τους είναι μη εμπορική. Αυτό διασφαλίζει ότι ενώ η εταιρεία λαμβάνει μέτρα για την προστασία του περιεχομένου της από μη εξουσιοδοτημένη απόξεση, συνεχίζει να υποστηρίζει νόμιμες ερευνητικές και αρχειακές δραστηριότητες.

Το Reuters συνέβαλε σε αυτό το άρθρο.

Aυτό το άρθρο μεταφράστηκε με τη βοήθεια της τεχνητής νοημοσύνης. Για περισσότερες πληροφορίες, δείτε τους Όρους Χρήσης

Τελευταία σχόλια

Εγκατέστησε την εφαρμογή μας
Γνωστοποίηση Ρίσκου: Οι συναλλαγές με χρηματοοικονομικά μέσα ή/και κρυπτονομίσματα εμπεριέχουν υψηλό κίνδυνο συμπεριλαμβανομένου του κινδύνου απώλειας μερικής ή ολόκληρης της επένδυσης και μπορεί να μην είναι κατάλληλες για όλους τους επενδυτές. Οι τιμές των κρυπτονομισμάτων είναι εξαιρετικά ασταθείς και μπορούν να επηρεαστούν από εξωτερικούς παράγοντες, όπως χρηματοπιστωτικά, εποπτικά και πολιτικά γεγονότα. Οι συναλλαγές με περιθώριο αυξάνουν τους χρηματοπιστωτικούς κινδύνους.
Πριν αποφασίσετε να κάνετε συναλλαγές με χρηματοοικονομικό μέσο ή κρυπτονομίσματα θα πρέπει να ενημερωθείτε πλήρως για τους κινδύνους και τα κόστη που συσχετίζονται με τις συναλλαγές στις χρηματοπιστωτικές αγορές, να εξετάσετε προσεκτικά τους επενδυτικούς σας στόχους, το επίπεδο της εμπειρίας σας και τη διάθεση ανάληψης κινδύνου και να αναζητήστε επαγγελματικές συμβουλές όταν χρειάζεται.
Η Fusion Media σας υπενθυμίζει ότι τα δεδομένα που εμπεριέχονται σε αυτόν τον ιστότοπο δεν είναι απαραίτητα πραγματικού χρόνου ούτε ακριβή. Τα δεδομένα και οι τιμές στον ιστότοπο δεν παρέχονται απαραίτητα από κάποια αγορά ή χρηματιστήριο αλλά μπορεί να παρέχονται από ειδικούς διαπραγματευτές και συνεπώς μπορεί να μην είναι ακριβή και να διαφέρουν από την πραγματική τιμή σε οποιαδήποτε δεδομένη αγορά, κάτι που σημαίνει ότι οι τιμές είναι ενδεικτικές και ακατάλληλες για σκοπούς συναλλαγών. Η Fusion Media και κάθε πάροχος των δεδομένων που εμπεριέχονται σε αυτόν τον ιστότοπο δεν φέρει ουδεμία ευθύνη για οποιαδήποτε απώλεια ή ζημία ως αποτέλεσμα των συναλλαγών σας ή της εξάρτησής σας από τις πληροφορίες που εμπεριέχονται σε αυτόν τον ιστότοπο.
Απαγορεύεται η χρήση, η αποθήκευση, η αναπαραγωγή, η εμφάνιση, η τροποποίηση, η μετάδοση ή η διανομή των δεδομένων που εμπεριέχονται στον παρόντα ιστότοπο χωρίς προηγούμενη ρητή έγγραφη άδεια της Fusion Media ή/και του παροχέα δεδομένων. Όλα τα δικαιώματα πνευματικής ιδιοκτησίας διατηρούνται από τους παρόχους ή/και το χρηματιστήριο που παρέχουν τα δεδομένα που εμπεριέχονται σε αυτόν τον ιστότοπο.
Η Fusion Media μπορεί να αποζημιωθεί από τους διαφημιζόμενους που εμφανίζονται στον ιστότοπο, με βάση την αλληλεπίδραση σας με τις διαφημίσεις ή με τους διαφημιζόμενους.
© 2007-2024 - Fusion Media Limited. Με Επιφύλαξη Παντός Δικαιώματος.