Η εταιρεία διαδικτύου Cloudflare θα αρχίσει να εμποδίζει τα bots τεχνητής νοημοσύνης να έχουν πρόσβαση σε περιεχόμενο χωρίς την άδεια ή την αποζημίωση των κατόχων ιστότοπων από προεπιλογή (default), σε μια κίνηση που θα μπορούσε να επηρεάσει σημαντικά την ικανότητα των προγραμματιστών τεχνητής νοημοσύνης να εκπαιδεύουν τα μοντέλα τους.
Από την Τρίτη, κάθε νέο διαδικτυακό domain που εγγράφεται στο Cloudflare θα ερωτάται εάν θέλει να επιτρέψει τους ανιχνευτές τεχνητής νοημοσύνης, δίνοντάς τους ουσιαστικά τη δυνατότητα να εμποδίζουν τα bots να συλλέγουν δεδομένα από τους ιστότοπούς τους. Η εταιρεία θα επιτρέψει επίσης στους εκδότες να χρεώνουν τους ανιχνευτές τεχνητής νοημοσύνης για πρόσβαση χρησιμοποιώντας ένα νέο μοντέλο “πληρωμή ανά ανίχνευση”.
Περίπου το 16% της παγκόσμιας διαδικτυακής κίνησης διέρχεται απευθείας μέσω του CDN της Cloudflare
Το Cloudflare είναι αυτό που ονομάζεται δίκτυο παράδοσης περιεχομένου ή CDN. Βοηθά τις επιχειρήσεις να παρέχουν διαδικτυακό περιεχόμενο και εφαρμογές πιο γρήγορα, αποθηκεύοντας τα δεδομένα στην προσωρινή μνήμη πιο κοντά στους τελικούς χρήστες. Παίζουν σημαντικό ρόλο στη διασφάλιση ότι οι άνθρωποι μπορούν να έχουν πρόσβαση σε περιεχόμενο ιστού απρόσκοπτα κάθε μέρα.
Περίπου το 16% της παγκόσμιας διαδικτυακής κίνησης διέρχεται απευθείας μέσω του CDN της Cloudflare, σύμφωνα με εκτίμηση της εταιρείας σε έκθεση του 2023.
«Οι ανιχνευτές τεχνητής νοημοσύνης (AI crawlers) συλλέγουν περιεχόμενο χωρίς όρια. Στόχος μας είναι να δώσουμε πίσω τη δύναμη στα χέρια των δημιουργών, βοηθώντας παράλληλα τις εταιρείες τεχνητής νοημοσύνης να καινοτομήσουν», δήλωσε ο Matthew Prince, συνιδρυτής και διευθύνων σύμβουλος της Cloudflare, σε δήλωσή του την Τρίτη.
«Πρόκειται για τη διασφάλιση του μέλλοντος ενός ελεύθερου και δυναμικού Διαδικτύου με ένα νέο μοντέλο που λειτουργεί για όλους», πρόσθεσε.
Τι είναι οι ανιχνευτές τεχνητής νοημοσύνης;
Οι ανιχνευτές τεχνητής νοημοσύνης (AI crawlers) είναι αυτοματοποιημένα bots που έχουν σχεδιαστεί για να εξάγουν μεγάλες ποσότητες δεδομένων από ιστότοπους, βάσεις δεδομένων και άλλες πηγές πληροφοριών για την εκπαίδευση μεγάλων γλωσσικών μοντέλων από εταιρείες όπως το OpenAI και η Google.
Ενώ το διαδίκτυο στο παρελθόν αντάμειβε τους δημιουργούς κατευθύνοντας τους χρήστες σε πρωτότυπους ιστότοπους, σύμφωνα με την Cloudflare, σήμερα οι ανιχνευτές τεχνητής νοημοσύνης σπάνε αυτό το μοντέλο συλλέγοντας κείμενο, άρθρα και εικόνες για να δημιουργήσουν απαντήσεις σε ερωτήματα με τρόπο που οι χρήστες δεν χρειάζεται να επισκέπτονται την αρχική πηγή.
Αυτό, προσθέτει η εταιρεία, στερεί από τους εκδότες ζωτικής σημασίας επισκεψιμότητα και, με τη σειρά του, έσοδα από την online διαφήμιση.
Η επιλογή της Cloudflare βασίζεται σε ένα εργαλείο που λάνσαρε τον Σεπτέμβριο του περασμένου έτους, το οποίο έδωσε στους εκδότες τη δυνατότητα να μπλοκάρουν τους ανιχνευτές τεχνητής νοημοσύνης με ένα μόνο κλικ. Τώρα, η εταιρεία προχωρά ένα βήμα παραπέρα, καθιστώντας αυτό προεπιλογή για όλους τους ιστότοπους στους οποίους παρέχει υπηρεσίες.
Η OpenAI δήλωσε ότι αρνήθηκε να συμμετάσχει όταν η Cloudflare παρουσίασε την προεπισκόπηση του σχεδίου της να αποκλείει τους ανιχνευτές τεχνητής νοημοσύνης από προεπιλογή, με το σκεπτικό ότι το δίκτυο παροχής περιεχομένου προσθέτει έναν μεσάζοντα στο σύστημα.
Η εταιρεία τεχνητής νοημοσύνης που υποστηρίζεται από τη Microsoft τόνισε τον ρόλο της ως πρωτοπόρου στη χρήση του robots.txt, ενός συνόλου κώδικα που αποτρέπει την αυτοματοποιημένη συλλογή δεδομένων ιστού, και είπε ότι οι ανιχνευτές του σέβονται τις προτιμήσεις των εκδοτών.
«Οι ανιχνευτές τεχνητής νοημοσύνης θεωρούνται συνήθως πιο επεμβατικοί και επιλεκτικοί όσον αφορά τα δεδομένα που καταναλώνουν. Έχουν κατηγορηθεί ότι κατακλύζουν τους ιστότοπους και επηρεάζουν σημαντικά την εμπειρία των χρηστών», δήλωσε στο CNBC ο Matthew Holman, συνεργάτης της βρετανικής δικηγορικής εταιρείας Cripps.
«Εάν είναι αποτελεσματική, η ανάπτυξη θα εμποδίσει την ικανότητα των chatbot τεχνητής νοημοσύνης να συλλέγουν δεδομένα για σκοπούς εκπαίδευσης και αναζήτησης», πρόσθεσε. «Αυτό είναι πιθανό να οδηγήσει σε βραχυπρόθεσμο αντίκτυπο στην εκπαίδευση μοντέλων τεχνητής νοημοσύνης και θα μπορούσε, μακροπρόθεσμα, να επηρεάσει τη βιωσιμότητα των μοντέλων».
Πηγή: ot.gr