Οι κινεζικές εταιρείες AI αποκτούν προβάδισμα έναντι των αμερικανικών ανταγωνιστών στη δημιουργία βίντεο, σε έναν από τους πλέον κρίσιμους και ταχέως αναπτυσσόμενους τομείς της γενετικής AI, με άμεσες εφαρμογές στη διαφήμιση, το ηλεκτρονικό εμπόριο και την ψυχαγωγία.
Όμιλοι όπως η ByteDance και η Kuaishou αξιοποιούν τη μαζική παραγωγή δεδομένων από πλατφόρμες σύντομων βίντεο για να εκπαιδεύσουν τα μοντέλα τους, αποκτώντας συγκριτικό πλεονέκτημα έναντι δυτικών εταιρειών. Η πρόσβαση σε τεράστιες βιβλιοθήκες περιεχομένου —ιδίως μέσω εφαρμογών όπως το TikTok— φαίνεται να λειτουργεί ως καταλύτης για την ταχύτερη βελτίωση της ποιότητας και του ρεαλισμού των παραγόμενων βίντεο.
Η εξέλιξη αυτή αναδεικνύει μια σαφή απόκλιση στην παγκόσμια κούρσα της τεχνητής νοημοσύνης. Ενώ αμερικανικές εταιρείες όπως η OpenAI, η Google και η Anthropic διατηρούν ηγετική θέση στα μεγάλα γλωσσικά μοντέλα και σε εφαρμογές όπως η παραγωγή κώδικα, υστερούν —σύμφωνα με προγραμματιστές και αξιολογήσεις χρηστών— στον τομέα της δημιουργίας βίντεο, τόσο σε ποιότητα όσο και σε πρακτική χρηστικότητα.
Οι δυνατότητες παραγωγής βίντεο σε μαζική κλίμακα αλλάζουν τα δεδομένα στη διαφήμιση και το ηλεκτρονικό εμπόριο
Καθοριστικός παράγοντας είναι η ίδια η φύση των δεδομένων. Σε αντίθεση με το κείμενο, το οποίο μπορεί να συλλεχθεί και να αναλυθεί πιο εύκολα, το βίντεο απαιτεί πολύ μεγαλύτερους όγκους υψηλής ποιότητας υλικού. Οι κινεζικές πλατφόρμες διαθέτουν ήδη αυτό το πλεονέκτημα, ενώ ορισμένοι ειδικοί επισημαίνουν ότι λειτουργούν και με πιο επιθετικές πρακτικές όσον αφορά τη χρήση περιεχομένου, εγείροντας παράλληλα ζητήματα πνευματικών δικαιωμάτων.
Στην πράξη, οι δημιουργοί περιεχομένου φαίνεται να επιλέγουν ολοένα και περισσότερο κινεζικά εργαλεία. Ο Μπεν Τσιάνγκ, ιδρυτής της Director AI, σημειώνει στους Financial Times ότι τα περισσότερα αμερικανικά μοντέλα που έχει δοκιμάσει υστερούν στην παραγωγή ρεαλιστικών βίντεο, ενώ οι αυστηρότεροι περιορισμοί περιεχομένου περιορίζουν τη λειτουργικότητά τους. Η εταιρεία του χρησιμοποιεί κυρίως το Kling της Kuaishou, καθώς και τα Seedance 2.0 της ByteDance και Hailuo της MiniMax, ανάλογα με το κόστος και τις απαιτήσεις κάθε έργου.
Η βελτίωση των επιδόσεων είναι ήδη ορατή σε κρίσιμα τεχνικά σημεία, όπως ο συγχρονισμός ήχου, η σταθερότητα των χαρακτήρων και η διατήρηση οπτικής συνέπειας σε σκηνές με έντονη κίνηση. Δημιουργοί αναφέρουν ότι τα νεότερα μοντέλα διαχειρίζονται πολύπλοκες γωνίες λήψης και γρήγορες εναλλαγές χωρίς τις παραμορφώσεις που χαρακτήριζαν παλαιότερες γενιές.
Ενδεικτικό της προόδου είναι ότι μοντέλα όπως τα Kling, Seedance 2.0 και HappyHorse 1.0 καταγράφουν κορυφαίες επιδόσεις σε ανεξάρτητες πλατφόρμες αξιολόγησης, βασισμένες σε ψήφους χρηστών. Αντίθετα, δυτικά μοντέλα όπως το Veo 3 της Google παραμένουν ανταγωνιστικά αλλά υπόκεινται σε περισσότερους περιορισμούς χρήσης, παρά το πλεονέκτημα πρόσβασης σε δεδομένα από το YouTube.
Παράλληλα, η εμπορική αξιοποίηση της τεχνολογίας επιταχύνεται. Οι δυνατότητες παραγωγής βίντεο σε μαζική κλίμακα αλλάζουν τα δεδομένα στη διαφήμιση και το ηλεκτρονικό εμπόριο. Σύμφωνα με τον Βίνσεντ Γιανγκ, διευθύνοντα σύμβουλο της Firework, οι επιχειρήσεις μπορούν πλέον να δημιουργούν εξατομικευμένο περιεχόμενο για κάθε προϊόν και κάθε καταναλωτή. Όπως χαρακτηριστικά αναφέρει στους Financial Times, η παραγωγή δεκάδων ή και εκατοντάδων χιλιάδων βίντεο δεν αποτελεί πλέον οικονομικό εμπόδιο, ενώ σε πολλές περιπτώσεις το αποτέλεσμα είναι δύσκολο να διακριθεί από πραγματική παραγωγή.
Ο ανταγωνισμός μετατοπίζεται από την τεχνολογική επίδοση στην πρόσβαση σε δεδομένα, το κόστος και το ρυθμιστικό πλαίσιο
Ωστόσο, η ταχεία ανάπτυξη συνοδεύεται από προκλήσεις. Ζητήματα πνευματικής ιδιοκτησίας έχουν ήδη οδηγήσει σε νομικές πιέσεις προς εταιρείες όπως η ByteDance, ενώ οι διαφορετικές ρυθμιστικές προσεγγίσεις μεταξύ Κίνας και ΗΠΑ δημιουργούν ένα άνισο πεδίο ανταγωνισμού. Τα κινεζικά μοντέλα θεωρούνται πιο ευέλικτα και λιγότερο περιοριστικά, γεγονός που τα καθιστά πιο ελκυστικά για δημιουργούς, αλλά ταυτόχρονα εντείνει τις ανησυχίες για κατάχρηση περιεχομένου.
Το κόστος παραμένει επίσης κρίσιμος παράγοντας. Η δημιουργία βίντεο απαιτεί πολλαπλάσια υπολογιστική ισχύ σε σχέση με το κείμενο ή τον ήχο, γεγονός που περιορίζει την κλιμάκωση. Είναι χαρακτηριστικό ότι η OpenAI ανέστειλε το μοντέλο Sora, εν μέρει λόγω του υψηλού κόστους λειτουργίας.
Στο επιχειρηματικό πεδίο, οι στρατηγικές διαφοροποιούνται. Η ByteDance φέρεται να απαιτεί σημαντικές προκαταβολές από εταιρικούς πελάτες για πρόσβαση στα μοντέλα της, ενώ η Kuaishou εξετάζει ακόμη και την αυτόνομη εισαγωγή της δραστηριότητας Kling, επιδιώκοντας να κεφαλαιοποιήσει τη ραγδαία ανάπτυξη του κλάδου.
Καθώς η ποιότητα των AI βίντεο πλησιάζει τα επίπεδα επαγγελματικής παραγωγής, ο ανταγωνισμός μετατοπίζεται από την τεχνολογική επίδοση στην πρόσβαση σε δεδομένα, το κόστος και το ρυθμιστικό πλαίσιο. Η εξέλιξη αυτή δεν αναμένεται μόνο να αναδιαμορφώσει τη βιομηχανία περιεχομένου, αλλά και να επηρεάσει βαθιά το μοντέλο λειτουργίας της ψηφιακής διαφήμισης τα επόμενα χρόνια.
Πηγή: ot.gr





