Η Baidu (NASDAQ:BIDU), Inc. (BIDU), μια κορυφαία εταιρεία τεχνητής νοημοσύνης με ισχυρή διαδικτυακή βάση, φιλοξένησε σήμερα το ετήσιο συνέδριο τεχνολογίας Baidu World 2024 στη Σαγκάη. Στην εκδήλωση, η εταιρεία ανακοίνωσε μια σειρά από νέες τεχνολογίες και λύσεις τεχνητής νοημοσύνης για την επιτάχυνση της έκρηξης των εφαρμογών τεχνητής νοημοσύνης, με επίκεντρο το iRAG (Image-Based Retrieval-Augmented Generation), μια νέα τεχνολογία σχεδιασμένη για την αντιμετώπιση των ψευδαισθήσεων στη δημιουργία εικόνων, και το Miaoda, ένα εργαλείο χωρίς κώδικα που δίνει τη δυνατότητα σε επιχειρήσεις και ιδιώτες να δημιουργούν εφαρμογές.
Η παρουσίαση έρχεται εν μέσω αυξανόμενης ζήτησης για τις προσφορές τεχνητής νοημοσύνης της Baidu, όπως αποδεικνύεται από το γεγονός ότι οι καθημερινές κλήσεις API του μοντέλου βάσης ERNIE έφτασαν τα 1,5 δισεκατομμύρια στις αρχές Νοεμβρίου. Αυτό αντιπροσωπεύει μια σημαντική αύξηση 30 φορές από τα 50 εκατομμύρια που ανακοινώθηκαν πριν από ένα χρόνο.
"Ο ρυθμός ανάπτυξης ξεπέρασε τις προσδοκίες μου", δήλωσε ο Robin Li, συνιδρυτής, πρόεδρος και διευθύνων σύμβουλος της Baidu, ο οποίος περιέγραψε την απότομη αύξηση ως αντανάκλαση της εκρηκτικής ανάπτυξης των εφαρμογών παραγωγικής τεχνητής νοημοσύνης στην Κίνα τα τελευταία δύο χρόνια.
Κοιτάζοντας μπροστά, ο Li τόνισε ότι οι πράκτορες θα αποτελέσουν την κυρίαρχη μορφή εφαρμογών τεχνητής νοημοσύνης και πλησιάζουν σε ένα σημείο καμπής εκρηκτικής ανάπτυξης. Υπογραμμίζοντας αυτό το σημείο, ο Li παρουσίασε τους Κορυφαίους 100 Πράκτορες και τις Κορυφαίες 100 Βιομηχανικές Εφαρμογές στην πλατφόρμα ERNIE AgentBuilder.
Το Baidu World 2024 ανέδειξε επίσης την τελευταία αύξηση χρηστών για το ERNIE Bot, τον επεκτεινόμενο ρόλο του ERNIE στις επιχειρηματικές εφαρμογές και παρουσίασε το ντεμπούτο των Xiaodu AI Glasses από την Xiaodu Technology.
Νέα τεχνολογία iRAG για τον περιορισμό των ψευδαισθήσεων στη δημιουργία εικόνων
Οι ψευδαισθήσεις, ένα φαινόμενο κατά το οποίο η τεχνητή νοημοσύνη παράγει ψευδείς ή παραπλανητικές πληροφορίες, παραμένουν ένα από τα πιο δυσεπίλυτα εμπόδια στην ευρεία υιοθέτηση της παραγωγικής τεχνητής νοημοσύνης. Στην παραγωγή κειμένου, η τεχνολογία RAG έχει σε μεγάλο βαθμό επιλύσει το πρόβλημα των ψευδαισθήσεων, βελτιώνοντας σημαντικά την ακρίβεια των παραγόμενων απαντήσεων. Ωστόσο, στον τομέα της πολυτροπικότητας, οι ψευδαισθήσεις παραμένουν ένα βασικό εμπόδιο, εκδηλώνονται συχνά ως ανακριβείς απεικονίσεις ανθρώπων ή ορόσημων.
Η νέα τεχνολογία iRAG της Baidu μπορεί να μετριάσει τις ψευδαισθήσεις στη δημιουργία εικόνων από κείμενο. Αξιοποιώντας την τεράστια συλλογή εκατοντάδων εκατομμυρίων εικόνων της Baidu Search και τις ισχυρές δυνατότητες του μοντέλου βάσης της εταιρείας, η νέα τεχνολογία επιτρέπει στα μοντέλα μετατροπής κειμένου σε εικόνα να παρέχουν υπερρεαλιστικά οπτικά, μειώνοντας παράλληλα σημαντικά το κόστος παραγωγής εικόνων. Η ικανότητα του iRAG να μειώνει τις ψευδαισθήσεις ενισχύει την εφαρμοσιμότητα των εικόνων που δημιουργούνται από μοντέλα μετατροπής κειμένου σε εικόνα σε διάφορα οπτικά μέσα, συμπεριλαμβανομένων των κόμικς, των storyboards, των αφισών και άλλων. Ο Li περιέγραψε τη μείωση των ψευδαισθήσεων ως τη βάση για την επερχόμενη έκρηξη των εφαρμογών τεχνητής νοημοσύνης.
Miaoda: Δημιουργία εφαρμογών με φυσική γλώσσα
Η Baidu παρουσίασε επίσης το Miaoda, ένα εργαλείο χωρίς κώδικα που καθιστά δυνατή τη δημιουργία ολόκληρων εφαρμογών απλά περιγράφοντάς τες σε φυσική γλώσσα. Το Miaoda παρέχει προγραμματισμό χωρίς κώδικα, συνεργασία πολλαπλών πρακτόρων και επίκληση πολλαπλών εργαλείων. Ο προγραμματισμός χωρίς κώδικα επιτρέπει σε οποιονδήποτε να δημιουργήσει κώδικα χωρίς να γράψει ούτε μία γραμμή, μειώνοντας τα εμπόδια στην ανάπτυξη τεχνητής νοημοσύνης και καθιστώντας την προσβάσιμη σε όλους. Η συνεργασία πολλαπλών πρακτόρων αξιοποιεί τις δυνατότητες σκέψης και σχεδιασμού του ERNIE για τον αποτελεσματικό συντονισμό και τη διαχείριση διαφορετικών πρακτόρων, ενώ η επίκληση πολλαπλών εργαλείων αξιοποιεί τις δυνατότητες επίκλησης εργαλείων του ERNIE, χρησιμοποιώντας εκτενώς την αναζήτηση στο διαδίκτυο, το iRAG, το API χαρτών και άλλα εργαλεία για μια απρόσκοπτη ροή εργασίας.
"Η Baidu δεν στοχεύει στην κυκλοφορία μιας 'υπερ-εφαρμογής'. Αντίθετα, στοχεύουμε να βοηθήσουμε περισσότερους ανθρώπους και επιχειρήσεις να δημιουργήσουν εκατομμύρια 'εξαιρετικά χρήσιμες' εφαρμογές", δήλωσε ο Li.
Αντικατοπτρίζοντας τη διαδικασία ανάπτυξης προϊόντων στον πραγματικό κόσμο, το Miaoda αντλεί από τις ικανότητες διαφορετικών πρακτόρων σε πολλούς τομείς, όπως η διαχείριση και ο σχεδιασμός έργων, η επεξεργασία περιεχομένου, ο προγραμματισμός και ο έλεγχος ποιότητας. Το Miaoda μπορεί ακόμη και να εντοπίζει αυτόματα σφάλματα και να χρησιμοποιεί μια σειρά εργαλείων. Ο Li το χαρακτήρισε ως "την πιο περίπλοκη περίπτωση εφαρμογής συνεργασίας πολλαπλών πρακτόρων μέχρι σήμερα".
Το Miaoda δίνει σε όλους τις δυνατότητες ενός προγραμματιστή - οποιοσδήποτε μπορεί να μιλήσει, μπορεί να δημιουργήσει εφαρμογές, ενισχύοντας σημαντικά την ανθρώπινη παραγωγικότητα.
Οι πράκτορες ως το επόμενο σύνορο στην εφαρμογή της τεχνητής νοημοσύνης
"Σήμερα, ενώ όλες οι κορυφαίες παγκόσμιες εταιρείες τεχνολογίας δίνουν προσοχή στους πράκτορες, λίγες τους έχουν κάνει τόσο κεντρικούς στη στρατηγική τους όσο η Baidu", δήλωσε ο Li στην εκδήλωση. Παρομοίασε τη δυναμική των πρακτόρων με τους ιστότοπους στην εποχή των υπολογιστών και τους λογαριασμούς κοινωνικών μέσων στην εποχή των κινητών.
"Οι πράκτορες είναι πιο ανθρώπινοι, πιο έξυπνοι και ενεργούν σαν πωλητές, εκπρόσωποι εξυπηρέτησης πελατών ή βοηθοί σας. Οι πράκτορες θα γίνουν ένα νέο όχημα για περιεχόμενο, πληροφορίες και υπηρεσίες", πρόσθεσε ο Li.
Τέσσερις τύποι πρακτόρων - εταιρείας, χαρακτήρα, εργαλείου και βιομηχανίας - παρουσιάστηκαν στην εκδήλωση για να καταδείξουν τις δυνατότητες των πρακτόρων στην εποχή της τεχνητής νοημοσύνης. Οι εταιρικοί πράκτορες, για παράδειγμα, διαφέρουν από τους παραδοσιακούς ιστότοπους που δείχνουν μόνο στατικές πληροφορίες για την εταιρεία και τα προϊόντα και μπορούν αντίθετα να προτείνουν προληπτικά προϊόντα με βάση τις ανάγκες των πελατών και να ανταποκρίνονται άμεσα σε αιτήματα εξυπηρέτησης, βελτιώνοντας σημαντικά την αποτελεσματικότητα του διαδραστικού μάρκετινγκ. Μετά την ανάπτυξη ενός πράκτορα που τροφοδοτείται από το ERNIE, η αυτοκινητοβιομηχανία BYD είδε αύξηση 119% στη μετ
Aυτό το άρθρο μεταφράστηκε με τη βοήθεια της τεχνητής νοημοσύνης. Για περισσότερες πληροφορίες, δείτε τους Όρους Χρήσης