Η κινεζική τεχνολογική εταιρεία Alibaba παρουσίασε σήμερα μια νέα εκδοχή του μοντέλου Τεχνητής Νοημοσύνης της Qwen 2.5, για την οποία υποστηρίζει πως υπερτερεί του περίφημου DeepSeek-V3.
Ο ασυνήθιστος χρόνος της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι έχουν αργία και βρίσκονται με τις οικογένειές τους, σηματοδοτεί την πίεση που ασκεί η μετεωρική άνοδος τις τρεις τελευταίες εβδομάδες της κινεζικής εταιρείας Τεχνητής Νοημοσύνης DeepSeek, όχι μόνο στους ανταγωνιστές της στο εξωτερικό, αλλά και στον εγχώριο ανταγωνισμό.
«Το Qwen 2.5-Max ξεπερνάει ... σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της την οποία ανάρτησε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στα πιο εξελιγμένα μοντέλα Τεχνητής Νοημοσύνης ανοικτού κώδικα.
Η παρουσίαση στις 10 Ιανουαρίου του βοηθού Τεχνητής Νοημοσύνης της DeepSeek, με βάση το μοντέλο DeepSeek-V3, καθώς και η παρουσίαση στις 20 Ιανουαρίου του μοντέλου της R1, προκάλεσε σοκ στην Σίλικον Βάλεϊ και έριξε τις μετοχές των τεχνολογικών εταιρειών, καθώς τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες Τεχνητής Νοημοσύνης στις ΗΠΑ.
Ωστόσο η επιτυχία της DeepSeek έκανε επίσης τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα Τεχνητής Νοημοσύνης.
Δύο ημέρες μετά την παρουσίαση του DeepSeek-R1, η ιδιοκτήτρια του TikTok, η ByteDance, παρουσίασε μια επικαιροποίηση του δικού της βασικού μοντέλου Τεχνητής Νοημοσύνης, για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα Τεχνητής Νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ' αυτές.
Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.
Η πετυχημένη κυκλοφορία του DeepSeek προκαλεί σοκ στην αμερικανική αγορά
Το Χρηματιστήριο της Νέας Υόρκης άνοιξε με μεγάλη πτώση τη Δευτέρα, καθώς η κυκλοφορία από την κινεζική νεοφυή εταιρία DeepSeek ενός αναβαθμισμένου χαμηλού κόστους και με λιγότερα δεδομένα, μοντέλου Τεχνητής Νοημοσύνης (AI) της Κίνας και η τεράστια ανταπόκριση του κοινού, έθεσε σε αμφιβολία την κυριαρχία των αμερικανικών τεχνολογικών κολοσσών, προκαλώντας νευρικότητα σε επενδυτές.
Η αμερικανική αγορά αιφνιδιάστηκε από τις πληροφορίες για το ανταγωνιστικό μοντέλο AI της DeepSeek. Με το άνοιγμα της Wall Street, η τιμή της μετοχής της Nvidia - του αμερικανικού κολοσσού ημιαγωγών - κατέγραψε πτώση 13%, που μεταφράζεται σε απώλειες άνω των 400 δισεκατομμυρίων δολαρίων.
Διακοπές καταγράφηκαν στην πρόσβαση στον ιστότοπο της DeepSeek, καθώς η εφαρμογή που κυκλοφόρησε η κινεζική startup, έγινε μέσα σε λίγες ώρες η πιο περιζήτητη δωρεάν εφαρμογή που διατίθεται στο App Store της Apple στις ΗΠΑ.
Επενδυτές "πάγωσαν" από τη μεγάλη απήχηση που είχε η κινεζική εφαρμογή.
Διαθέσιμο ως εφαρμογή ή σε υπολογιστή, το Deepseek προσφέρει πολλές δυνατότητες παρόμοιες με αντίστοιχα μοντέλα δυτικών ανταγωνίστριων εταιρειών.
Αναλυτές και επενδυτές εκτιμούσαν ότι η πρωτοκαθεδρία των ΗΠΑ στον κλάδο των ημιαγωγών, καθώς και η ικανότητά τους να περιορίσουν την πρόσβαση της Κίνας σε αυτή την τεχνολογία, θα διασφάλιζαν την αμερικανική κυριαρχία στην Τεχνητή Νοημοσύνη.
Ωστόσο, η DeepSeek τόνισε ότι δαπάνησε μόλις 5,6 εκατομμύρια δολάρια για την ανάπτυξη του μοντέλου της, ένα ποσό αμελητέο σε σύγκριση με δισεκατομμύρια που επενδύουν αμερικανικοί κολοσσοί.
Η Wall Street φοβάται επίσης ότι το chatbot της κινεζικής εταιρίας μπορεί να ανταγωνιστεί το αμερικανικό OpenAI που δημιούργησε το ChatGPT.
Ένα μεγάλο τμήμα της βιομηχανίας ημιαγωγών κατέγραψε απώλειες από τη σημερινή εξέλιξη. Μετοχές και άλλων τεχνολογικών κολοσσών, που έχουν κάνει τεράστιες επενδύσεις για να αποκτήσουν μια θέση στον τομέα της Τεχνητής Νοημοσύνης, κατέγραψαν και αυτές πτώση.
(ΑΠΕ-ΜΠΕ)