Deepseek: Das Ende der Gigantomanie in der KI-Forschung
Gross, grösser, leistungsstärker, energiehungriger – wenn es um die Maschinen und Methoden zur Weiterentwicklung der Künstlichen Intelligenz (KI) geht, waren bis vor kurzem Superlative gefragt. Riesen-Konzerne wie Microsoft, Meta, Google, Amazon, Dell oder auch Tesla investierten zig Milliarden in neue Rechenzentren, weil sie an die wirtschaftlichen Vorteile der sich rasch entwickelnden Technologie glaubten. Sie wollten sich so Anteile am boomenden Markt sichern.
Davon profitierten Chip-Entwickler wie Nvidia, Netzwerkspezialisten wie Arista Networks, Bau- und Infrastrukturunternehmen sowie die Energiebranche. Das «Training der Algorithmen der künstlichen Intelligenz» erfordere leistungsfähige, umfangreiche Hardware und sehr viel Strom. Wer vorne dabei sein möchte, müsse mit grosser Kelle anrichten, lautete das Mantra. Präsident Donald Trump verkündete jüngst im Beisein prominenter Industrieller eine 500-Milliarden-Dollar-Investition, weil er der amerikanischen Nation die KI-Vormachtstellung sichern wollte.
Neues Modell: Enorme Leistung, trotz knapper Ressourcen
Und nun hat ein chinesisches KI-Startup namens Deepseek die Euphorie gedämpft und hat gewisse Zweifel an der «Vorherrschaft Amerikas» in diesem Bereich geweckt. Tatsächlich hatte dessen Forscherteam in den vergangenen Tagen ein 22-seitiges Papier mit dem Titel «Incentivierung der Denkfähigkeit bei LLMs durch Reinforcement Learning» vorgelegt. Darin beschreibt es ein KI-Modell namens R1, welches die Leistung führender amerikanischer Konkurrenten zu einem Bruchteil der Kosten erreicht. Und das unter Verwendung zweitklassiger Hardware, nachdem die Amerikaner die Ausfuhr moderner Chips amerikanischer Provenienz aus geopolitischen Gründen eingeschränkt haben.
Anfänglich schlug diesem Papier erheblich Skepsis entgegen, aber nach ein paar Tagen stellte sich heraus, dass dem wirklich so sein könnte. Und das schockte nicht nur die Tech-Giganten im Silicon Valley, sondern führte auch zu erheblichen Kursturbulenzen an der Wallstreet. Manager und Anleger von Chipherstellern wie Nvidia und anderen KI-Hoffnungsträgern mussten plötzlich die Wahrscheinlichkeit verkraften, dass sie möglicherweise zu optimistisch gewesen waren, zu hohe Gewinne erwartet hatten und die Kurse der Aktien verschiedener Tech- und Infrastrukturfirmen in den vergangenen Monaten zu weit in die Höhe getrieben hatten. Deswegen haben die Papiere von Nvidia seither knapp ein Viertel ihres vorherigen Rekordwertes verloren, bevor sie sich davon wieder etwas erholten.
Ewige Optimisten unter den Anlegern glauben, bei den jüngsten Turbulenzen gehe es nur um einen kurzen Rückschlag, und danach werde sich der Börsen- und KI-Investitions-Boom der vergangenen Monate einfach fortsetzen. Kritiker dagegen stellen das amerikanische Mantra infrage, man müsse in erster Linie riesige Geldbeträge für leistungsstarke Chips und grosse, teure Rechenzentren sowie für hoch bezahltes Personal und Energie ausgeben, um leistungsfähige KI-Modelle zu entwickeln.
Wie wäre es mit mehr Effizienz, statt mit immer mehr teurerer Hardware?
Auf dieser Basis hatten Tech-Konzerne wie Microsoft, Meta, Google und andere in den vergangenen Jahren Dutzende von Milliarden Dollar für den Aufbau der Infrastruktur ausgegeben, welche sie für die Entwicklung und den Betrieb von «intelligenter Software der nächsten Generation» zu benötigen glaubten. Trotz aller Wirren wollen sie auch künftig enorme Summen für diesen Zweck aufwenden – zum Beispiel die von Präsident Trump stolz angekündigten 500 Milliarden Dollar durch ein Joint Venture von Open-AI mit Oracle und Softbank.
Die etablierten Unternehmen optimierten die bestehenden Prozesse, während die Disruptoren den grundlegenden Ansatz überdenken, hält dem zum Beispiel Morgan Brown entgegen, der für den Cloudanbieter Dropbox in diesem Bereich tätig ist. «Deepseek fragt: ‹Was wäre, wenn wir es einfach intelligenter machen würden, anstatt einfach nur immer mehr Hardware einzusetzen?›», sagt er und in seinen Augen sind die Auswirkungen enorm:
- Die KI-Entwicklung wird leichter zugänglich
- Der Wettbewerb nimmt drastisch zu
- Die «Burggräben» der grossen Technologieunternehmen mit monopolistischen Ansätzen werden durchlässiger
- Die Hardwareanforderungen und die damit verbundenen Kosten sinken
Natürlich geht er nicht davon aus, dass «Giganten der AI-Entwicklung» wie Open-AI, Anthropic und all die anderen plötzlich stillstehen werden. Diese seien wahrscheinlich längst dabei, die jüngsten Innovationen selbst zu implementieren. Meta etwa habe dem Vernehmen nach mehrere Krisensitzungen abgehalten, um sich damit zu befassen.
Aber der Geist der Effizienz sei nun aus der Flasche, so der Fachmann und es gebe kein zurück mehr zum Ansatz «einfach immer mehr Hardware draufzusatteln». Für ihn ist das einer der Momente, auf die man später als Wendepunkt zurückblicken wird. So wie damals, als PCs die Bedeutung von Grossrechnern schmälerten oder als Cloud Computing alles veränderte. Die Künstliche Intelligenz werde bald viel zugänglicher und viel billiger werden, keine Frage.
Veteranen plädieren für offene Forschung
Das heisst, das Geschäft mit der Künstlichen Intelligenz wird weiterhin wachsen, aber unter anderen Rahmenbedingungen. Deepseek könne grosse, teure KI-Modelle nicht ersetzen, sondern ergänzen. Sein modulares, kosteneffizientes Design eigne sich hervorragend für gezielte oder Nischenanwendungen wie personalisierte Modelle oder spezielle Aufgaben in Branchen wie Logistik oder Bildung. Für komplexe, anspruchsvolle Aufgaben, bei denen Schnelligkeit und Zuverlässigkeit gefragt seien, seien technisch aufwendige Anwendungen auf Basis massiver Investitionen unverzichtbar, erklären Experten.
Die Erfahrenen unter ihnen setzen auf die Offenheit. «Es war enttäuschend, dass sich die Grundlagenforschung in den vergangenen Jahren mehr und mehr abschottete. Dabei müssen wir die KI-Forschung wirklich offener gestalten», sagt zum Beispiel Pat Gelsinger, der frühere Chef das Chip-Giganten Intel. Die Beteiligten müssten wissen, wie die Trainingsdaten aussehen, sie müssten die Algorithmen im Detail studieren und sich mit der Korrektheit, der Ethik und den Auswirkungen auseinandersetzen können. Einzelne Unternehmen versuchten zwar regelmässig aus Profitgier, sich diesem Trend zu entziehen. Aber der Erfolg von Linux, Gcc, USB, Wifi und zahlreiche andere Beispiele zeigten, dass die offene Technologie gewinne, wenn man ihr eine Chance gebe.
Die künstliche Intelligenz sei für die Zukunft der Zivilisation viel zu wichtig, als dass sie von geschlossenen Tech-Ökosystemen dominiert werden sollten, argumentiert der Branchenveteran.
Deepseek sorgt nicht nur für Furore, sondern auch die Kritik nimmt zu. Hier einzelne Punkte in konzentrierter Form:
- Zensur von politisch sensiblen Themen in China. Deepseek verweigert Informationen zu Ereignissen wie den Tiananmen-Protesten von 1989 oder der Regenschirm-Revolution in Hongkong. Stattdessen antwortet der Chatbot mit einer Standardformulierung, dass das Thema ausserhalb seines Aufgabenbereichs liegt.
- Vertretung der offiziellen chinesischen Regierungsposition. Bei Fragen zur politischen Situation Taiwans und zu territorialen Streitigkeiten im Südchinesischen Meer vertritt Deepseek klar die Haltung der chinesischen Regierung. Taiwan wird beispielsweise als «untrennbarer Teil Chinas» bezeichnet.
- Unklarheit über die Herkunft der Trainingsdaten. Es bestehen grosse Unsicherheiten darüber, wie die KI trainiert wird und woher die verwendeten Daten stammen. Es wird spekuliert, dass die Daten möglicherweise durch Cyberangriffe erlangt, unrechtmässig erworben oder von anderen KI-Modellen synthetisch generiert wurden.
- Umfangreiche Datensammlung und -speicherung in China. Deepseek sammelt laut Datenschutzerklärung umfangreiche Nutzerdaten, einschliesslich Eingaben, Audiodateien und Tastaturanschlagsmuster. Diese Informationen werden auf Servern in der Volksrepublik China gespeichert.
- Potenzielle Sicherheitsrisiken durch Datenverwertung. Persönliche Daten oder Fotos könnten beispielsweise für die Erstellung von Deepfakes missbraucht werden.
- Phishing-Gefahr durch gefälschte Deepseek-Webseiten. Cyberkriminelle könnten die hohe Popularität und Registrierungsprobleme ausnutzen, um gefälschte Deepseek-Webseiten zu erstellen und Anmeldeinformationen von Nutzern zu stehlen.
- Verdacht auf unrechtmässige Nutzung von Open-AI-Daten. Es gibt Hinweise darauf, dass Deepseek möglicherweise Wissen aus Open-AI-Modellen extrahiert hat, um die eigene Entwicklung zu beschleunigen.
Themenbezogene Interessenbindung der Autorin/des Autors
Keine
_____________________
➔ Solche Artikel sind nur dank Ihren SPENDEN möglich. Spenden an unsere Stiftung können Sie bei den Steuern abziehen.
Mit Twint oder Bank-App auch gleich hier:
_____________________
Meinungen in Beiträgen auf Infosperber entsprechen jeweils den persönlichen Einschätzungen der Autorin oder des Autors.
Ihre Meinung
Lade Eingabefeld...