DeepSeek wird auf die Verwendung gestohlener Daten von KI-Unternehmen getestet
13:11, 30.01.2025
OpenAI und Microsoft prüfen, ob DeepSeek mit gestohlenen Daten von US-amerikanischen KI-Unternehmen trainiert wurde. Bereits im Herbst letzten Jahres wurde bekannt, dass mit DeepSeek verbundene Personen riesige Datenbanken mit hilfe der OpenAI-API abgesaugt haben.
Microsoft, als größter Investor vom OpenAI, äußerte sich zu dieser möglichen Angelegenheit. Dies könnte gegen die Nutzungsbedingungen von OpenAI verstoßen haben, und es ist auch möglich, dass die Gruppe versucht hat, Datenlimits zu umgehen.
Reaktion der US-Regierung
Die US-Regierung hat die Möglichkeit in Betracht gezogen, dass ein chinesisches KI-Unternehmen sein DeepSeek R1-Modell auf der Basis von OpenAI-Modellen trainiert haben könnte. Das Lernermodell kann erhebliche Leistungssteigerungen erzielen. Konkrete Beweise oder Bestätigungen für diese Annahme gibt es bisher jedoch nicht.
In den Nutzungsrichtlinien von OpenAI ist es verboten, Ausgabedaten zu kopieren und diese Informationen zur Weiterentwicklung von Modellen zu nutzen. OpenAI hat sich zu diesen Vorwürfen noch nicht geäußert. Das Unternehmen teilte lediglich mit, dass es ständig Maßnahmen zum Schutz des geistigen Eigentums ergreift und eng mit der US-Regierung zusammenarbeitet, um effektiv auf illegale Aktivitäten von Wettbewerbern zu reagieren.
Ursprünglich wurden die Kosten für DeepSeek mit rund 5 Millionen US-Dollar beworben. Analysten haben jedoch berechnet, dass das Unternehmen allein für die Hardware möglicherweise bis zu 500 Millionen US-Dollar ausgegeben hat. Hinzu kommen weitere Kosten für das endgültige Training, Experimente und frühere Versionen des Projekts.
Derzeit untersucht die US-Regierung mögliche Risiken von DeepSeek für die nationale Sicherheit. Zudem wird Nutzern geraten, bei der Verwendung von DeepSeek äußerst vorsichtig zu sein.
Laut den Nutzungsbedingungen und der Datenschutzrichtlinie von DeepSeek speichert und verarbeitet der Dienst Daten zu IP-Adressen, Tastatureingaben, Cookies, Leistungsprotokollen, Betriebssystemen und mehr.