SAP will den US-Datenplattformanbieter Dremio übernehmen und damit die SAP Business Data Cloud ausbauen. Hinter der geplanten Transaktion steht ein zentrales Problem vieler KI-Projekte: Geschäftsdaten liegen oft über verschiedene Systeme, Formate und Verantwortungsbereiche verteilt. Für klassische Analysen ist das aufwendig. Für KI-Agenten kann es zu einem Risiko werden, wenn Herkunft, Kontext und Zugriffsrechte nicht eindeutig geklärt sind.
Dremio bringt eine offene Datenplattform ein, die SAP- und Nicht-SAP-Daten gemeinsam nutzbar machen soll, ohne sie ständig kopieren oder in neue Formate überführen zu müssen. SAP reagiert damit auf den Druck, künstliche Intelligenz nicht nur in Pilotprojekten zu zeigen, sondern zuverlässig in Geschäftsprozesse einzubinden. Finanzielle Details der SAP Dremio Übernahme wurden nicht genannt. Der Abschluss wird für das dritte Quartal 2026 erwartet und steht noch unter dem Vorbehalt behördlicher Genehmigungen und weiterer üblicher Bedingungen.
Datenfragmentierung wird zum Kernproblem der Unternehmens-KI
Viele Unternehmen haben in künstliche Intelligenz investiert, erzielen aber bislang nicht immer die erwarteten Ergebnisse. Ein wesentlicher Grund liegt in der Qualität und Zugänglichkeit der Daten. Finanzinformationen, Lieferkettendaten, Kundenbestände und operative Kennzahlen werden häufig in getrennten Systemen verarbeitet. Für KI-Agenten reicht es jedoch nicht, einzelne Datenpunkte abzurufen. Sie müssen verstehen, welche Informationen relevant sind, wie sie zusammenhängen, welche Rechte gelten und aus welchen Quellen sie stammen.
SAP-Technikchef Philipp Herzig beschreibt die Stoßrichtung mit dem Satz: „Unternehmens-KI scheitert nicht an den Modellen, sondern an den Daten.“ SAP will die Business Data Cloud deshalb nicht nur als Speicher- und Analyseumgebung positionieren. Sie soll zu einer gemeinsamen Datenschicht werden, auf der KI-Anwendungen konsistente und nachvollziehbare Informationen erhalten. Das ist besonders für agentische KI relevant, weil solche Systeme Aufgaben nicht nur analysieren, sondern zunehmend vorbereiten oder ausführen sollen. In regulierten Branchen müssen Entscheidungen trotzdem erklärbar bleiben.
Enterprise Lakehouse verbindet SAP- und Fremddaten
Im Zentrum der Erweiterung steht ein Enterprise Lakehouse. Dieses Konzept verbindet Eigenschaften eines Data Lakes mit denen eines klassischen Data Warehouse. Data Lakes können große Mengen unterschiedlicher Daten aufnehmen, während Data Warehouses stärker auf strukturierte Analysen ausgerichtet sind. Ein Lakehouse soll beide Ansätze zusammenführen.
Dremio setzt dabei auf Apache Iceberg, ein offenes Tabellenformat für große Datenbestände. SAP will die Business Data Cloud stärker auf dieses Format ausrichten. Für Kunden kann das bedeuten, dass Daten in verschiedenen Analyse- und KI-Umgebungen verwendet werden, ohne sie für jedes System erneut kopieren oder konvertieren zu müssen. Das ist vor allem für Konzerne mit gewachsenen IT-Landschaften relevant. Viele nutzen SAP für zentrale Geschäftsprozesse, daneben aber zahlreiche Anwendungen anderer Anbieter. Bleiben diese Datenwelten getrennt, entstehen Integrationsaufwand, doppelte Datenbestände und neue Compliance-Fragen.
Ein Enterprise Lakehouse soll solche Brüche reduzieren. SAP- und Nicht-SAP-Daten könnten auf einer gemeinsamen Grundlage ausgewertet werden, während bestehende Systeme weiter genutzt werden. Offene Formate können zugleich verhindern, dass Daten vollständig an einen einzelnen Plattformanbieter gebunden sind. Dieser Punkt gewinnt an Bedeutung, weil Unternehmen leistungsfähige Cloud- und KI-Dienste nutzen wollen, langfristig aber Kontrolle über ihre Daten behalten müssen.
Datenkatalog und Knowledge Graph schaffen Kontext
Neben der technischen Verfügbarkeit der Daten ist entscheidend, wie sie beschrieben und kontrolliert werden. Ein zentraler Datenkatalog soll festhalten, welche Informationen vorhanden sind, woher sie stammen, wie sie zusammenhängen und wer darauf zugreifen darf. Dremio bringt dafür Technologien rund um Apache Polaris und die Apache-Iceberg-REST-Catalog-API ein. Ein solcher Katalog funktioniert vereinfacht wie eine gemeinsame Orientierungsschicht zwischen technischen Datenbeständen und fachlichen Begriffen.
Für KI-Agenten ist diese Einordnung wichtig. Ein System kann eine Zahl aus einer Datenbank abrufen, muss aber zusätzlich wissen, ob es sich um einen vorläufigen Wert, einen geprüften Abschluss oder eine Prognose handelt. Ohne diesen Kontext können technisch korrekte Daten zu wirtschaftlich falschen Schlussfolgerungen führen.
SAP will diesen Ansatz mit dem geplanten SAP Knowledge Graph verbinden. Ein Knowledge Graph bildet Beziehungen zwischen Daten, Prozessen, Organisationseinheiten und Geschäftsregeln ab. Er kann etwa darstellen, wie eine Bestellung mit Lieferketteninformationen, Finanzdaten, Kundenverträgen und regulatorischen Vorgaben zusammenhängt. Damit versucht SAP, die Grundlage für KI-Systeme zu schaffen, die nicht nur Informationen verarbeiten, sondern betriebliche Zusammenhänge verstehen.
Offene Standards stärken SAPs Wettbewerbsposition
Die Übernahme fällt in eine Phase, in der offene Datenarchitekturen strategisch wichtiger werden. Unternehmen wollen KI einsetzen, zugleich aber neue Abhängigkeiten von geschlossenen Plattformen vermeiden. Standards wie Apache Iceberg versprechen mehr Flexibilität und können den Austausch zwischen unterschiedlichen Systemen vereinfachen. Für SAP ist das auch eine Wettbewerbsfrage. Der Konzern steht Anbietern gegenüber, die Cloud-Infrastruktur, Datenplattformen und KI-Werkzeuge eng miteinander verbinden.
Dremio ist an mehreren Open-Source-Projekten beteiligt, darunter Apache Iceberg, Apache Arrow und Apache Polaris. SAP kündigt an, diese Beiträge weiter zu unterstützen. Für Kunden kann das ein wichtiges Signal sein, weil offene Formate den langfristigen Zugriff auf Daten erleichtern und den Wechsel zwischen verschiedenen Werkzeugen ermöglichen. Der unmittelbare Nutzen dürfte weniger in spektakulären KI-Anwendungen als in geringerer Komplexität liegen. Wenn Daten seltener kopiert, Formate weniger häufig umgewandelt und getrennte Analyseumgebungen reduziert werden, können Kosten sinken und Projekte schneller umgesetzt werden.
Langfristig zeigt die SAP Dremio Übernahme, wohin sich Unternehmenssoftware entwickelt. Anwendungen allein reichen nicht mehr aus, wenn Entscheidungen über mehrere Systeme hinweg automatisiert werden sollen. Entscheidend wird die Fähigkeit, Daten mit fachlichem Kontext, klaren Zugriffsregeln und möglichst geringer technischer Reibung bereitzustellen. SAP versucht mit Dremio, genau diese Ebene stärker zu kontrollieren und zugleich auf offene Standards zu setzen. Damit sichert der Konzern seine KI-Strategie nicht zuerst bei den Modellen ab, sondern bei der Datenbasis, auf der diese Modelle im Unternehmensalltag arbeiten müssen.


