Data Warehouse

aus SecuPedia, der Plattform für Sicherheits-Informationen

Anzeige
Wechseln zu: Navigation, Suche

Ein Data Warehouse, auch in der Fachsprache als Datenlager bezeichnet, ist im Wesentlichen eine analytische (in der Regel eine relationale) Datenbank, die aus zwei oder mehr Datenquellen erstellt wird. In der Regel werden Data Warehouses zur Speicherung historischer Daten verwendet, die Petabyte-Größen erreichen können. Data-Warehouses verfügen oft über erhebliche Rechen- und Speicherressourcen, um komplizierte Abfragen durchzuführen und Berichte zu erstellen. Sie werden häufig als Datenquellen für Business Intelligence und maschinelle Lernsysteme verwendet.

Ein wichtiger Grund für den Einsatz eines Data Warehouse: Operative (OLTP-)Datenbanken sind in Bezug auf die Anzahl und die Art der Indizes, die Sie erstellen können, begrenzt, was die Analysemöglichkeiten einschränkt und verlangsamt. Sobald Sie Ihre Daten in das Data Warehouse kopiert haben, können Sie alles, was Ihnen wichtig ist, im Data Warehouse indexieren, um eine gute analytische Abfrageleistung zu erzielen - ohne die Schreibleistung der OLTP-Datenbank zu beeinträchtigen.

Ein weiterer Grund für ein unternehmensweites Data Warehouse ist die Möglichkeit, Daten aus verschiedenen Quellen für die Analyse zu kombinieren. Beispielsweise benötigt Ihre OLTP-Anwendung für den Vertrieb wahrscheinlich keine Informationen über das Wetter an Ihren Vertriebsstandorten, aber Ihre Vertriebsprognosen könnten diese Daten verwenden. Wenn Sie Ihrem Data Warehouse historische Wetterdaten hinzufügen, können Sie diese leicht in Ihre Modelle für historische Verkaufsdaten einbeziehen.

Im Allgemeinen hat ein Data Warehouse eine mehrschichtige Architektur: - Quelldaten mit operativen Datenbanken aus Geschäftsbereichen des Unternehmens, - eine Staging-Datenbank, - ETL- (Extrahieren, Transformieren und Laden) oder ELT- (Extrahieren, Laden und

 Transformieren) Tools mit Mappings und Transformationen,

- die eigentliche Datenspeicherung von bereinigten und transformierten Daten, und - Datenpräsentationswerkzeuge für SQL-Abfragen.

Quelle: Computerwoche



Diese Seite wurde zuletzt am 18. Dezember 2021 um 17:59 Uhr von Klaus Kapinos geändert.