Data Warehousing mit SAP® BW 7.3
eBook - ePub

Data Warehousing mit SAP® BW 7.3

Umfasst SAP® BW 7.3 powered by SAP HANA®

Christian Mehrwald

  1. 780 pages
  2. German
  3. ePUB (mobile friendly)
  4. Available on iOS & Android
eBook - ePub

Data Warehousing mit SAP® BW 7.3

Umfasst SAP® BW 7.3 powered by SAP HANA®

Christian Mehrwald

Book details
Book preview
Table of contents
Citations

About This Book

Dieses Buch fokussiert sich auf Bewirtschaftung, Speicherung und Bereitstellung von Daten durch das SAP BW und gibt einen fundierten Einblick in die Architektur des Systems. Als praxisorientierter Leitfaden und gut strukturiertes Nachschlagewerk wendet es sich an SAP-Berater und IT-Mitarbeiter, die mit der Implementierung eines Data Warehouse auf Basis des BW-Systems betraut sind. Dabei wird insbesondere auf die Unterschiede eingegangen, die sich aus einem Wechsel von herkömmlichen relationalen Datenbanksystemen zur HANA Database ergeben. Für die Neuauflage auf den aktuellen Stand gebracht.

Frequently asked questions

How do I cancel my subscription?
Simply head over to the account section in settings and click on “Cancel Subscription” - it’s as simple as that. After you cancel, your membership will stay active for the remainder of the time you’ve paid for. Learn more here.
Can/how do I download books?
At the moment all of our mobile-responsive ePub books are available to download via the app. Most of our PDFs are also available to download and we're working on making the final remaining ones downloadable now. Learn more here.
What is the difference between the pricing plans?
Both plans give you full access to the library and all of Perlego’s features. The only differences are the price and subscription period: With the annual plan you’ll save around 30% compared to 12 months on the monthly plan.
What is Perlego?
We are an online textbook subscription service, where you can get access to an entire online library for less than the price of a single book per month. With over 1 million books across 1000+ topics, we’ve got you covered! Learn more here.
Do you support text-to-speech?
Look out for the read-aloud symbol on your next book to see if you can listen to it. The read-aloud tool reads text aloud for you, highlighting the text as it is being read. You can pause it, speed it up and slow it down. Learn more here.
Is Data Warehousing mit SAP® BW 7.3 an online PDF/ePUB?
Yes, you can access Data Warehousing mit SAP® BW 7.3 by Christian Mehrwald in PDF and/or ePUB format, as well as other popular books in Computer Science & Data Warehousing. We have over one million books available in our catalogue for you to explore.

Information

Publisher
dpunkt
Year
2013
ISBN
9783864912894
Edition
6

1 Einleitung

Der Begriff »Data Warehouse« bezeichnet ein System zur zentralen Bereitstellung von Informationen für Kontroll- und Entscheidungsprozesse. Das Sammeln von Informationen einerseits und das Bereitstellen dieser Daten andererseits bringt technische und funktionale Besonderheiten mit sich, durch die sich Data-Warehouse-Systeme von anderen Systemen abgrenzen.
Ein wesentliches Merkmal von Data-Warehouse-Systemen ist ihre Optimierung auf die Verarbeitung und Speicherung von Massendaten – entweder um große Mengen von Transaktionsdaten zu verarbeiten und zu speichern, wenn sie aus operativen Systemen gesammelt werden (bspw. Aufträge, Fakturen, Bestandsveränderungen usw.), oder um die gespeicherten Daten über lange Zeiträume zu selektieren, zu lesen und (aggregiert) bereitzustellen.
Die Grundlagen zur Modellierung geeigneter Datenstrukturen für ein Data-Warehouse-System werden im Teil I (Datenmodell) behandelt. Dabei werden auch die Besonderheiten herausgearbeitet, die der Betrieb des SAP BW auf unterschiedlichen Datenbankplattformen mit sich bringt. Unterschieden wird dabei zwischen den gängigen relationalen Datenbanksystemen (Oracle, DB2, MS SQL Server, Max DB, Informix) und der hauptspeicherresistenten HANA-Datenbank, die zusätzlich zu den bekannten zeilenbasierten Speicherstrukturen der relationalen Datenbanksysteme auch eine spaltenbasierte Speicherung bietet und damit vollständig andere Ansätze bei der Modellierung von Datenstrukturen ermöglicht. BW-Systeme, die auf Basis der HANA-Datenbank betrieben werden, werden von der SAP auch als »BW powered by SAP HANA« bezeichnet.
Eine ähnliche Sonderstellung kommt dem Business Warehouse Accelerator (BWA) zu, der über vergleichbare Technologien wie die HANA-Datenbank verfügt, jedoch nicht das jeweils eingesetzte relationale Datenbanksystem ersetzen, sondern nur in Teilbereichen ergänzen kann.
Im Anschluss an die Grundlagen zur Datenmodellierung werden in diesem Abschnitt der Umgang mit den einzelnen Objekttypen erläutert, die die unterschiedlichen Datenmodelle im BW abbilden. Die Erläuterungen reflektieren die unterschiedlichen Datenbanktechnologien und gehen implizit auf performancerelevante Aspekte ein.
Ein weiteres Merkmal von Data-Warehouse-Systemen ist ihre Fähigkeit, Daten aus operativen Systemen zu sammeln (zu »extrahieren«) und in der individuellen Form, in der sie durch die unterschiedlichen Quellsysteme bereitgestellt werden, zu verarbeiten, zu vereinheitlichen und zusammenzuführen. Zur Extraktion von Daten aus Quellsystemen können Tools von Drittherstellern genutzt werden, die sich auf den Zugriff auf unterschiedlichste Systeme spezialisiert haben. Im Falle des SAP BW ist der Einsatz derartiger Tools in der Regel nicht erfoderlich, da das BW bereits umfangreiche Funktionen zur Extraktion aus SAP-ERP- und SAP-BW-Systemen, aus Datenbanksystemen, Dateien, JDBC-, XML/A- und ODBO-Datenquellen sowie aus XMLDatenströmen bereithält.
Wie Datenquellen an das BW angebunden, Daten im BW verarbeitet und in den unterschiedlichen Datenmodellen gespeichert werden, wird im Abschnitt Datenbewirtschaftung ab Seite 199 detailliert erläutert. Der Fokus liegt dabei auf der Beschreibung, wie der Datenfluss mit den Funktionen des BW-Release 7.3 definiert werden kann. Die »alten« Verfahren zur Datenbewirtschaftung, die bis zum BW-Release 3.5 bereitstanden, werden auf die Verarbeitung von Stammdaten reduziert und in Kapitel 19 gesondert erläutert.
Alle Prozesse zur Datenbewirtschaftung und zum Management von Datenbeständen können im SAP BW mithilfe sogenannter Prozessketten automatisiert werden. Die Beschreibung der Steuerungsmechanismen und der Gestaltungsmöglichkeiten von Prozessketten liefert der Abschnitt Automatisierung ab Seite 475.
Zur Verwertung der in einem Data Warehouse bereitgestellten Daten können unterschiedlichste entscheidungsunterstützende Systeme eingesetzt werden. Das SAP BW wird zu diesem Zweck mit dem sogenannten Business Explorer ausgeliefert, der einfache OLAP- und Reporting-Werkzeuge bereitstellt. Darüber hinaus können weitere entscheidungsunterstützende Systeme auf das SAP BW zugreifen, beispielsweise die diversen SAP-BusinessObjects-Tools innerhalb der SAP BI Suite, aber auch Tools von Drittherstellern.
Zwischen den entscheidungsunterstützenden Werkzeugen und den Datenbeständen des BW steht die sogenannte Analytical Engine. Diese nimmt alle Abfragen auf den Datenbestand entgegen und bildet daraus spezifische Zugriffe für die jeweiligen physischen Modelle. Sie berücksichtigt dabei auch Statusinformationen aus Extraktion und der weiteren Verarbeitung. Im Abschnitt Analytical Engine(s) ab Seite 523 werden die Arbeitsweise und das Tuning bzw. Monitoring der Analytical Engine behandelt. Die Beschreibung umfasst ferner solche Datenmodelle, die nicht physisch modelliert werden, sondern lediglich als logisches Modell vorliegen und von der Analytical Engine verarbeitet werden (bspw. MultiProvider zur Zusammenführung von Daten aus mehreren physchisch vorhandenen Datenbeständen).
Der gesamte Prozess des Sammelns, Aufbereitens, Speicherns und der Bereitstellung wird im Rahmen dieses Buchs unter dem Begriff Data Warehousing zusammengefasst. Durch die Vielzahl von Objekten und Möglichkeiten zur Verarbeitung und Bereitstellung von Daten lassen sich Anforderungen auf unterschiedlichste Weise im SAP BW implementieren. Im Abschnitt BW-Design ab Seite 583 wird abschließend ein Referenzdesign beschrieben, in dem typische Problemstellungen behandelt werden. Hierdurch soll dem Leser ein strukturierter Ansatz zur Implementierung des SAP BW geboten werden.
Die Funktionen zur Modellierung, Steuerung und Überwachung von Datenbeständen und Datenflüssen nimmt der sogenannte SAP NetWeaver Application Server wahr. Dieser besteht gleich aus zwei Entwicklungs- und Laufzeitumgebungen, die jeweils über alle Komponenten eines typischen Applikationsservers, wie z.B. Datenbank- und Kommunikationsschnittstellen, Sperrverwaltung, Job- und Prozesssteuerung oder Tools zur Systemadministration, verfügen: ein ABAP-und ein Java-EE-Applikationsserver.
Für das SAP BW (und viele andere Produkte der SAP) ist der ABAP-Applikationsserver von zentraler Bedeutung. Dieser nimmt alle Funktionen im Bereich Modellierung, Datenbewirtschaftung und Datenmanagement wahr. Die Entwicklung und Steuerung dieser Funktionen erfolgt im SAP Graphical User Interface (SAPGUI). Der zentrale Einstieg ist hierbei das sogenannte Easy-Access-Menü, von dem aus in weitere Menüs verzweigt werden kann. Welche im Easy-Access-Menü angeboten werden, richtet sich nach der jeweiligen Rolle, die ein Anwender hat.
In Abbildung 1–1 wird das Menü und die Auswahl der Rolle SAP_BW_ADMINISTRATOR_BW dargestellt, die über den Menüpunkt BW-AdministrationAdministrator Workbench: Modellierung die Data Warehousing Workbench aufrufen kann. Die Data Warehousing Workbench steht im Mittelpunkt von Entwicklung, Administration und Monitoring von BW-Funktionen. Alternativ zur Nutzung des Easy-Access-Menüs kann die Data Warehousing Workbench über die direkte Eingabe der Transaktion RSA1 aufgerufen werden.
Abb. 1–1 SAP Easy-Access-Menü und Data Warehousing Workbench
image
Dem Java-EE-Applikationsserver war ursprünglich eine wachsende Bedeutung für das BW zugedacht. Mit dem Release 7.3 des BW wurden jedoch keine neuen Funktionen vom ABAP- in den Java-EE-Applikationsserver verschoben, sondern bestehende Entwicklungen sogar wieder zurückgenommen. Der Java-EE-Applikationsserver wird aktuell vor allem zum Betrieb von Portalanwendungen wie dem BI Administration Cockpit oder dem Information Broadcaster sowie für den Universal Data Connect (mit dessen Hilfe Daten aus JDBC-, ODBO-und XML/A-Quellen extrahiert werden können) eingesetzt.

Teil I Datenmodell

Die Gestaltung von Datenmodellen stellt ein zentrales Thema jedes Data-Warehouse-Systems dar. Dabei geht es einerseits darum, fachliche Anforderungen technisch abzubilden. Andererseits müssen technische Aspekte berücksichtigt werden, um sowohl die Bewirtschaftung des Systems mit neuen Daten als auch den Gebrauch der Daten für Analysezwecke möglichst effektiv zu gestalten.
Grundlagen
In den nachfolgenden Kapiteln werden zunächst die Grundlagen zur Modellierung von Strukturen in Data-Warehouse-Systemen vermittelt (Kap. 2). Dabei wird berücksichtigt, dass das BW seit der Version 7 nicht länger ausschließlich auf die Speicherung von Daten in relationalen Datenbanksystemen setzt, sondern mit dem Business Warehouse Accelerator (BWA) und der hauptspeicherresidenten Datenbank HANA eine weitere Speichertechnologie unterstützt, die vollständig anderen Paradigmen bei der Modellierung unterliegt.
Datenmodellierung in der DWWB
Nach einer kurzen Einführung in die Modellierungsoberfläche der Data Warehousing Workbench (Kap. 3) werden die unterschiedlichen Modelle im Einzelnen erörtert, wobei wiederum Wert darauf gelegt wird, zwischen Modellen für relationale Datenbanksysteme, dem BWA und HANA zu unterscheiden und die Spezifika der Modellierung herauszuarbeiten. Teil diese Beschreibung sind
image
InfoObjekte,
die die Grundlage aller weiteren Modelle bilden (Kap. 4),
image
InfoCubes,
bei deren Erläuterung zwischen der Modellierung in relationalen Datenbanken (Kap. 5) und der Modellierung von HANA-optimierten InfoCubes (Kap. 6), BWA-Indizes (Kap. 7), BWA-basierten InfoCubes (Kap. 8) und analytischen Indizes (Kap. 9) unterschieden wird,
image
DataStore-Objekte,
bei denen – ebenso wie bei InfoCubes – zwischen der Modellierung in relationalen Datenbanksystemen (Kap. 10) und der Modellierung für die HANA-Datenbank (Kap. 11) unterschieden wird.
Partitionierung, Clustering, Splitting
Die für die Performance relevanten Aspekte der Datenmodellierung werden in den einzelnen Kapiteln behandelt, sofern sie für die jeweiligen Objekte spezifisch sind. Einzig Partitionierung, Clustering und Splitting werden explizit in Kapitel 12 erläutert, da es sich hierbei um übergreifende Technologien zum Tuning handelt.

2 Grundlagen

Ziel von Datenmodellen ist es, ein Abbild der Realität in einer datentechnisch darstellbaren Form zu schaffen. Welche semantischen Aspekte der Realität für die Datenhaltung in einem Data Warehouse relevant sind, ist spezifisch und unterscheidet sich von den Aspekten, die in einem operativen System abgebildet werden müssen.
Gleiches gilt für die eingesetzten Speicherstrukturen, die grundlegend anderen Zielen dienen als bei operativen Systemen und für die entsprechend andere Modellierungsgrundsätze gelten1.
Die semantischen Aspekte, die der Gestaltung von Daten...

Table of contents

Citation styles for Data Warehousing mit SAP® BW 7.3

APA 6 Citation

Mehrwald, C. (2013). Data Warehousing mit SAP® BW 7.3 (6th ed.). dpunkt. Retrieved from https://www.perlego.com/book/1077098/data-warehousing-mit-sap-bw-73-umfasst-sap-bw-73-powered-by-sap-hana-pdf (Original work published 2013)

Chicago Citation

Mehrwald, Christian. (2013) 2013. Data Warehousing Mit SAP® BW 7.3. 6th ed. dpunkt. https://www.perlego.com/book/1077098/data-warehousing-mit-sap-bw-73-umfasst-sap-bw-73-powered-by-sap-hana-pdf.

Harvard Citation

Mehrwald, C. (2013) Data Warehousing mit SAP® BW 7.3. 6th edn. dpunkt. Available at: https://www.perlego.com/book/1077098/data-warehousing-mit-sap-bw-73-umfasst-sap-bw-73-powered-by-sap-hana-pdf (Accessed: 14 October 2022).

MLA 7 Citation

Mehrwald, Christian. Data Warehousing Mit SAP® BW 7.3. 6th ed. dpunkt, 2013. Web. 14 Oct. 2022.