Verteilte Data WarehousesStudienarbeit aus dem Jahr 2003 im Fachbereich Informatik - Angewandte Informatik, Note: Sehr gut, Johannes Kepler Universität Linz (Institut für Data and Knowledge Engineering), Sprache: Deutsch, Abstract: Um langfristige Entscheidungen treffen zu können, muss das Management einer Organisation große Mengen an Daten verarbeiten, die üblicherweise in relationalen Datenbanken (RDBMS) gespeichert sind und SQL als Abfragesprache benutzen. Operative Datenbanken unterstützen diesen Prozess der Entscheidungsfindung allerdings nur ungenügend. Ein Data Warehouse soll diese Unzulänglichkeiten der operativen Datenhaltung beheben. Es wird daher auch als Decision Support System (DSS) bezeichnet. Zur Findung von strategischen Entscheidungen werden die Daten aus herkömmlichen Datenquellen herausgeholt, transformiert, bereinigt, aggregiert und schließlich redundant im Data Warehouse abgelegt. Dieser Prozess wird in regelmäßigen Abständen durchgeführt, um die Aktualität der Daten zu gewährleisten. Nach einer Übersicht über die existierenden Data Warehouse Topologien folgt eine kurze Einführung in den Entwurf multidimensionaler Datenstrukturen. Der darauffolgende Abschnitt behandelt komplexe OLAP Abfragen anhand des MD-Join Operators. Weiters werden verschiedene relationale Operatoren in Verbindung mit dem MD-Join und die verteilte Auswertung von MD-Joins erläutert. Anschließend werden einige Reduktionsalgorithmen zur Optimierung verteilter OLAP Abfragen erklärt. Im darauffolgenden Abschnitt folgt die Realisierung des MD-Joins durch Abfragesprachen auf Basis von Standard SQL und EMF-SQL (Extended Multi-Feature SQL). Letzteres bietet einige Vorteile in der Formulierung von Verschachtelten Aggregaten. |
Other editions - View all
Common terms and phrases
_R_c 11 Relation Abbildung Abfragesprachen Abschnitt Aggregate Aggregationsfunktionen Algorithmus Arbeitsschritt Attribute Auswertung des MD-Joins B.Produkt Beispiel 14 Beispiel 4 soll berechnet Berechnung Berücksichtigung der Fragmentierung Bezugswerte Bezugswerte-Relation Bottom-Up COUNT Data Marts Data Warehousing Daten Datum Menge Preis DBMS Definition Distributivität des MD-Joins EMF-SQL Abfrage enthält Ergebnis Filiale Datum Menge Fragment-Attribut Fragmentierung unabhängige Reduktion Gesamtergebnis GMD-Joins in Standard GMDJ Ausdruck Horizontale Fragmentierung Klausel Kombinationen aus Produkt Koordinator Liste von Aggregatfunktionen lokalen Maximal übertragene Datenmenge MD-Join in relationaler MD-Join Operator MD-Joins und Selektionen MD(B MD(MD(B NULL operativen Datenbank Produkt Filiale count_max_Preis_verkaeufe_verkaeufe Produkt Filiale Datum Produkt sum_Preis_Menge_verkaeufe1 Produkt und Filiale Reduktion unter Berücksichtigung relationaler Algebra right outer join Satz 11 Sites Skalla SMDk SQL Abfrage Standard SQL SUM(Preis*Menge Synchronisation synchronisieren Tabelle Teilergebnisse Transformation von GMD-Joins Tupel verkaeufe.Filiale verkaeufe.Produkt AND B.Filiale Verkäufe Filiale verschachtelte MD-Joins Verteilte Auswertung Verteilte GMD-Join Auswertung verteiltes Data Warehouse Vorauswahl Xk von Filiale Zwischenergebnis θ θ