SAP Data Warehouse Cloud

Текст
0
Отзывы
Читать фрагмент
Отметить прочитанной
Как читать книгу после покупки
Шрифт:Меньше АаБольше Аа

2.2.1 Data Lake

Sofern Sie Data Warehouse Cloud mit einem Data Lake gebucht und lizensiert haben, können Sie diesen einem Ihrer Spaces zuordnen, um dort große Datenmengen zu speichern und Zugriff darauf zu erhalten. Die Funktion ist derzeit noch auf einen einzigen Space begrenzt. Diesen können Sie alternativ auch extra für den Data Lake erstellen und das Häkchen bei Data Lake Access setzen (siehe Abbildung 2.7).


Abbildung 2.7: Data Lake zu Space hinzufügen

Definition: SAP HANA Cloud, Data Lake

SAP HANA Cloud, Data Lake ist ein vollständig verwalteter Cloud-Service zur sicheren Speicherung und Analyse großer Datenmengen, die eher selten aktualisiert werden. Es ist eine günstige Speicheroption, um Kosten zu senken und gleichzeitig eine gute Performance sowie einen vollständigen SQL-Zugriff auf Daten zu gewährleisten. Die Lösung ist vollständig in die unterliegende SAP HANA Cloud integriert.

Weitere Informationen zum Data Lake finden Sie in der SAP-Hilfe, wenn Sie den Suchbegriff »SAP HANA Cloud, Data Lake« eingeben.

Auf die Tabellen im Data Lake greifen Sie über virtuelle Tabellen im Open-SQL-Schema zu. Diese Tabellen können im Data Builder zur Modellierung verwendet werden.

2.2.2 Gesperrter Space

Was tun, wenn ein Space gesperrt ist?

Ein Space wird gesperrt, wenn sein Platzbedarf die zugewiesene Speicherkapazität übersteigt. Sobald dies passiert, erzeugt das System eine Warnung, die Sie über die Benachrichtigungen aufrufen können, und weist auf die Übernutzung hin. Es bleibt eine Stunde Zeit, um entweder nicht benötigte Daten zu löschen oder für diesen Space den zugeordneten Speicher zu erhöhen, bevor der Sperrmechanismus aktiv wird.

Wenn der Space gesperrt ist, ergeben sich daraus folgende Einschränkungen:

 Änderungen an Objekten im Data Builder können noch gespeichert, aber nicht implementiert werden.

 Open-SQL-Schema-Benutzer können nicht mehr darauf zugreifen.

 Es lassen sich keine weiteren Daten oder CSV-Dateien hinzufügen.

 Das System blockiert das Anlegen von neuen Benutzern, Verbindungen und Open-SQL-Schemata innerhalb des gesperrten Space.

Die Sperre wird bereits in der Space-Übersicht deutlich in Rot und mit einem Schlosssymbol visualisiert (siehe Abbildung 2.8).


Abbildung 2.8: Gesperrter Space

In den Space-Einstellungen wird ebenfalls ein entsprechender Warnhinweis ausgegeben. Diese Sperre können Sie über die Funktion Unlock Space für 24 Stunden aufheben , um die Probleme zu beheben.

2.3 Zuordnung von Benutzern

Im nächsten Bereich der Space-Einstellungen nehmen Sie die Zuordnung von Benutzern (Member Assignment) vor. Klicken Sie dazu auf Add (siehe Abbildung 2.9). Daraufhin wählen Sie aus einer Liste aller dem System bekannten Benutzer. Diese werden Ihnen hier nebst ihren Rollen angezeigt. Durch Auswahl eines Benutzers und einen Klick auf Remove können Sie zugeordnete Benutzer wieder entfernen.


Abbildung 2.9: Zuordnung von Benutzern

Das Suchfeld auf der rechten Seite ermöglicht durch Filterung die gezielte Suche von Benutzern. Das ist insbesondere dann hilfreich, wenn sehr viele Benutzer zugeordnet sind.

2.4 Quellsysteme

Quellsystemverbindungen werden im Space gepflegt, und dort werden auch alle bestehenden Verbindungen aufgelistet (siehe Abbildung 2.10).

Sie können folgende Aktionen vornehmen:

 Neue Verbindung erstellen oder anpassen

 Verbindung löschen

 Verbindung validieren

 Verbindung pausieren und erneut starten

 Liste der Verbindungen erneut laden

 Verbindungen nach verschiedenen Kriterien sortieren


Abbildung 2.10: Quellsystemverbindungen

In der tabellarischen Übersicht sehen Sie zuerst den Namen, den Sie selbst der Verbindung gegeben haben, und daneben den Verbindungstyp (Type) – im Beispiel SAP HANA, SAP ABAP und SAP S/4HANA On-Premise. Sofern Ihre Verbindung zum Quellsystem nur eingeschränkt nutzbar ist, wird dies durch einen Warnhinweis signalisiert. Wenn Sie mit der Maus über das Symbol fahren, erhalten Sie genauere Auskunft über die Art der Einschränkung. Daneben sehen Sie den Benutzernamen des Erstellers (Owner) und das Anlagedatum. Der Replikationsstatus zeigt an, ob aktive Replikationen zu dieser Verbindung existieren.

Zur Neuanlage einer Verbindung klicken Sie auf das -Symbol und gelangen zu einem geführten Dialog (siehe Abbildung 2.11). In einem ersten Schritt wählen Sie den Verbindungstyp aus. Auf der linken Seite können Sie komfortabel nach verschiedenen Kriterien filtern.

Benötigte Verbindungsdetails je Konnektor

Je nach Quellsystem müssen verschiedene Voraussetzungen erfüllt sein, wie z.B. die Existenz eines Datenprovisionierungsagenten (im weiteren Verlauf DP-Agent genannt), des Cloud Connector, von Zertifikaten oder eines entsprechenden Treibers.

Die Details für jeden Konnektor finden Sie in der SAP-Hilfe der Data Warehouse Cloud, wenn Sie nach dem Begriff »Connection Types« suchen.


Abbildung 2.11: Neues Quellsystem anlegen – Schritt 1

Das Informationssymbol der jeweiligen Kachel verrät Ihnen, welche Funktionen die einzelne Verbindung unterstützt.

Im nächsten Schritt geben Sie die Bezeichnung der Verbindung (Business Name) und einen technischen Namen an (siehe Abbildung 2.12). Bitte beachten Sie, dass der technische Name automatisch mit einem Präfix des Space-Namens versehen wird. Sie können zusätzlich eine längere Beschreibung im Feld Description hinterlegen.

Zuletzt wählen Sie noch den passenden DP-Agenten aus, den Sie zuvor installiert haben sollten (wie das geht, erfahren Sie in Kapitel 6).


Abbildung 2.12: Neues Quellsystem anlegen – Schritt 2

Im dritten Schritt benötigen Sie die Verbindungsdaten zum Quellsystem und müssen die Verbindungseigenschaften angeben (siehe Abbildung 2.13 am Beispiel von SAP HANA On-Premises).


Abbildung 2.13: Neues Quellsystem anlegen – Schritt 3

Einige Quellsystemverbindungen bieten noch einen optionalen vierten Schritt an, um spezielle Parameter einzustellen. Im Beispiel in Abbildung 2.14 sind das die erweiterten Eigenschaften des SAP-HANA-Adapters im DP-Agenten. Sie können diese Parameter auch nach dem Anlegen der Verbindung unter noch editieren ().


Abbildung 2.14: Erweiterte Eigenschaften des SAP-HANA-Adapters

Die Liste der möglichen Quellsystemverbindungen wächst stetig, wobei nicht jeder Konnektor alle Funktionen unterstützt. Tabelle 2.1 soll diesbezüglich Klarheit schaffen.



Tabelle 2.1: Unterstützte Funktionen der Quellsysteme

* Adverity und Precog sind Drittanbieterwerkzeuge, welche die Daten direkt in ein Open-SQL-Schema schreiben. Diese Aktion wird aus der Partnerlösung gesteuert.

** Die SAP Open Connectors sind ein Service in der SAP Business Technology Platform (BTP, ehemals SAP Cloud Platform) und ermöglichen den Zugriff auf über 170 weitere Datenquellen. Sofern Sie ein Nutzungsrecht für die Open Connectors in der BTP besitzen, können Sie Ihren BTP-Account mit Data Warehouse Cloud koppeln und diese Konnektoren verwenden.

 

2.5 Datenbankbenutzer und externe Schnittstellen

Data-Warehouse-Systeme sind in den seltensten Fällen unabhängige Insellösungen, sondern sehr häufig eng mit anderen Applikationen und Datenbeständen verzahnt. Für diese hohe Integration stehen in Data Warehouse Cloud Schnittstellen über spezielle Datenbankbenutzer zur Verfügung.

In diesem Bereich können Sie auch die Bibliotheken für maschinelles Lernen aus dem HANA-Cloud-Scriptserver aktivieren, um Data-Science-Projekte auf den vorhandenen Datenbeständen durchzuführen.

Sie können pro Space einen oder mehrere Datenbankbenutzer mit unterschiedlichen Berechtigungen anlegen (siehe Abbildung 2.15) und diese – je nach Berechtigung – auch zur Datenmodellierung mit anderen Werkzeugen einsetzen.


Abbildung 2.15: Datenbankbenutzer im Space

Mit dem Anlegen eines Datenbankbenutzers erzeugen Sie gleichzeitig ein SQL-Schema auf der HANA-Cloud-Datenbank. Dieses Schema wird auch als Open-SQL-Schema bezeichnet.

Aus der Übersicht der Datenbankbenutzer lässt sich direkt der SAP-Datenbank-Explorer (DB-Explorer) starten, indem Sie einen Benutzer mittels markieren und auswählen. Daraufhin öffnet sich der DB-Explorer und ermöglicht den Zugriff auf das Open-SQL-Schema sowie die exponierten Views aus dem Space-Schema.

Unabhängig davon können Sie oberhalb der Tabelle der Datenbankbenutzer per Schalter festlegen, ob alle neu angelegten Datenmodelle in diesem Space automatisch als konsumierbar (Expose for Consumption by Default) gekennzeichnet werden sollen oder nicht.

Den Effekt Ihrer Wahl sehen Sie im Data Builder. Wenn Sie dort beispielsweise einen neuen View anlegen (siehe Abbildung 2.16), dann ist die Funktion Expose for Consumption automatisch ein- bzw. ausgeschaltet. Ist diese Funktion aktiv, werden konsumierende Zugriffe von SAP Analytics Cloud oder von externen Analysewerkzeugen erlaubt. Steht der Schalter auf OFF, dann ist der Zugriff auf diesen View mit Analysewerkzeugen nicht möglich. Diese Einstellung ist jederzeit änderbar.


Abbildung 2.16: Datenzugriff mit analytischen Werkzeugen

2.5.1 Lesezugriff auf das Space-Schema

Einige Anwender möchten den Datenzugriff mit Werkzeugen anderer Software-Hersteller vornehmen. Durch die Erzeugung eines Datenbankbenutzers im Space können Sie über eine SQL-basierte Schnittstelle für diese Werkzeuge die Konsumierung der Daten in Data Warehouse Cloud ermöglichen.

Navigieren Sie hierzu über Space Management in den Bereich des Datenbankzugriffs (Database Access) und dort zu den Datenbankbenutzern (Database Users) (siehe Abbildung 2.15). Wählen Sie Create (erstellen), um einen neuen Benutzer zu erzeugen. Vergeben Sie einen Namen und weisen Sie dem Benutzer Berechtigungen zu.

Der Name hat eine maximale Länge von 31 Zeichen und kann im Nachhinein nicht mehr verändert werden. Als Präfix wird automatisch der Name des Space vorangestellt, sodass sich der Benutzername wie folgt zusammensetzt:

<Name des Space>#<Name des Schemas>

Der in Abbildung 2.17 beispielhaft gezeigte Benutzer BOOKSPACE#EXCEL darf lesend auf die Daten des Space-Schemas zugreifen.


Abbildung 2.17: Datenbankbenutzer erstellen

In diesem Dialogschritt können Sie auch festlegen, ob dieser Datenbankbenutzer der Kennwortrichtlinie (Password Policy) folgen soll. Mehr dazu erfahren Sie in Abschnitt 6.4.

Nachdem Sie einen Namen eingegeben haben, werden Ihnen im nächsten Dialogschritt die Verbindungsdaten (siehe Abbildung 2.18) für Ihr externes Werkzeug ausgegeben: Host Name, Port, User Name und Password.


Abbildung 2.18: Space-Schema – Benutzerdetails

Mit diesen Verbindungsdaten schließen Sie jetzt Ihr externes Werkzeug über eine sichere Verbindung an den Space an und erhalten Zugriff auf die freigegebenen Daten. Damit diese Verbindung funktioniert, benötigen Sie für Ihr Werkzeug häufig noch einen zuvor installierten ODBC-Treiber, beispielsweise, wenn Sie Microsoft Excel anschließen möchten.

2.5.2 Schreibzugriff auf das Open-SQL-Schema

Neben dem Zugriff auf vorhandene Daten ist die Datenbeladung und -modellierung (SQL Data Definition Language (DDL) und Data Manipulation Language (DML)) mittels externer Werkzeuge sehr wichtig. Zuvor haben Sie gelernt, dass Daten und Datenmodelle in einem Space-Schema »leben«, in dem sie mit den Editoren und Werkzeugen von Data Warehouse Cloud verwaltet werden.

Wozu also noch eine weitere Möglichkeit, Daten ins System zu laden oder zu modellieren?

Speziell die Zielgruppen Entwickler oder Data Scientists sind es gewohnt, mit ihren lieb gewonnenen Werkzeugen zu arbeiten und ein Data Warehouse aufzubauen. Das können unterschiedliche Werkzeuge für vielfältige Zwecke sein:

 Datenintegration, also das Extrahieren, Transformieren und Laden von Daten (auch als »ETL« bezeichnet)

 Datenmodellierung

 SQL-Programmierung

 Data-Science-Werkzeuge (z.B. Jupyter Notebook)

 Etc.

Aus Sicherheitsgründen finden die Operationen dieser externen Werkzeuge in einem getrennten Schema (dem Open-SQL-Schema) und nicht im Space-Schema statt. Damit soll nicht nur Datensicherheit, sondern auch die Konsistenz der Daten und Datenmodelle im Space-Schema sichergestellt werden.

Mit dem Anlegen des Datenbankbenutzers erhalten Sie gleichzeitig ein Open-SQL-Schema. Dort können externe Werkzeuge der SAP, aber auch anderer Anbieter sicher konnektieren, Datenmodellierungen und -beladungen sowie SQL-Operationen (DDL und DML) vorgenommen werden, ohne die Stabilität der Modelle im Space-Schema zu beeinträchtigen. In Abbildung 2.19 ist der Zusammenhang zwischen einem Space-Schema und den Open-SQL-Schemata dargestellt.


Abbildung 2.19: HDI-Container, Space- und Open-SQL-Schema

Beispiel zur Nutzung von ETL-Werkzeugen

Sie haben mit einem Datenintegrationswerkzeug bereits einen Datenfluss aufgebaut, den Sie nun auch in SAP Data Warehouse Cloud verwenden möchten. Dafür tauschen Sie einfach das Zielsystem in Ihrem Datenfluss aus. Damit ersparen Sie sich Migrationsaufwand, denn Sie müssen nicht den kompletten Datenfluss erneut mit den Werkzeugen in Data Warehouse Cloud nachbilden, sondern können direkt wiederverwenden, was Sie bereits aufgebaut haben. Im Open-SQL-Schema können Sie anschließend auch weitere Datenmodellierungen vornehmen.

Um einen neuen Datenbankbenutzer zu erzeugen und ein Open-SQL-Schema anzulegen, wählen Sie Create (siehe Abbildung 2.15), und für die Berechtigung zum Schreiben aktivieren Sie das Feld Enable Write Access (siehe Abbildung 2.20). Vergeben Sie einen Namen, hier BOOKSPACE#EXTERN.


Abbildung 2.20: Open-SQL-Schema

Direkt unter Enable Write Access sehen Sie zwei weitere Kontrollkästchen, die Sie auch später noch jederzeit ein- oder ausschalten können. Pro Open-SQL-Schema können Sie darüber steuern, ob Sie Lese- oder Änderungsoperationen in diesem Schema über eine Auditierungsfunktion protokollieren lassen wollen (mehr dazu folgt in Abschnitt 2.7.1).

Nachdem Sie einen Namen und die Berechtigungen vergeben haben, erhalten Sie im nächsten Dialogschritt die Verbindungsdaten (siehe Abbildung 2.18) für Ihr externes Werkzeug: Host Name, Port, User Name und Password.

In Abbildung 3.105 sehen Sie darüber hinaus, dass Sie die im Open-SQL-Schema erzeugten Objekte direkt in der Datenmodellierung im Data Builder verwenden können. Dabei ist es unerheblich, ob die Objekte über Quellsystemverbindungen oder über ein Open-SQL-Schema zur Verfügung stehen. Das Thema »Datenmodellierung mit externen Werkzeugen im Open-SQL-Schema« wird in Abschnitt 3.9 ausführlicher erläutert.

2.5.3 HDI-Container

Sie können über Data Warehouse Cloud auf Container der HANA Deployment Infrastructure (HDI) zugreifen und diese Daten im Data Builder verwenden. HDI-Container spielen besonders bei hybriden Einsatzszenarien von Data Warehouse Cloud und SQL-basierten Data Warehouses mit SAP HANA 2.0 oder HANA Cloud eine wesentliche Rolle.

Im Prinzip stellt ein Space für sich genommen bereits einen Container dar. Weshalb sollte also ein HDI-Container innerhalb eines Space notwendig sein?

Die Antwort ist einfach: Viele Kunden setzen bereits HDI-Container ein und möchten die in diesen Container implementierten Datenmodelle auf einfachem Weg auch mit Data Warehouse Cloud nutzen.

Was ist ein HDI-Container?

Die HANA Deployment Infrastructure stellt einen Service bereit, der Datenbankobjekte in Containern erzeugen kann, den HDI-Container. Der Service beinhaltet Design-Time-Artefakte für SAP-HANA-Datenbankfunktionen, welche den Zielzustand der Runtime-Objekte in konsistenter Form beschreiben (z.B. Tabellen, Views, Prozeduren). Diese konsistente Form wird während des sogenannten Build-Prozesses in der HANA-Datenbank implementiert. Der Service steht auf SAP HANA Cloud oder SAP HANA 2.0 bereit.

Weitere Informationen finden Sie in der SAP-Hilfe unter dem Suchbegriff »SAP HANA Deployment Infrastructure in the Cloud«.

Unter Space Management können Sie den Zugriff auf HDI-Container ermöglichen (siehe Abbildung 2.21).


Abbildung 2.21: HDI-Container im Space registrieren

Damit Ihr Data Warehouse Cloud Tenant zu Ihrem SAP-Cloud-Foundry-Benutzer (Global Account) zugeordnet werden kann, müssen Sie über https://launchpad.support.sap.com/ ein Supportticket öffnen.

Folgende Informationen werden im Ticket benötigt:

 Tenant-ID des Data-Warehouse-Cloud-Systems (Sie finden diese im Menü unter , siehe Abbildung 1.9)

 ID der Organisation der SAP Business Technology Platform, in der sich Ihre HDI-Container befinden

 ID des SAP Business Technology Platform Space, der zur Organisation der SAP Business Technology Platform gehört

Space-Auditierung und HDI-Container

Die Auditeinstellungen auf Space-Ebene werden auch auf die Modelle Ihres HDI-Containers angewandt.

Doch Achtung: Spätere Änderungen an den Auditeinstellungen werden nicht automatisch für den HDI-Container vorgenommen!

Sollen die neuen Einstellungen ebenso für Ihren vorhandenen HDI-Container gelten, dann müssen Sie die Zuordnung dieses HDI-Containers aufheben und ihn nach der Änderung der Auditeinstellungen erneut zuordnen. Bestehende Modelle auf der Basis Ihrer HDI-Modelle werden verfügbar, sobald der HDI-Container wieder Ihrem Space zuwiesen ist.

Zukünftig ist geplant, diesen ticketbasierten Prozess direkt durch einen Self-Service-Dialog in der Software abzulösen.

 

Anschließend können Sie über die -Schaltfläche Ihrem Space die verfügbaren HDI-Container zuweisen (siehe Abbildung 2.22). Während ein HDI-Container einem Space nur einmal zugeordnet werden kann, lassen sich einem Space mehrere HDI-Container zuordnen.


Abbildung 2.22: HDI-Container auswählen

Wenn Ihnen keine HDI-Container angezeigt werden, kann das mehrere Gründe haben:

 Das Supportticket ist noch nicht erstellt bzw. umgesetzt.

 Es sind keine HDI-Container vorhanden.

 Ihr HDI-Container enthält nicht die erforderlichen Rollen.

Folgende Rollen werden in einem HDI-Container benötigt:

 DWC_CONSUMPTION_ROLE – um z.B. die erforderlichen Tabellen auszuwählen,

 DWC_CONSUMPTION_ROLE# – diese Rolle besitzt zwar dieselben Berechtigungen wie die Rolle DWC_CONSUMPTION_ROLE, kann jedoch darüber hinaus weitere Berechtigungen erteilen.

Nach erfolgreicher Zuordnung lassen sich die Artefakte aus dem HDI-Container in Ihren Modellen weiterverwenden. Im Data Builder werden nun neben der Quellsystemverbindung und dem Open-SQL-Schema auch HDI-Container angezeigt.

Umgekehrt können Sie ebenfalls erlauben, aus dem HDI-Container auf exponierte Modelle und Daten aus Ihrem Space-Schema zuzugreifen. Dafür müssen Sie beim Datenbankbenutzer die HDI-Consumption gestatten (siehe Abbildung 2.23).


Abbildung 2.23: HDI-Zugriff erlauben

2.5.4 HANA Cloud Scriptserver aktivieren

Aktivieren Sie für Ihr Data-Warehouse-Cloud-System den HANA Cloud Scriptserver, um damit Funktionen aus den Bibliotheken für maschinelles Lernen (Automated Predictive Library (APL) und Predictive Analysis Library (PAL)) auszuführen.

Dies ist insbesondere bei Anwendungsfällen rund um Data-Science-Projekte interessant, denn HANA Cloud bietet die beiden genannten Bibliotheken integriert an. Hier können Sie den DB-Explorer oder das bei Data Scientists populäre Jupyter Notebook als externes Werkzeug verwenden.

Um diese Bibliotheken in Ihrem Space einsetzen zu können, müssen Sie zunächst ein Ticket erstellen. Daraufhin werden die APL- und PAL-Bibliothek für Sie eingerichtet.

Sobald der Scriptserver in Ihrem Tenant nutzbar ist, wird Ihnen bei den Berechtigungen der Datenbankbenutzer eine zusätzliche Option angezeigt (siehe Abbildung 2.24).


Abbildung 2.24: Bibliotheken aktivieren

Sie können für jeden Datenbankbenutzer explizit entscheiden, ob die beiden Bibliotheken verwendet werden dürfen.

Eine Anleitung zum Erstellen eines SAP-Tickets und zum Aktivieren der Bibliotheken für maschinelles Lernen finden Sie im SAP-Hinweis 2994416.

Бесплатный фрагмент закончился. Хотите читать дальше?
Купите 3 книги одновременно и выберите четвёртую в подарок!

Чтобы воспользоваться акцией, добавьте нужные книги в корзину. Сделать это можно на странице каждой книги, либо в общем списке:

  1. Нажмите на многоточие
    рядом с книгой
  2. Выберите пункт
    «Добавить в корзину»