SAP DATA INTELLIGENCE


SAP Data Intelligence bietet den Werkzeugkasten, um in einer sich schnell entwickelnden, komplexen IT-Landschaft (speziell in einer Kombination von on-Premise und Cloud) die Kontrolle über die Daten und ihre Wege zu behalten.

Sie haben Daten in einer heterogenen Landschaft auf unterschiedliche Weisen gespeichert – von Dateien in diversen Cloud-Speichern bis zu aufbereiteten Daten in einem Business Warehouse? Es wird schwerer, die Kontrolle über die verfügbaren Daten und ihre Aufbereitung für ein qualitätsgesichertes Berichtswesen oder weiter Konsummöglichkeiten sicherzustellen, ohne zu viel Flexibilität zu verlieren?

Für dieses Szenario bietet SAP die Lösung SAP Data Intelligence an, die in erster Linie eine Orchestrierung von Datenströmen in verteilten IT-Landschaften inkl. entsprechender Manipulation ermöglicht. Zusätzlich sind auch Möglichkeiten zur Datenkategorisierung / -Identifikation und Machine Learning enthalten.


Grundsätzlich ist das Produkt nicht als eine Konkurrenz zu Ihrem Business Warehouse zu verstehen, sondern als Tool zur Einordnung desselben in einen größeren Kontext.

SAP Data Intelligence kann in der SAP Cloud Platform als Service bereitgestellt werden, aber auch auf SAP-fremden Cloud Umgebungen (AWS, Google, Microsoft) oder vollständig on-Premise betrieben werden.

Die äußerst modular aufgesetzte Basis unter Nutzung verschiedener, im Cloud Umfeld etablierter Standards (Kubernetes und Docker) bringt on-Premise Landschaften (HANA, BW, Data Services, …) mit  Cloud-Landschaften in einer Orchestrierungsebene zusammen und ermöglicht ein End-to-End-Management von Datenflüssen und eine Klammer über Ihre verteilte Datenhaltung.

Enthaltene Tools


SAP Data Intelligence beinhaltet eine Vielzahl von Applikationen, über die die Software verwaltet und genutzt werden kann. Die wichtigsten Apps werden nachfolgend kurz vorgestellt.


Connection Management


Innerhalb dieser Komponente können alle von anderen Komponenten genutzten Verbindungen zentral definiert und verwaltet werden. Die Art der Verbindung definiert wiederum, welche Operationen möglich sind.


Die folgenden Verbindungstypen werden derzeit unterstützt:

SAP Quellen (On Premise oder Cloud)

  • ABAP (S/4, ECC, R/3)
  • BW (SAP BW, BW on HANA, BW/4HANA)
  • DATASERVICES (SAP Dataservices Remote Connection)
  • HANA_DB (SAP HANA Database)
  • HANA_XS (SAP HANA Application System)
  • VORA (SAP VORA database)
  • CPI (SAP Cloud Platform Integration)
  • OPEN_CONNECTORS (SAP Cloud Platform Open Connectors)
  • SAP_IQ (SAP IQ Database)
  • CLOUD_DATA_INTEGRATOIN (Cloud Data Integration)

Datenbanken von Drittanbietern

  • DB2 (IBM DB2 Database)
  • MSSQL (Microsoft SQL Server Database)
  • ORACLE (Oracle Database)
  • MYSQL (MySQL Database)
  • REDSHIFT (Redshift Database)
  • AZURE_SQL_DB (Azure SQL Database

    Allgemeine Protokolle

    • ODATA (Open Data Protocol)
    • HTTP (HTTP-System)
    • IMAP (Internet Message Access Protocol (receive E-Mails))
    • SMTP (Simple Mail Transfer protocol (send E-Mails))
    • SFTP (SSH File Transfer Protocol)

    Cloud Service Provider

    • ADL (Azure Data Lake Store)
    • AWS_SNS (Azure Simple Notification Storage)
    • WASB (Microsoft Windows Azure Storage Blobs)
    • GCP_BIGQUERY (Google Cloud Platform – BigQuery)
    • GCP_DATAPROC (Google Cloud Platform – Dataproc)
    • GCP_PUBSUB (Google Cloud Platform – Pub/Sub)
    • GCS (Google Cloud Storage)
    • S3 (Amazon simple storage service)
    • OSS (Alibaba Cloud Object Storage Service)

    Weitere

    • HDFS (Hadoop Distributed File System)
    • KAFKA (Kafka cluster for messages production and consumption)
    • RSERVE (RServe System)

    Modeler


    Dies ist die zentrale Komponente bezüglich Orchestrierung von Datenströmen und stellt die Werkzeuge bereit, mit denen sog. Pipelines definiert werden können. Diese bestehen jeweils aus einer Verknüpfung spezifischer Verwendungen unterschiedlicher Operatoren, d.h. je Verwendung in einer Pipeline können u.U. operator-spezifische Attribute hinterlegt werden. Die Operatoren selbst sind großteils als eigenständige Docker-Container bereitgestellt. Eine große und wachsende Anzahl von Operatoren werden von SAP bereitgestellt und können direkt zur Pipeline-Definition genutzt werden. Sehr große Flexibilität besteht durch Operatoren, die Kunden-Implementierungen kapseln und wiederverwendbare Eigenentwicklungen in verschiedenen Programmiersprachen erlauben, wie bspw. Python, JavaScript, Go oder R.


    Metadata Explorer


    Im Gegensatz zum Modeler ist diese Funktionalität für einen erweiterten Personenkreis angedacht. Es wird die Möglichkeit gegeben, Datenquellen unterschiedlicher Verbindungen mit Metadaten anzureichern (Spaltenbezeichnungen, Datentypen, Beschreibungen) und auf Basis dieser Klassifikation für eine allgemeine Exploration freizugeben (beispielsweise für Data Scientists).


    VORA Tools


    Über diese App wird das Management der eingebetteten SAP VORA-Instanz zur Verfügung gestellt, die als verteiltes Datenbanksystem einen vereinheitlichten Zugriff auf unterschiedliche Speichersysteme (von Files auf einem Cloud Storage bis zu einer on-premise HANA Datenbank) zur Verfügung stellt.


    Ergänzende Apps


    Darüber hinaus stehen Apps für Monitoring, Policy Management (User-Verwaltung) und System Management zur Verfügung. Weiter gibt es verschiedene Tools für das SAP eigene Machine Learning Framework.

    Fazit


    Auch wenn es sich hier um ein sehr neues SAP-Produkt mit einigen Lücken und Kinderkrankheiten handelt, sehen wir in dem äußerst modularen und flexiblen Ansatz ein sehr hilfreiches Instrument, um Qualitäts-Anforderungen an unterschiedlichen Konsum verschiedenster Daten sicherzustellen. Der Umfang der Möglichkeiten erfordert allerdings auch einen hohen Grad an Aufmerksamkeit auf Architektur und Design entsprechender Applikationen.

    Unser Angebot


    Wenn wir Ihr Interesse an SAP Data Intelligence wecken konnten und Sie Näheres über die Einsatzmöglichkeiten erfahren möchten, kontaktieren Sie uns gerne für einen ersten unverbindlichen Austausch.

    Sind Sie an weiteren Informationen oder einem fachlichen Austausch interessiert?


    Dann kontaktieren Sie uns.



    Ihr Ansprechpartner


    Fabian Zollikofer
    CALEO Consulting GmbH
    Lochhamer Schlag 11
    82166 Gräfelfing

    • +49 (89) 41617231
    • +49 (89) 41617239
    • info@caleo.com
    • www.caleo.com