Snowflake - eine Cloud-Datenplattform für datengesteuerte Geschäftsanforderungen

Prognosen zufolge wird der globale Big Data- und Business Analytics-Markt bis 2022 auf 274,3 Milliarden US-Dollar anwachsen (ausgehend von 189,1 Milliarden US-Dollar im Jahr 2019; Quelle: cognetik.com). In der Konsequenz wollen immer mehr Unternehmen in Data Analytics investieren.   

Cloudbasierte Dienste werden folglich essenziell sein, um nicht nur die riesigen Datenmengen, sondern auch die notwendige Rechenleistung zu verwalten. Dienstleister, die sich auf die individuellen Bedürfnisse von Unternehmen hinsichtlich Datenspeicherung und -verarbeitung spezialisiert haben, werden dementsprechend eine Schlüsselrolle für die Weiterentwicklung von Big Data und Business Analytics einnehmen.   

Snowflake, ein Unternehmen aus Kalifornien, das vor seinem Börsengang zwischen 2012 und 2020 mehr als 1,4 Milliarden US-Dollar an Entwicklungskapital eingesammelt hat, bietet relationale Datenbank-Management-Systeme (RDBMS) an, die sich leicht skalieren lassen. Das Unternehmen bedient sich dabei einer breiten Palette von Technologiebereichen wie Business Intelligence, Datenintegration, erweiterte Analysen, Sicherheit sowie Governance und unterstützt zudem die meisten Programmiersprachen.  

Was ist ein relationales Datenbank-Management-System?  

Eine relationale Datenbank greift auf eine Struktur zurück, die es ermöglicht, Daten in Bezug zu anderen Datensätzen in einer Datenbank zu identifizieren und auf diese zuzugreifen. Ein relationales Datenbank-Management-System hilft beim Erstellen, Aktualisieren und Verwalten einer relationalen Datenbank.   

Snowflake bietet eine einzigartige Alternative zu herkömmlichen RDBMS-Systemen, da das Unternehmen die massive Datenspeicherung mit der Möglichkeit kombiniert, mehrere Datenanalyseprozesse in Echtzeit zu starten. Aufgrund der fortgeschrittenen Technologie können mehrere Prozesse gleichzeitig vom selben Kunden ausgeführt werden, ohne miteinander zu konkurrieren. 
Im Gegensatz zu traditionellen Datenbanken werden diese Workloads nicht auf dem Datenserver ausgeführt. Dadurch funktionieren sie deutlich besser. 

Eine Architektur, die in der Lage ist, Milliarden von Datensätzen zu verarbeiten und überall zu replizieren 

Die Architektur von Snowflake basiert auf einer Software-Infrastruktur, die für die Verwaltung halbstrukturierter Daten im XML- oder JSON-Format entwickelt wurde und Milliarden von Daten verarbeiten kann. Sie wurde mit einem Query Mode, der weiterhin auf SQL basiert, kombiniert. Durch die Cloud-Nutzung profitieren die Benutzer von elastischen Rechenressourcen, die sich den Speicher- und Rechenanforderungen anpassen. In 96 Prozent der Fälle ist Snowflake daher in der Lage, in weniger als einer Sekunde einen neuen, unabhängigen Ressourcenpool bereitzustellen.  

Die Daten werden von Clients auf einer einzigen lokalen Instanz gespeichert. Eine Datenfreigabefunktion ermöglicht es derweil, die Daten woanders, unabhängig von der Cloud, AWS, Azure oder neuerdings auch der Google Cloud-Plattform, zu replizieren. Diese Replikationen werden erneuert, um Änderungen in der Hauptdatenbank darzustellen. Um die gemeinsame Nutzung von Daten weiter zu erleichtern, hat Snowflake außerdem eine Datenspeicherfunktion namens „Data Market Place” eingeführt. Damit können Datensätze intern oder an Partner verteilt und vermarktet werden.  

Das Preismodell von Snowflake: Pay what you use   

Snowflake wird als Managed und On-Demand Service vermarktet. Das Preismodell umfasst nur zwei Elemente: die Kosten für den Speicher und die Kosten für die verbrauchten Rechenressourcen. Die Kosten für den Speicher werden pro monatlich genutztem Terabyte berechnet. Die Kosten für die Rechenleistung basieren auf den verbrauchten Verarbeitungseinheiten (Credits), um eine Anfrage auszuführen oder einen Dienst bereitzustellen. Die Rechenkosten werden auf Basis der tatsächlichen Nutzung pro Sekunde berechnet.  

Snowflake stellt neue Funktionen vor    

Derzeit investiert Snowflake stark in die Bereiche Künstliche Intelligenz und damit einhergehend maschinelles Lernen. Zahlreiche Konnektoren wie Spark, Python und Apache Arrow sind bereits verfügbar, ebenso wie optimierte Integrationen mit AutoML-Tools wie DataRobotDataiku, H20.ai und Amazon Sagemaker 

Außerdem kündigte Snowflake die folgenden Features an:  

Snowpark:

Eine neue Entwicklererfahrung, die es Dateningenieuren, Datenwissenschaftlern und Entwicklern ermöglicht, Code in der Sprache ihrer Wahl zu schreiben und vertraute Programmierkonzepte zu verwenden, um beispielsweise ETL/ELT, oder auch Data Preparation und Feature Engineering auf Snowflake auszuführen.   

Snowflake Data Marketplace:

Ermöglicht es jedem Snowflake-Kunden, abfragebereite Live-Datensätze von Drittanbietern von mehr als 100 Datenanbietern zu entdecken und darauf zuzugreifen, ohne dass Dateien kopiert oder Daten verschoben werden müssen.   

Unstructured Data:

Unterstützung für unstrukturierte Daten wie Audio-, Video-, PDF-, Bilddateien und mehr. So wird die Möglichkeit geboten, Pipeline-Ausführungen dieser Daten zu orchestrieren.   

Row Access Policies: 

Kunden werden in der Lage sein, ihre Data Governance über alle Daten und Workloads in Snowflake zu verbessern.  

ec4u bietet Snowflake-Dienstleistungen  

Als Beratungsunternehmen, das Kunden bei der digitalen Transformation unterstützt, bietet die ec4u Dienstleistungen für Unternehmen an, um Ende-zu-Ende-Daten- und Analyselösungen durch Snowflake-Technologien zu konzipieren, zu entwickeln und einzusetzen. Die Berater von ec4u haben ein breites Spektrum an Dienstleistungen entwickelt, die es Kunden erleichtern, ihre Datenarchitektur mit einer cloudbasierten Lösung zu modernisieren und/oder ihre Daten zu nutzen, um ihr Geschäft zu verbessern. Die Dienstleistungen unterstützen bei der Bewertung, Architektur, Analyse und technischen Migration. 

Mehr zu Snowflake erfahren Sie hier.