Vergleich der Preise für Cloud Data Warehouses - Teil 1

Michael Nixon Kopfbild
3 Minuten lesen

SnapLogic ist eine agnostische Cloud-Integrationsplattform als Service(iPaaS), die Datenflüsse zwischen lokalen Anwendungen und Daten, Cloud-SaaS-Anwendungen und einer Vielzahl von Cloud-Data-Warehouses zusammenführt und orchestriert. Daher werden wir oft nach unserer Meinung gefragt, welches Cloud Data Warehouse "das beste" ist. 

Amazon Redshift vs. Google BigQuery vs. Snowflake Preisgestaltung

Die Antwort lautet, wie zu erwarten, dass es darauf ankommt. Es gibt viele Faktoren.So habe ich bereits in einem früheren Blog über die wichtigen Faktoren berichtet, die zu berücksichtigen sind, wenn Sie entscheiden, ob das kürzlich an die Börse gebrachte Snowflake für Ihre Umgebung geeignet ist

Mit der SnapLogic-Integration außerhalb Ihrer Warehouse-Plattform müssen Sie sich nicht auf ein bestimmtes Cloud Data Warehouse festlegen. Unsere grafische Low-Code-Benutzeroberfläche ermöglicht es Ihnen, Cloud-Data-Warehouses einfach zu ändern oder zu kombinieren, um sie an die unterschiedlichen Anforderungen in Ihrem Unternehmen anzupassen. Ein Bereich, auf den sich viele unserer Kunden beim Vergleich von Cloud-Data-Warehouses besonders konzentrieren möchten, ist die Preisgestaltung. 

Mit dem Ziel, ein Referenztool für Preisvergleiche und eine Blaupause für die Ausrichtung auf Ihre spezifischen Anforderungen bereitzustellen, ist dieser Blog der erste einer Reihe, in der die Preisansätze für drei beliebte Cloud Data Warehouse-Optionen (siehe Tabelle 1) verglichen werden: Amazon Redshift, Google BigQuery und Snowflake. 

Zwar sind alle drei eine ausgezeichnete Wahl mit einzigartigen Vorteilen, aber jeder Anbieter von Cloud-Data-Warehouses geht bei der Preisgestaltung ganz anders vor. Das kann verwirrend sein.

Wenn Sie bereits mit den Preisstrukturen für Cloud Data Warehousing vertraut sind, aber ein Referenzinstrument benötigen, das Sie mit anderen teilen oder in Ausschreibungen einbeziehen können, sind diese Informationen sehr nützlich für Sie:

Wie Sie sehen können, sind die Preisansätze sehr unterschiedlich. Selbst wenn Sie Ihre eigenen Benchmark-Tests mit Ihren eigenen Daten und Abfrageanforderungen durchführen, sollten Sie wissen, wie sich die Preise der einzelnen Plattformen unterscheiden, wenn sich Abfragen und Daten ändern oder wachsen.

Herausforderungen beim Vergleich von Preisen auf der Basis von vCPUs und Nodes

Viele IT-Unternehmen versuchen, Vergleiche auf der Grundlage einer bestimmten Konfiguration durchzuführen, z. B. der Anzahl der vCPUs und des Speichers usw. Aus preislicher Sicht ist dies jedoch nicht vergleichbar, da vCPU für jedes Cloud Data Warehouse etwas anderes bedeutet. Hinzu kommt, dass die Anbieter von Cloud-Data-Warehouses die Leistung auf unterschiedliche Art und Weise erzielen (z. B. durch Beschneidung von Abfragedaten, Rechentrennung usw.), so dass die vCPU als Maßstab für die Preisgestaltung wenig aussagekräftig ist. 

In der BigQuery-Dokumentation von Google wird ein "Slot" beispielsweise als virtuelle CPU definiert. Ohne weitere unterstützende Informationen ist es schwierig, die genauen Details eines BigQuery-Slots zu kennen, außer dass er eine Recheneinheit innerhalb der massiven Serverinfrastruktur darstellt. Aufgrund unserer Erfahrung raten wir davon ab, einen BigQuery-Dienst mit 500 vCPU" (d. h. 500 Slots) mit einer Redshift-Umgebung mit 500 vCPU (dc2.8xlarge, ra3.16xlarge,...) gleichzusetzen oder zu erwarten. Auch der Preisunterschied ist dramatisch.

Schließlich sind vCPU-Informationen möglicherweise nicht öffentlich verfügbar, wie es bei Snowflake der Fall ist, das dieses Detail hinter seinem Cloud Data Warehouse Service verbirgt. 

Ein Preisvergleich auf der Grundlage der Knotenanzahl ähnelt dem Vergleich von vCPUs - es muss sorgfältig darauf geachtet werden, wie aussagekräftig die Knotenanzahl ist. Google BigQuery verwendet das Konzept der Knoten nicht, und Snowflake macht keine direkten Angaben zur Knotenanzahl. Beachten Sie jedoch, dass die Snowflake-Dokumentation angibt, dass die "X-Small"-Größe ein einzelner "Server" ist und sich die Serveranzahl bis zu einem Maximum von 128 Servern verdoppelt, was einem Snowflake 4X-Large entspricht. 

Dies bedeutet, dass ein Snowflake-Server nicht direkt mit einem Redshift-Knoten gleichgesetzt werden sollte, da die zugrunde liegenden Knotentypen unterschiedlich sein können und die Berechnungsmethoden variieren. 

Veranschaulichung von Preisunterschieden

Wie bereits erwähnt, kann es verwirrend sein, Preise direkt zu vergleichen. Ideal ist es natürlich, eigene Tests mit den verschiedenen Cloud-Data-Warehouses durchzuführen, um ein Gefühl für die Preisgestaltung zu bekommen. Um unerwartete Überraschungen bei der Abrechnung zu vermeiden, ist es jedoch von Vorteil, zu wissen, wie die einzelnen Data Warehouses arbeiten und wie sie Rechen- und Speichergebühren erzeugen. Dies gilt insbesondere angesichts der wachsenden Beliebtheit von Pausen- und Fortsetzungsfunktionen, sekundengenauer Abrechnung und damit verbundenen Abhängigkeiten.   

Im nächsten Blog dieser Reihe werden wir uns mit hypothetischen Szenarien befassen, die einen Leitfaden für die Preisgestaltung darstellen.

Michael Nixon Kopfbild
Ehemaliger VP für Cloud Data Marketing bei SnapLogic

Wir stellen ein!

Entdecken Sie Ihre nächste große Karrierechance.