SnapLogic è una cloud piattaforma di integrazione agnostica come servizio(iPaaS) che collega e orchestra i flussi di dati tra applicazioni e dati on-premises, cloud applicazioni SaaS e una varietà di cloud data warehouse. Per questo motivo, spesso ci viene chiesta la nostra opinione su quale cloud data warehouse sia "il migliore".
Amazon Redshift vs. Google BigQuery vs. Snowflake Prezzi
La risposta è, come ci si aspetterebbe, che dipende. Ci sono molti fattori.Ad esempio, ho scritto in precedenza sui fattori importanti da considerare per stabilire se Snowflake, recentemente oggetto di un'offerta pubblica di acquisto, sia adatto al vostro ambiente.
Con l'integrazione di SnapLogic al di fuori della vostra piattaforma di magazzino, non dovete essere vincolati a un'unica scelta di data warehouse cloud . La nostra interfaccia utente grafica e low-code consente di cambiare o combinare facilmente i data warehouse cloud per adattarli alle diverse esigenze della vostra organizzazione. Di conseguenza, quando si confrontano i data warehouse cloud , un'area su cui molti dei nostri clienti vogliono concentrarsi è il prezzo.
Pertanto, con l'obiettivo di fornire uno strumento di riferimento per il confronto dei prezzi e uno schema per orientarsi alle proprie esigenze specifiche, questo blog è il primo di una serie che mette a confronto gli approcci ai prezzi di tre popolari opzioni di data warehouse cloud (vedi Tabella 1): Amazon Redshift, Google BigQuery e Snowflake.
Sebbene tutti e tre siano scelte eccellenti, con vantaggi unici, ogni fornitore di data warehouse cloud approccia i prezzi in modo molto diverso. Può essere fonte di confusione.
Se avete già familiarità con le strutture dei prezzi del data warehousing di cloud , ma avete bisogno di uno strumento di riferimento da condividere con gli altri o da includere nelle RFP, queste informazioni sono utili da conoscere:
Come si può vedere, gli approcci ai prezzi variano notevolmente. Anche se eseguite i vostri test di benchmark in base ai vostri dati e ai vostri requisiti di query, vorrete comunque sapere in che modo i prezzi variano da una piattaforma all'altra quando le query e i dati cambiano o crescono.
Sfide nel confronto dei prezzi basati su vCPU e nodi
Molti centri IT cercano di effettuare confronti in base a una configurazione specifica, come il numero di vCPU, la memoria e così via. Tuttavia, dal punto di vista del prezzo, non si tratta di un confronto alla pari, perché le vCPU hanno un significato diverso per ogni data warehouse cloud . Inoltre, i fornitori di data warehouse di cloud producono prestazioni in modi diversi (ad esempio, utilizzando il pruning dei dati delle query, la separazione dei calcoli e così via), rendendo così le vCPU poco significative come misura per equiparare i prezzi.
Ad esempio, secondo la documentazione di Google Big Query, uno "slot" è definito come una CPU virtuale. Senza altre informazioni di supporto, è difficile conoscere i dettagli esatti di uno slot di BigQuery, se non che rappresenta un'unità di calcolo all'interno della sua enorme infrastruttura di server. In base alla nostra esperienza, consigliamo di non equiparare o aspettarsi che un servizio BigQuery da "500 vCPU" (cioè 500 slot) abbia le stesse prestazioni di un ambiente Redshift da 500 vCPU (dc2.8xlarge, ra3.16xlarge,...). Anche la differenza di prezzo è notevole.
Infine, le informazioni sulle vCPU potrebbero non essere disponibili pubblicamente, come nel caso di Snowflake, che sceglie di nascondere questo dettaglio dietro il suo servizio di data warehouse cloud .
Confrontare i prezzi in base al numero di nodi è simile a confrontare le vCPU: occorre prestare attenzione a determinare il significato del numero di nodi. Google BigQuery non utilizza il concetto di nodi e Snowflake non divulga direttamente le specifiche del numero di nodi. Tuttavia, la documentazione di Snowflake indica che la dimensione "X-Small" è un singolo "server" e che il numero di server raddoppia fino a un massimo di 128 server, ovvero Snowflake 4X-Large.
Ciò premesso, un server Snowflake non deve essere equiparato direttamente a un nodo Redshift perché i tipi di nodi sottostanti possono essere diversi e le metodologie di calcolo variano.
Illustrare le differenze di prezzo
Come già detto, il confronto diretto tra i prezzi può risultare confuso. L'ideale, naturalmente, è eseguire i propri test sui diversi data warehouse di cloud per farsi un'idea dei prezzi. Tuttavia, per evitare sorprese inaspettate nella fatturazione, è utile conoscere il modo in cui ciascun data warehouse opera e genera i costi di calcolo e di archiviazione. Soprattutto ora, vista la crescente popolarità delle funzioni di pausa e ripresa, della fatturazione al secondo e delle relative dipendenze.
Nel prossimo blog di questa serie, esamineremo scenari ipotetici che forniranno una guida alla determinazione dei prezzi.