La tecnologia di data warehouse più calda che sia mai arrivata da un po' di tempo a questa parte è Fiocco di neve.
L'IPO dell'azienda dovrebbe essere una delle più grandi IPO di software mai registrate, se non la più grande. più grande più grande, Snowflake e i suoi risultati stanno raccogliendo un'attenzione significativa. Meritatamente. Negli ultimi cinque anni, l'azienda ha dato nuova linfa al settore delle tecnologie di data warehouse e di analisi, altrimenti stazionario, un settore che non vedeva innovazioni rivoluzionarie dai tempi di Bill Inmonte. Bill Inmon Inmon ha introdotto per la prima volta il concetto di data warehouse oltre 40 anni fa.
Se le entrate dell'azienda prima dell'IPO (secondo il deposito S1, 408 milioni di dollari per i quattro trimestri precedenti) e le proiezioni di crescita (133% per la prima metà del 2020) saranno veritiere, Snowflake raggiungerà un miliardo di dollari di entrate annuali entro due anni. Per contestualizzare questo dato, nessuna delle aziende basate su Hadoop ancora in vita e lanciate nell'era di Hadoop (l'ultimo grande fermento nello spazio degli "analytics") più di dieci anni fa ha mai raggiunto un miliardo di fatturato. Inoltre, entro pochi anni, l'unica azienda indipendente di database/data warehouse che probabilmente sarà più grande di Snowflake sarà Oracle.
Se non avete ancora adottato Snowflake e sentite tutte le voci che girano sull'azienda, potreste chiedervi se la tecnologia di Snowflake sia adatta al vostro ambiente dati.
In qualità di fornitore di piattaforme di integrazione di dati e applicazioni, SnapLogic offre connettori precostituiti per Snowflake e per molti dei database più diffusi. In base alla nostra esperienza di integrazione, ecco alcuni macro fattori da considerare:
- Avete intenzione di implementare una soluzione di data warehouse on-premises o su cloud? Snowflake è una soluzione cloud solo software as a service. Se state cercando una soluzione di data warehouse basata su cloud, Snowflake è una soluzione potenzialmente adatta.
- Avete politiche aziendali contro gli ambienti multi-tenant?
Se non è così, e volete essere presenti su cloud, Snowflake fa al caso vostro. Se invece avete politiche aziendali contrarie alla multi-tenancy, Snowflake offre una soluzione single-tenant (Snowflake Virtual Private Snowflake (VPS)).
- Qual è la natura o il formato dei dati che desiderate archiviare e analizzare?
Snowflake è in grado di ingerire (caricare) e operare in modo nativo con dati semi-strutturati come JSON e XML e di interrogarli in modo completamente relazionale, con la stessa facilità dei dati strutturati. Questo, insieme alla separazione tra elaborazione e archiviazione, che facilita la scalabilità, sono i loro punti di forza. Si noti che la dimensione dei dati semi-strutturati è limitata a 16 MB. Anche gli archivi di dati Parquet, Avro o ORC possono essere caricati in Snowflake. La dimensione massima ottimale per questi tipi di file è di ~1 GB (si consiglia di dividere i file più grandi).Dati non strutturati come file .pdf, immagini e audio non possono essere caricati in Snowflake. Per questi tipi di file è necessaria una piattaforma di archiviazione separata. Tuttavia, se questi tipi di file vengono convertiti o rappresentati come file binari o stringhe di caratteri (ad esempio, VARCHAR) a scopo di analisi, possono essere caricati in Snowflake. Si noti che le dimensioni dei file binari sono limitate a 8 MB, mentre le stringhe di caratteri sono limitate a 16 MB, non compresse per entrambi.
- Quali sono le prestazioni di scrittura o transazionali richieste per il vostro caso d'uso specifico?
Snowflake non è un database transazionale o OLTP. Sebbene Snowflake possa essere in grado di gestire una quantità simbolica di funzionalità transazionali, dovrete testare Snowflake per determinare il limite per il vostro caso d'uso specifico. Per requisiti di scrittura o transazionali impegnativi, potrebbe essere necessario un database NoSQL di fronte a Snowflake o un database OLTP completamente separato da Snowflake.
- Avete bisogno di un supporto per lo streaming dei dati per il vostro data warehouse?
Snowflake supporta lo streaming dei dati, con una latenza di circa 1 minuto. Testate Snowflake per assicurarvi che i vostri requisiti di latenza possano essere soddisfatti.
- Avete bisogno di capacità di apprendimento automatico e di intelligenza artificiale?
Snowflake non offre nativamente una libreria di apprendimento automatico. SnapLogic ML/AI Snap può fornire questo miglioramento come complemento a Snowflake.
- I vostri team che si occupano di dati preferiscono SQL, Python o Java?
SQL è il linguaggio nativo di accesso ai dati e di interrogazione per l'ambiente Snowflake. Python, Java e altri linguaggi di scripting sono supportati dalle opzioni di connettività.
Se siete nuovi al concetto e all'esperienza di Snowflake, queste sono le macro domande da considerare per valutare se Snowflake, dal punto di vista dell'architettura, è adatto al vostro ambiente. Dal punto di vista del data warehouse, Snowflake eccelle per facilità d'uso ed è in grado di fornire prestazioni estremamente elevate, da cui la sua popolarità. Per le tabelle estremamente grandi o per le tabelle che non sono ordinate naturalmente in base a un timestamp, potrebbe essere necessario ricorrere al clustering delle chiavi per ottimizzare le prestazioni.
Per le vostre esigenze di caricamento dei dati e di integrazione delle applicazioni, SnapLogic è il complemento perfetto di Snowflake. Provate SnapLogic gratuitamente oggi stesso.