Databricks, fondată de Matei Zaharia și Ion Stoica, este una dintre cele mai de succes companii de tehnologie din lume, iar succesul său are rădăcini adânci în inovație și cercetare academică.
Matei Zaharia și Ion Stoica, alături de colegi ai lor de la Universitatea Berkeley din California, au creat un start-up ce transformă modul în care organizațiile gestionează și analizează datele. În septembrie 2023, Databricks a fost evaluată la 43 de miliarde de dolari, după ce a obținut o finanțare de peste 500 de milioane de dolari. Compania are în prezent peste 6.000 de angajați și a ajuns la statutul de „decacorn”, adică o firmă tech care ajunge la o valoare estimată de cel puțin 10 miliarde de dolari în urma unor investiții obținute înainte de listarea la Bursă.
Matei Zaharia, născut la Cluj-Napoca, a studiat informatica la Universitatea din Waterloo, Canada, înainte de a-și continua studiile doctorale la Universitatea Berkeley din California. Acolo, sub îndrumarea profesorului Ion Stoica, Matei a dezvoltat Apache Spark, un motor de procesare a datelor open-source, care a stat la baza întregii afaceri Databricks.
Apache Spark a revoluționat industria prin viteza și eficiența cu care putea procesa volume mari de date. În esență, a fost conceput pentru a depăși limitările sistemului Hadoop, utilizat pe scară largă la acel moment. Apache Spark a devenit rapid unul dintre cele mai populare proiecte open-source din domeniul datelor mari, iar potențialul său a fost imediat recunoscut de industrie.
În 2013, Matei Zaharia și Ion Stoica, împreună cu alți cinci cercetători din echipa de la Berkeley, au fondat Databricks, cu scopul de a comercializa tehnologia Apache Spark și de a oferi soluții de analiză a datelor pentru companii. De la început, compania s-a concentrat pe cloud computing și a oferit platforme care să le permită organizațiilor să-și gestioneze și să-și analizeze datele în mod eficient, fără a avea nevoie de infrastructuri complexe on-premises, care furnizează organizațiilor un control ridicat asupra specificațiilor hardware.
Databricks oferă o platformă unificată de analiză a datelor care combină ingineria datelor, știința datelor și învățarea automată (machine learning) într-un singur ecosistem. Ceea ce face ca această platformă să fie specială este capacitatea sa de a permite echipelor din diverse domenii să colaboreze eficient pe aceleași seturi de date, fără a fi nevoie de schimbări de infrastructură sau de instrumente multiple.
Compania a devenit cunoscută prin faptul că le permite companiilor să transforme rapid datele brute în informații valoroase, proces care stă la baza deciziilor de business. De exemplu, utilizatorii Databricks pot să analizeze date în timp real, să implementeze modele complexe de învățare automată și să scaleze procesele pe cloud pentru a răspunde cerințelor din ce în ce mai mari.
Una dintre inovațiile-cheie ale Databricks este Delta Lake, un proiect open-source care permite gestionarea datelor stocate în cloud într-un mod structurat și performant. Delta Lake asigură un control mai bun al calității datelor, facilitează operațiunile complexe de business intelligence și contribuie la performanța generală a proceselor de date.
Companii din diverse sectoare economice, de la retail și servicii financiare până la sănătate și tehnologie, folosesc platforma Databricks pentru a-și optimiza procesele de afaceri. Printre clienții săi se numără branduri globale precum Comcast, Shell, Expedia și HSBC. Acești clienți folosesc platforma pentru a extrage valoare din datele lor, fie că este vorba despre îmbunătățirea operațiunilor, predicția comportamentului consumatorilor sau optimizarea stocurilor.
Un alt punct de atracție pentru clienți este integrarea nativă a Databricks cu principalii furnizori de cloud computing, precum Microsoft Azure, Amazon Web Services (AWS) și Google Cloud. Această flexibilitate face ca platforma să fie extrem de accesibilă și scalabilă pentru organizații de toate dimensiunile.
Un alt domeniu în care Databricks a avut un impact major este inteligența artificială și machine learning. Compania oferă soluții avansate pentru implementarea algoritmilor de învățare automată, facilitând automatizarea unor procese complexe și crearea de modele predictive mai eficiente. Platforma Databricks permite antrenarea modelelor pe seturi mari de date într-un timp foarte scurt, oferind organizațiilor un avantaj competitiv. În plus, Databricks a investit mult în sprijinirea comunității de dezvoltatori și cercetători în AI, oferindu-le acces la tehnologiile sale și la resursele necesare pentru a inova în domeniu. Proiecte open-source precum MLflow, care este un sistem de gestionare a ciclului de viață al modelelor de machine learning, demonstrează angajamentul companiei de a îmbunătăți continuu ecosistemul AI.
Matei Zaharia și Ion Stoica nu și-au abandonat rădăcinile academice odată cu succesul comercial al Databricks. Ambii sunt în continuare implicați în activitatea de cercetare și predare, Zaharia fiind profesor asociat la Stanford University, iar Stoica, profesor la Berkeley.
Compania păstrează o strânsă legătură cu mediul academic și colaborează activ cu universități de top pentru a dezvolta noi soluții tehnologice. De asemenea, Databricks organizează conferințe și evenimente dedicate comunității de știință a datelor, precum conferința anuală Spark + AI Summit, care reunește mii de specialiști din întreaga lume, pentru a discuta cele mai noi evoluții în domeniul analizei datelor și al AI.
Databricks continuă să inoveze și să își extindă oferta de produse, concentrându-se pe noi tehnologii și domenii de aplicabilitate a datelor mari și AI. În 2023, compania și-a anunțat planurile de a dezvolta soluții noi în domenii precum data governance, securitatea datelor și democratizarea accesului la analize avansate pentru organizații din toate industriile.
Compania a anunțat modelul de inteligență artificială generativă DBRX, în care au fost investiți 10 milioane dolari și opt luni de antrenare. Modelul IA lansat de Databricks este disponibil în mod „open‑source” pe GitHub și pe platforma de dezvoltatori de inteligență artificială Hugging Face, pentru cercetare și utilizare în scop comercial. Acesta se află în două versiuni, una standard (DBRX Base) și una ajustată (DBRX Instruct). Ambele pot folosi date publice, personalizate sau personale pentru generarea de răspunsuri.
Databricks susține că modelul AI are rezultate mai bune decât alte modele lingvistice „open-source”, ca LlaMa-2 al Meta (Facebook), Mixtral – Mistral AI sau Grok al xAI, start-upul lui Elon Musk. Acesta înregistrează performanțe mai bune decât ChatGPT-3.5, dar nu are o abordare multi-modală pentru a putea fi comparat pe deplin cu GPT-4.
Databricks explorează noi parteneriate strategice și extinderea în piețe emergente, precum și în domenii adiacente, precum sănătatea, fintech-ul și energia. Datorită accentului pus pe inovație și colaborare, compania este bine poziționată pentru a rămâne în fruntea revoluției digitale în anii următori.
Povestea de succes a Databricks reflectă puterea inovației tehnologice și a viziunii antreprenoriale. Începând ca un proiect academic dezvoltat de Matei Zaharia sub îndrumarea profesorului Ion Stoica, Databricks a devenit un jucător global major în industrie, având un impact semnificativ asupra modului în care datele sunt gestionate și utilizate la nivel mondial.
Cu o echipă puternică, o bază solidă de clienți și un angajament continuu față de inovație, Databricks este pregătită să modeleze viitorul tehnologiei și să continue să inspire următoarea generație de antreprenori din domeniul tehnologic.
Loc 4
6 miliarde de lei
Ion Stoica 59 de ani
Matei Zaharia 39 de ani
SAN FRANCISCO
TEHNOLOGIE
Locul 4 în ediția 2023 a Forbes 500