Big data-elemzés és mesterséges intelligencia az optimalizált Apache Sparkkal
Az Azure Databricks segítségével betekintést nyerhet az adatokba és mesterséges intelligenciát használó (AI-) megoldásokat fejleszthet, percek alatt beállíthat egy Apache Spark™-környezetet, automatizálhatja a skálázást, valamint egy interaktív munkaterületen együttműködhet másokkal a közös projektekben. Az Azure Databricks támogatja a Python, a Scala, az R, a Java és az SQL nyelveket, valamint több adatelemzési keretrendszert és kódtárat, úgymint TensorFlow, PyTorch és scikit-learn.
Az Apache Spark™ az Apache Software Foundation védjegye.
Megbízható adatfeldolgozás
Adatfeldolgozás nagy méretekben kötegelt és folyamatos átvitelű számítási feladatokhoz.
Elemzés az összes adathoz
Elemzést végezhet a legteljesebb és legfrissebb adatokhoz.
Együttműködésen alapuló adatelemzés
Az adatelemzést leegyszerűsítheti nagy méretű adatkészleteknél.
Nyílt forráskódon alapul
Gyors, optimalizált Apache Spark-környezetet használhat.
Gyors kezdés az optimalizált Apache Spark-környezetben
Az Azure Databricks támogatja az Apache Spark legújabb verzióit, és lehetővé teszi a nyílt forráskódú kódtárak zökkenőmentes integrálását. Gyorsan hozhat létre és helyezhet üzembe fürtöket egy teljes mértékben felügyelt Apache Spark-környezetben az Azure globális skálázhatóságával és rendelkezésre állásával. A fürtök létrehozása, konfigurálása és finomhangolása után biztosított a megbízható teljesítményük, nincs szükség a monitorozásukra. Az automatikus skálázás és az automatikus leállítás lehetőségét kihasználva csökkentheti a teljes bekerülési költséget (TCO).
A hatékonyság növelése megosztott munkaterület és a leggyakoribb nyelvek használatával
Akár adattudós, akár adatmérnök vagy üzleti elemző, hatékonyan működhet közre egy nyílt, bármilyen típusú elemzési feladat futtatásához egységesített platformon. Fejlesszen az Önnek legalkalmasabb nyelven (például Python, Scala, R vagy SQL). A GitHub és Azure DevOps lehetővé teszi a jegyzetfüzetek egyszerű verziókövetését.
Tegye még hatékonyabbá a big data-alapú gépi tanulást
Az integrált Azure Machine Learning szolgáltatással speciális automatizált gépi tanulási képességekhez juthat hozzá, amelyekkel gyorsan azonosíthatja a megfelelő algoritmusokat és hiperparamétereket. Egyszerűbbé teheti a felhőből a peremhálózatra telepített gépi tanulási modellek kezelését, monitorozását és frissítését. Az Azure Machine Learning szolgáltatás ezenkívül központi regisztrációs adatbázist biztosít a kísérletek, gépi tanulási folyamatok és modellek számára.
Nagy teljesítményű modern adattárház-kezelést használhat
Mérettől függetlenül egy helyen egyesítheti adatait, és hozzáférhet az elemzési irányítópultok és a működési jelentések által nyújtott eredményekhez. Automatizálhatja az adatok áthelyezését az Azure Data Factoryval, az adatokat betöltheti az Azure Data Lake Storage szolgáltatásba, átalakíthatja és megtisztíthatja őket az Azure Databricks segítségével, végül elérhetővé teheti az elemzéshez az Azure Synapse Analytics használatával. Modernizálhatja felhőalapú adattárházát, és páratlan teljesítményt és skálázhatóságot érhet el.
A szolgáltatás legfontosabb funkciói
-
Optimalizált Spark-motor
Egyszerű adatfeldolgozás az automatikus skálázási infrastruktúrán nagy mértékben optimalizált Apache Spark™ használatával akár 50-szeres teljesítménynövekedéssel.
-
Gépi tanulási futtatókörnyezet
Egy kattintással elérheti az előre konfigurált gépi tanulási környezeteket a kibővített gépi tanuláshoz olyan korszerű és népszerű keretrendszerekkel, mint a PyTorch, a TensorFlow és a scikit-learn.
-
MLflow
Nyomon követheti és megoszthatja a kísérleteket, reprodukálhatja a futtatásokat, és együttműködéssel kezelheti a modelleket egy központi adattárból.
-
Nyelvválaszték
Az Ön által választott nyelv, így a Python, a Scala, az R, a Spark SQL és a .NET is használható kiszolgáló nélküli és kiépített számítási erőforrásokkal egyaránt.
-
Együttműködésre használható jegyzetfüzetek
Gyorsan elérheti és feltárhatja az adatait, új betekintő adatokat találhat és oszthat meg, és az Ön által választott nyelvekkel és eszközökkel, együttműködéssel hozhat létre modelleket.
-
Delta lake
A teljes adatéletciklusra tervezett, nyílt forráskódú tranzakciós tárolási réteggel a már meglévő adattavakban gondoskodhat az adatok megbízhatóságáról és skálázhatóságáról.
-
Natív integráció Azure-szolgáltatásokkal
A teljes elemzési feladatot és a gépi tanulási megoldást szorosan integrálhatja olyan Azure-szolgáltatásokkal, mint az Azure Data Factory, az Azure Data Lake Storage, az Azure Machine Learning és a Power BI.
-
Interaktív munkaterületek
Elősegítheti az adatelemzők, adatmérnökök és üzleti elemzők hatékony együttműködését.
-
Nagyvállalati szintű biztonság
Egyszerűen használható, beépített biztonság védi az adatait a tárolás helyén, és több ezer felhasználóra és adatkészletre kiterjedő, megfelelő, privát és elkülönített elemzési munkaterületeket hoz létre.
-
Üzemkész állapotban
A legfontosabb adatfeldolgozási számítási feladatait magabiztosan futtathatja és skálázhatja egy megbízható platformon és az ökoszisztémán belüli integrációval CI/CD-hez és figyeléshez.
További információt kaphat a megoldásarchitektúrák példáiból
Adatelemzés és gépi tanulás az Azure Databricks használatával
Könnyedén elemezheti az élő adatfolyamokat. Folyamatosan nyerhet adatokat bármely IoT-eszközből vagy webes kattintássorozat-naplóból, majd valós időben elemezheti őket.
Modern elemzési architektúra az Azure Databricksszel
Adatait a gyakorlatban is hasznosítható ismeretekké alakíthatja a kategóriájában elsőrangú gépi tanulási eszközkészlet használatával. Ez az architektúra lehetővé teszi, hogy bármilyen típusú és bármennyi adatot kombinálhasson egymással, és egyedi gépi tanulási modelleket alkalmazzon ipari méretű adatbázisokon.
Adatbetöltési, ETL- és streamfeldolgozási folyamatok az Azure Databricks használatával
Az Azure Databricks, az MLflow és az Azure Machine Learning használatával felgyorsíthatja és kezelheti a teljes gépi tanulási életciklust, és gépi tanulási alkalmazásokat hozhat létre, oszthat meg, helyezhet üzembe és kezelhet.
Beépített átfogó biztonság és megfelelőség
-
A Microsoft több mint 1 milliárd USD-t költ évente a kiberbiztonsággal kapcsolatos kutatás-fejlesztési projektekre.
-
Több mint 3500 biztonsági szakértőnk dolgozik azon, hogy megfelelő szintű adatbiztonságot és adatvédelmet nyújthassunk Önnek.
-
Az Azure minden más felhőszolgáltatónál több minősítéssel rendelkezik. Tekintse meg a teljes listát.
További információ az Azure Databricks-termékekről és -szolgáltatásokról
Azure Data Factory
Hibrid adatintegrációs szolgáltatás, amely leegyszerűsíti az ipari méretű ETL-megoldásokat.
Azure Data Lake Storage Gen 2
Rendkívül rugalmasan méretezhető, az Azure Blob Storage-on alapuló, biztonságos Data Lake szolgáltatás.
Azure Machine Learning
Nagyvállalati szintű gépi tanulási szolgáltatás a modellek gyorsabb létrehozásához és üzembe helyezéséhez.
Power BI
Elemzést és interaktív jelentéseket adhat hozzá az alkalmazásaihoz.
-
Az Azure Databricks díjszabása
Percek alatt elindíthat fürtöket, és automatikusa fel- vagy leskálázhatja őket használati igényeinek megfelelően. Tekintse meg az Azure Databricks díjszabási lehetőségeit.
Az ingyenes Azure-fiókok használatbavétele
1
2
A kredit felhasználása után váltson használatalapú fizetésre, hogy továbbra is használhassa ezeket az ingyenes szolgáltatásokat. Csak akkor kell fizetnie, ha az ingyenes havi mennyiségnél többet használ.
3
A 12 hónap után továbbra is használhat több mint 55 mindig ingyenes szolgáltatást, és a havi ingyenes mennyiségeket meghaladóan csak azért kell fizetnie, amit felhasznál.
Közösség és Azure-támogatás
Az MSDN-fórum és a Stack Overflow használatával kérdéseket tehet fel, és támogatást kérhet a Microsoft mérnökeitől és az Azure közösségi szakembereitől, vagy kapcsolatba léphet az Azure ügyfélszolgálatával is.
Népszerű laborok és sablonok
Egyéni ütemben végezhető laborgyakorlatok és népszerű gyorssablonok gyakori konfigurációkhoz a Microsoft és a közösség jóvoltából.
Tekintse át az Azure Databricks forrásanyagait
Az Azure Databricks szolgáltatással kapcsolatos gyakori kérdések
-
Az Azure Databricks SLA-ja 99,95%-os rendelkezésre állást garantál.
-
A Databricks-egység (más néven DBU) óránkénti feldolgozási egységet jelent, amelyet másodpercalapú használat alapján számlázunk.
-
Adatfeldolgozási számítási feladatnak azt a feladatot nevezzük, amely automatikusan elindítja és le is állítja azt a fürtöt, amelyen fut. Egy számítási feladatot elindíthat például az Azure Databricks feladatütemezője, amely kizárólag ehhez a feladathoz indít el egy új Apache Spark-fürtöt, és a feladat végeztével leállítja azt.
Az adatelemzési számítási feladat nem automatizált. Az Azure Databricks-jegyzetfüzetek parancsai például Apache Spark-fürtökön futnak, amíg manuálisan le nem állítják őket. Több felhasználó is megoszthat egy fürtöt annak elemzéséhez.