Trace Id is missing
Ugrás a tartalomra

Azure Databricks

AI-tervezés Apache Spark™-alapú elemzéssel.

Big data-elemzés és mesterséges intelligencia az optimalizált Apache Sparkkal

Az Azure Databricks segítségével betekintést nyerhet az adatokba és mesterséges intelligenciát használó (AI-) megoldásokat fejleszthet, percek alatt beállíthat egy Apache Spark™-környezetet, automatizálhatja a skálázást, valamint egy interaktív munkaterületen együttműködhet másokkal a közös projektekben. Az Azure Databricks támogatja a Python, a Scala, az R, a Java és az SQL nyelveket, valamint több adatelemzési keretrendszert és kódtárat, úgymint TensorFlow, PyTorch és scikit-learn.

Az Apache Spark™ az Apache Software Foundation védjegye.

A betöltést és a vezénylést elvégezheti az Azure Data Factory használatával. Előkészítést, átalakítást és bővítést végezhet az Azure Databricks használatával. Kiszolgálást az Azure Synapse Analytics használatával végezhet. Tárolást az Azure Data Lake Storage használatával végezhet. Vizualizációt a Power BI használatával végezhet.

Megbízható adatfeldolgozás

Adatfeldolgozás nagy méretekben kötegelt és folyamatos átvitelű számítási feladatokhoz.

Elemzés az összes adathoz

Elemzést végezhet a legteljesebb és legfrissebb adatokhoz.

Együttműködésen alapuló adatelemzés

Az adatelemzést leegyszerűsítheti nagy méretű adatkészleteknél.

Nyílt forráskódon alapul

Gyors, optimalizált Apache Spark-környezetet használhat.

Gyors kezdés az optimalizált Apache Spark-környezetben

Az Azure Databricks támogatja az Apache Spark legújabb verzióit, és lehetővé teszi a nyílt forráskódú kódtárak zökkenőmentes integrálását. Gyorsan hozhat létre és helyezhet üzembe fürtöket egy teljes mértékben felügyelt Apache Spark-környezetben az Azure globális skálázhatóságával és rendelkezésre állásával. A fürtök létrehozása, konfigurálása és finomhangolása után biztosított a megbízható teljesítményük, nincs szükség a monitorozásukra. Az automatikus skálázás és az automatikus leállítás lehetőségét kihasználva csökkentheti a teljes bekerülési költséget (TCO).

Egy felhasználó új fürtöt hoz létre az Azure Databricksben.
Bevezetés az Apache Spark Databricksben való használatába

A hatékonyság növelése megosztott munkaterület és a leggyakoribb nyelvek használatával

Akár adattudós, akár adatmérnök vagy üzleti elemző, hatékonyan működhet közre egy nyílt, bármilyen típusú elemzési feladat futtatásához egységesített platformon. Fejlesszen az Önnek legalkalmasabb nyelven (például Python, Scala, R vagy SQL). A GitHub és Azure DevOps lehetővé teszi a jegyzetfüzetek egyszerű verziókövetését.

Tegye még hatékonyabbá a big data-alapú gépi tanulást

Az integrált Azure Machine Learning szolgáltatással speciális automatizált gépi tanulási képességekhez juthat hozzá, amelyekkel gyorsan azonosíthatja a megfelelő algoritmusokat és hiperparamétereket. Egyszerűbbé teheti a felhőből a peremhálózatra telepített gépi tanulási modellek kezelését, monitorozását és frissítését. Az Azure Machine Learning szolgáltatás ezenkívül központi regisztrációs adatbázist biztosít a kísérletek, gépi tanulási folyamatok és modellek számára.

Gépi tanulási modell nevű munkaterület és Scikit-Learn az Azure Databricksben
Skálázási igény előrejelzése az Azure Databricksben.

Nagy teljesítményű modern adattárház-kezelést használhat

Mérettől függetlenül egy helyen egyesítheti adatait, és hozzáférhet az elemzési irányítópultok és a működési jelentések által nyújtott eredményekhez. Automatizálhatja az adatok áthelyezését az Azure Data Factoryval, az adatokat betöltheti az Azure Data Lake Storage szolgáltatásba, átalakíthatja és megtisztíthatja őket az Azure Databricks segítségével, végül elérhetővé teheti az elemzéshez az Azure Synapse Analytics használatával. Modernizálhatja felhőalapú adattárházát, és páratlan teljesítményt és skálázhatóságot érhet el.

A szolgáltatás legfontosabb funkciói

  • a

    Optimalizált Spark-motor

    Egyszerű adatfeldolgozás az automatikus skálázási infrastruktúrán nagy mértékben optimalizált Apache Spark™ használatával akár 50-szeres teljesítménynövekedéssel.

  • a

    Gépi tanulási futtatókörnyezet

    Egy kattintással elérheti az előre konfigurált gépi tanulási környezeteket a kibővített gépi tanuláshoz olyan korszerű és népszerű keretrendszerekkel, mint a PyTorch, a TensorFlow és a scikit-learn.

  • a

    MLflow

    Nyomon követheti és megoszthatja a kísérleteket, reprodukálhatja a futtatásokat, és együttműködéssel kezelheti a modelleket egy központi adattárból.

  • c

    Nyelvválaszték

    Az Ön által választott nyelv, így a Python, a Scala, az R, a Spark SQL és a .NET is használható kiszolgáló nélküli és kiépített számítási erőforrásokkal egyaránt.

  • c

    Együttműködésre használható jegyzetfüzetek

    Gyorsan elérheti és feltárhatja az adatait, új betekintő adatokat találhat és oszthat meg, és az Ön által választott nyelvekkel és eszközökkel, együttműködéssel hozhat létre modelleket.

  • c

    Delta lake

    A teljes adatéletciklusra tervezett, nyílt forráskódú tranzakciós tárolási réteggel a már meglévő adattavakban gondoskodhat az adatok megbízhatóságáról és skálázhatóságáról.

  • v

    Natív integráció Azure-szolgáltatásokkal

    A teljes elemzési feladatot és a gépi tanulási megoldást szorosan integrálhatja olyan Azure-szolgáltatásokkal, mint az Azure Data Factory, az Azure Data Lake Storage, az Azure Machine Learning és a Power BI.

  • spar

    Interaktív munkaterületek

    Elősegítheti az adatelemzők, adatmérnökök és üzleti elemzők hatékony együttműködését.

  • d

    Nagyvállalati szintű biztonság

    Egyszerűen használható, beépített biztonság védi az adatait a tárolás helyén, és több ezer felhasználóra és adatkészletre kiterjedő, megfelelő, privát és elkülönített elemzési munkaterületeket hoz létre.

  • s

    Üzemkész állapotban

    A legfontosabb adatfeldolgozási számítási feladatait magabiztosan futtathatja és skálázhatja egy megbízható platformon és az ökoszisztémán belüli integrációval CI/CD-hez és figyeléshez.

További információt kaphat a megoldásarchitektúrák példáiból

Adatelemzés és gépi tanulás az Azure Databricks használatával

Könnyedén elemezheti az élő adatfolyamokat. Folyamatosan nyerhet adatokat bármely IoT-eszközből vagy webes kattintássorozat-naplóból, majd valós időben elemezheti őket.

Modern elemzési architektúra az Azure Databricksszel

Adatait a gyakorlatban is hasznosítható ismeretekké alakíthatja a kategóriájában elsőrangú gépi tanulási eszközkészlet használatával. Ez az architektúra lehetővé teszi, hogy bármilyen típusú és bármennyi adatot kombinálhasson egymással, és egyedi gépi tanulási modelleket alkalmazzon ipari méretű adatbázisokon.

Adatbetöltési, ETL- és streamfeldolgozási folyamatok az Azure Databricks használatával

Az Azure Databricks, az MLflow és az Azure Machine Learning használatával felgyorsíthatja és kezelheti a teljes gépi tanulási életciklust, és gépi tanulási alkalmazásokat hozhat létre, oszthat meg, helyezhet üzembe és kezelhet.

Beépített átfogó biztonság és megfelelőség

További információ az Azure Databricks-termékekről és -szolgáltatásokról

Azure Data Factory

Hibrid adatintegrációs szolgáltatás, amely leegyszerűsíti az ipari méretű ETL-megoldásokat.

Azure Data Lake Storage Gen 2

Rendkívül rugalmasan méretezhető, az Azure Blob Storage-on alapuló, biztonságos Data Lake szolgáltatás.

Azure Machine Learning

Nagyvállalati szintű gépi tanulási szolgáltatás a modellek gyorsabb létrehozásához és üzembe helyezéséhez.

Power BI

Elemzést és interaktív jelentéseket adhat hozzá az alkalmazásaihoz.

Az ingyenes Azure-fiókok használatbavétele

1

Ingyenes használatbavétel. 200 USD értékű kreditet kap, amelyet 30 napon belül használhat fel. Amíg rendelkezik kredittel, számos népszerű szolgáltatásunkat ingyenesen veheti igénybe, valamint további több mint 55 mindig ingyenes szolgáltatást használhat.

2

A kredit felhasználása után váltson használatalapú fizetésre, hogy továbbra is használhassa ezeket az ingyenes szolgáltatásokat. Csak akkor kell fizetnie, ha az ingyenes havi mennyiségnél többet használ.

3

A 12 hónap után továbbra is használhat több mint 55 mindig ingyenes szolgáltatást, és a havi ingyenes mennyiségeket meghaladóan csak azért kell fizetnie, amit felhasznál.

Közösség és Azure-támogatás

Az  MSDN-fórum és a Stack Overflow használatával kérdéseket tehet fel, és támogatást kérhet a Microsoft mérnökeitől és az Azure közösségi szakembereitől, vagy kapcsolatba léphet az  Azure ügyfélszolgálatával is.

Népszerű laborok és sablonok

 Egyéni ütemben végezhető laborgyakorlatok  és népszerű  gyorssablonok gyakori konfigurációkhoz  a Microsoft és a közösség jóvoltából.

Az Azure Databricks szolgáltatással kapcsolatos gyakori kérdések

  • Az Azure Databricks SLA-ja 99,95%-os rendelkezésre állást garantál.

  • A Databricks-egység (más néven DBU) óránkénti feldolgozási egységet jelent, amelyet másodpercalapú használat alapján számlázunk.

  • Adatfeldolgozási számítási feladatnak azt a feladatot nevezzük, amely automatikusan elindítja és le is állítja azt a fürtöt, amelyen fut. Egy számítási feladatot elindíthat például az Azure Databricks feladatütemezője, amely kizárólag ehhez a feladathoz indít el egy új Apache Spark-fürtöt, és a feladat végeztével leállítja azt.

    Az adatelemzési számítási feladat nem automatizált. Az Azure Databricks-jegyzetfüzetek parancsai például Apache Spark-fürtökön futnak, amíg manuálisan le nem állítják őket. Több felhasználó is megoszthat egy fürtöt annak elemzéséhez.

Ha készen áll, állítsa be az ingyenes Azure-fiókját