Megoldási ötletek
Ez a cikk egy megoldási ötlet. Ha azt szeretné, hogy további információkkal bővítsük a tartalmat, például a lehetséges használati eseteket, az alternatív szolgáltatásokat, a megvalósítási szempontokat vagy a díjszabással kapcsolatos útmutatást, tudassa velünk a GitHub visszajelzésével.
Ez az architektúra lehetővé teszi, hogy bármilyen méretű adatot kombináljon az egyéni gépi tanulással, és közel valós idejű adatelemzést végezhet a streamszolgáltatásokon.
Architektúra
Töltse le az architektúra Visio-fájlját.
Adatfolyam
- Az összes strukturált, strukturálatlan és részben strukturált adat (naplók, fájlok és adathordozók) összehozása a Synapse Pipelines használatával Azure Data Lake Storage.
- Az Apache Spark-készletek használatával megtisztíthatja és átalakíthatja a strukturálatlan adathalmazokat, és kombinálhatja őket az operatív adatbázisokból vagy adattárházakból származó strukturált adatokkal.
- Skálázható gépi tanulási/mélytanulási technikákkal mélyebb betekintést nyerhet ezekből az adatokból a Python, a Scala vagy a .NET használatával, az Apache Spark-készlet jegyzetfüzet-élményeivel.
- Apache Spark-készlet és Synapse-folyamatok alkalmazása Azure Synapse Analyticsben az adatok nagy léptékű eléréséhez és áthelyezéséhez.
- Adatok lekérdezése és jelentése a Power BI-ban.
- Az Apache Spark-készletekből az Azure Cosmos DB-be betekintést nyerhet, hogy webes és mobilalkalmazásokkal is elérhetővé tegye őket.
Munkafolyamat
- A Azure Synapse Analytics egy gyors, rugalmas és megbízható felhőalapú adattárház, amely lehetővé teszi a rugalmas és egymástól független skálázást, számítást és tárolást egy nagymértékben párhuzamos feldolgozási architektúrával.
- A Synapse Pipelines dokumentációja lehetővé teszi az ETL-/ELT-munkafolyamatok létrehozását, ütemezését és vezénylását.
- Az Azure Blob Storage egy nagymértékben skálázható objektumtároló bármilyen strukturálatlan adatképhez, videóhoz, hanghoz, dokumentumhoz és egyszerűbben és költséghatékonyabban.
- Azure Synapse Analytics Spark-készletek egy gyors, egyszerű és együttműködésen alapuló Apache Spark-alapú elemzési platform.
- Az Azure Cosmos DB egy globálisan elosztott, többmodelles adatbázis-szolgáltatás. Megtudhatja, hogyan replikálhatja az adatokat tetszőleges számú Azure-régióban, és hogyan méretezheti az átviteli sebességet a tárterülettől függetlenül.
- Azure Synapse Link az Azure Cosmos DB-hez lehetővé teszi a közel valós idejű elemzések futtatását az Azure Cosmos DB-ben a tranzakciós számítási feladat teljesítményére vagy költségére gyakorolt hatás nélkül, a Azure Synapse munkaterületen elérhető két elemzési motor használatával: kiszolgáló nélküli SQL és Spark-készletek.
- Azure Analysis Services egy nagyvállalati szintű elemzési szolgáltatás, amely lehetővé teszi a BI-megoldás magabiztos irányítását, üzembe helyezését, tesztelését és továbbítását.
- A Power BI egy üzleti elemzési eszközökből álló csomag, amely betekintést nyújt a szervezetben. Több száz adatforráshoz csatlakozhat, egyszerűbbé teheti az adat-előkészítést, és nem tervezett elemzéseket hajthat ki. Készítsen gyönyörű jelentéseket, majd tegye közzé őket a szervezet számára, hogy felhasználja őket a weben és a mobileszközökön.
Alternatív megoldások
- Synapse Link a Microsoft által előnyben részesített megoldás az Azure Cosmos DB-adatokon alapuló elemzésekhez.
Forgatókönyv részletei
Alakítsa át az adatokat gyakorlatban hasznosítható elemzésekké a legjobb gépi tanulási eszközökkel. Ez a megoldás lehetővé teszi, hogy bármilyen méretű adatot kombináljon, és egyéni gépi tanulási modelleket készítsen és helyezzen üzembe nagy méretekben. A nagyvállalati szintű adatplatformok vállalati célzónák részeként való kialakításáról az felhőadaptálási keretrendszer Adat-célzóna dokumentációjában tájékozódhat.
Lehetséges használati esetek
A szervezetek minden eddiginél több adathoz férhetnek hozzá. A fejlett elemzések segítenek kihasználni az adatelemzés előnyeit. A területek a következők:
- Ügyfélszolgálat.
- Prediktív karbantartás.
- Termékek vagy szolgáltatások ajánlása.
- Rendszeroptimalizálás az ellátási láncoktól az adatközpont-műveletekig.
- Termék- és szolgáltatásfejlesztés.
Megfontolandó szempontok
Költségoptimalizálás
A költségoptimalizálás célja a szükségtelen kiadások csökkentésének és a működési hatékonyság javításának módjainak megvizsgálása. További információ: A költségoptimalizálási pillér áttekintése.
Következő lépések
- Tudnivalók a nagyvállalati szintű adatplatform tervezéséről
- Ismerje meg, hogyan tervezhet és helyezhet üzembe egy végpontok közötti adatelemzési platformot
Tekintse meg az alábbi dokumentációt az architektúrában szereplő szolgáltatásokról:
- A Synapse Analytics dokumentációja
- A Synapse Pipelines dokumentációja
- Az Azure-ban való objektumtárolás bemutatása
- Azure Synapse Analytics Spark-készletek
- Azure Cosmos DB-dokumentáció
- Analysis Services – dokumentáció
- A Power BI dokumentációja
Kapcsolódó források (lehet, hogy a cikkek angol nyelvűek)
- Data LakeHouse védelme Azure Synapse Analytics használatával
- Működési adatok elemzése a MongoDB Atlason a Azure Synapse Analytics használatával
- Big Data-elemzés nagyvállalati szintű biztonsággal Azure Synapse
- Spaceborne-adatelemzés az Azure Synapse Analyticsszel
- Elemzések végpontok között Azure Synapse