R Server for HDInsight

Prediktív elemzés, gépi tanulás és big data jellegű adatok statisztikai modellezése

R Server for HDInsight

Mi az R Server for HDInsight?

A nagyvállalati szintű R-alapú elemzési szoftvert, valamint az Apache Hadoop és az Apache Spark hatékonyságát ötvöző Microsoft R Server for HDInsight biztosítja a szükséges skálázhatóságot és teljesítményt. Az R Server több szálon futó matematikai könyvtárai és transzparens párhuzamos folyamatai révén akár ezerszer több adat kezelésére és akár ötvenszer nagyobb sebességre képes, mint a nyílt forráskódú R, így a segítségével pontosabb modelleket taníthat be jobb javaslatok érdekében. Az R Server a nyílt forráskódú R nyelvvel való használatra készült, így módosítás nélkül futtathatja R-parancsfájljait is.

A hatékony, megszokott R nyelv használata

Az adatszakértők első számú választása, az R programozási nyelv világszerte több mint kétmillió felhasználóból álló globális közösséget tudhat a magáénak, és évente nő a nyílt forráskódú analitikai csomagok száma. Az R Server for HDInsight az R nyelvvel való teljes kompatibilitást és ipari méretekben történő futtathatóságot biztosít a Hadoop- és Spark-fürtökben.

Az R használata fellendülőben van. 2007 és 2013 között az R-t használó adatbányászok száma 20%-ról 70%-ra emelkedett. 2008 és 2013 között az R-t elsődleges eszközként használó adatbányászok száma a kevesebb mint 5%-ról 24%-ra nőtt.
A kiadott CRAN-csomagok száma jelentős mértékben emelkedett az elmúlt pár évben. 2005-ben még igen csekély volt a mennyiségük. Számuk 2012-ben 1000-re, míg 2014-ben 3000-re nőtt, 2016-ra pedig már meghaladta a 8000-et.
R-analitika és gépi tanulási kódtár

Nagy méretű R-alapú, portolható párhuzamos elemzési és gépi tanulási kódtár

Használja ki a nagy méretű párhuzamos elemzési és gépi tanulási kódtár előnyeit, amelyet úgy terveztünk meg, hogy együttműködjön a népszerű adatplatformok mindegyikére portolható nyílt forráskódú R nyelvvel. A kódtár többek között a következő funkciókat biztosítja: döntési fák és együttesek, regressziós modellek, fürtözés, adat-előkészítés, megjelenítés és statisztikai függvények.

Több terabájt adat használata az R Server for HDInsighttal

Terabájt nagyságrendű, 1000-szer több adatot kezelő gépi tanulás

A Hadoop és Spark rendszerekben futó, átlátható párhuzamos feldolgozásoknak köszönhetően az R Server for HDInsight több terabájt adat kezelésére alkalmas – ez 1000-szer több annál, mint amire a nyílt forráskódú R nyelv önmagában képes. Tanítson logisztikai regressziós modelleket, fákat és együtteseket bármekkora adatmennyiséggel. Korlátot kizárólag a Spark-fürt mérete jelent.

Gyors működés az R Server for HDInsight segítségével

Akár 50-szer nagyobb teljesítmény

A Spark, a többszálú vektor- és mátrixmatematikai kódtárak és az R Server for HDInsight kombinált használata 50-szer nagyobb teljesítményt biztosít, mint korábban a nyílt forráskódú R.

Nyílt forráskódú R függvény futtatása

Futtasson elosztott paraméterelemzést és szimulációkat meglévő R függvényekkel

A kódtár lehetővé teszi, hogy párhuzamos paraméterelemzés és szimulációk végzése céljából több száz csomóponton futtassa bármely nyílt forráskódú R függvényt. Megvizsgálhatja és finomíthatja modelljeit, így gyorsabban és könnyebben készíthet pontos előrejelzéseket.

Spark-adatforrások elérése a Spark SQL segítségével

A Hadoop- és Spark-adatok elemzése elvégezhető az Apache Spark SQL R Server-adatforrásként való használatával. Ha az Apache Hive és a Parquet vagy egyéb források Spark SQL-lekérdezésének eredményeit betölti egy Spark-adatkeretbe, közvetlenül elemezheti az eredményeket az R Server bármely elosztott számítási algoritmusával.

Válassza ki az Ön által kívánt fejlesztői eszközöket

Az R Server on HDInsight megoldás része az R Studio Server Community Edition, amely egyszerű használatbavételt biztosít. Az ingyenesen letölthető, Visual Studióhoz készült R Tools a megfelelő helyi fejlesztőkörnyezet kialakítását segíti elő.

Nagyvállalati szintű biztonsági szolgáltatás az R Server for HDInsight védelmére

Nagyvállalati szintű biztonság és támogatás

Támaszkodjon az Azure nagyvállalati szintű biztonsági szolgáltatásaira és támogatására, úgy mint a különböző a verziócsomagokra, javításokra, biztonsági frissítésekre és a folyamatos fürtfigyelésre. A Microsoft szolgáltatói szerződése (SLA) pedig védelmet biztosít az R Server for HDInsight-fürtöknek a katasztrofális események ellen, és 99,9%-os rendelkezésre állást kínál.

Gyors beállítás előzetes költségek nélkül

Könnyű beállítás, gyors eredmények

Az R Server for HDInsight nem igényel hosszas telepítést és konfigurálást. Az Azure mindezt megteszi Ön helyett. Perceken belül megkezdheti a statisztikai és gépi tanulási modellek betanítását anélkül, hogy új hardvert kellene beszereznie, vagy bármi másra költenie kellene. Csak azért a számítási és tárolási erőforrásokért kell fizetnie, amelyeket ténylegesen felhasznált.

Az Apache Hadoop® és a kapcsolódó nyílt forráskódú projektek nevei az Apache Software Foundation védjegyei.

Az R Server for HDInsight kipróbálása