R Server for HDInsight

Prediktív elemzés, gépi tanulás és big data jellegű adatok statisztikai modellezése az R-rel

  • A legnagyobb R-alapú, portolható párhuzamos elemzési és gépi tanulási kódtár
  • Terabájtos nagyságrendű gépi tanulás – 1000-szer nagyobb, mint a nyílt forráskódú R-ben
  • Akár 50-szer nagyobb teljesítmény az R Server for Apache Spark 2.0 és az optimalizált vektor- és matematikai kódtárak használatával
  • A Microsoft szolgáltatói szerződés (SLA) által garantált nagyvállalati szintű biztonság és támogatás
  • Spark-adatforrások elérése a Spark SQL segítségével
  • Könnyű beállítás, gyors eredmények
R Server for HDInsight

Mi az R Server for HDInsight?

A nagyvállalati szintű R-alapú elemzési szoftvert, valamint a Hadoop és a Spark hatékonyságát ötvöző R Server for HDInsight egyedülálló skálázhatóságot és teljesítményt biztosít. Az R Server több szálon futó matematikai könyvtárai és transzparens párhuzamos folyamatai révén akár ezerszer több adat kezelésére és akár ötvenszer nagyobb sebességre képes, mint a nyílt forráskódú R, ami pontosabb modellbetanítást és minden eddiginél jobb előrejelzéskészítést tesz lehetővé. Mivel az R Server a nyílt forráskódú R nyelvvel való használatra készült, módosítás nélkül futtathatja R-parancsfájljait is.

A hatékony, megszokott R nyelv használata

Az adatszakértők első számú választása, az R programozási nyelv világszerte több mint kétmillió felhasználóból álló élénk globális közösséget tudhat a magáénak, és évente exponenciálisan nő a nyílt forráskódú analitikai csomagok száma. Az R Server for HDInsight az R nyelvvel való teljes kompatibilitást és ipari méretekben történő futtathatóságot biztosít a Hadoop- és Spark-fürtökben.

Az R használata fellendülőben van. 2007 és 2013 között az R-t használó adatbányászok száma 20%-ról 70%-ra emelkedett. 2008 és 2013 között az R-t elsődleges eszközként használó adatbányászok száma a kevesebb mint 5%-ról 24%-ra nőtt.
A kiadott CRAN-csomagok száma jelentős mértékben emelkedett az elmúlt pár évben. 2005-ben még igen csekély volt a mennyiségük. Számuk 2012-ben 1000-re, míg 2014-ben 3000-re nőtt, 2016-ra pedig már meghaladta a 8000-et.
R-analitika és gépi tanulási kódtár

A legnagyobb R-alapú párhuzamos elemzési és gépi tanulási kódtár

Használja ki a legnagyobb párhuzamos elemzési és gépi tanulási kódtár előnyeit, amelyet úgy terveztünk meg, hogy együttműködjön a népszerű adatplatformok mindegyikére portolható nyílt forráskódú R nyelvvel. A kódtár többek között a következő funkciókat biztosítja: döntési fák és együttesek, regressziós modellek, fürtözés, adat-előkészítés, megjelenítés és statisztikai függvények.

Több terabájt adat használata az R Server for HDInsighttal

Terabájt nagyságrendű, 1000-szer több adatot kezelő gépi tanulás

A Hadoop és Spark rendszerekben futó, átlátható párhuzamos feldolgozásoknak köszönhetően az R Server for HDInsight több terabájt adat kezelésére alkalmas – ez 1000-szer több annál, mint amire a nyílt forráskódú R nyelv önmagában képes. Tanítson logisztikai regressziós modelleket, fákat és együtteseket bármekkora adatmennyiséggel. Korlátot kizárólag a Spark-fürt mérete jelent.

Gyors működés az R Server for HDInsight segítségével

Akár 50-szer nagyobb teljesítmény

A Spark, a többszálú vektor- és mátrixmatematikai kódtárak és az R Server for HDInsight kombinált használata 50-szer nagyobb teljesítményt biztosít, mint korábban a nyílt forráskódú R.

Nyílt forráskódú R függvény futtatása

Futtasson elosztott paraméterelemzést és szimulációkat meglévő R függvényekkel

A kódtár lehetővé teszi, hogy párhuzamos paraméterelemzés és szimulációk végzése céljából több száz csomóponton futtassa bármely nyílt forráskódú R függvényt. Megvizsgálhatja és finomíthatja modelljeit, így gyorsabban és könnyebben készíthet pontos előrejelzéseket.

Spark-adatforrások elérése a Spark SQL segítségével

A Hadoop- és Spark-adatok elemzése még könyebbé vált a Spark SQL R Server-adatforrásként való használaval. Ha az Apache Hive és a Parquet vagy egyéb források Spark SQL-lekérdezésének eredményeit betölti egy Spark-adatkeretbe, közvetlenül elemezheti az eredményeket az R Server bármely elosztott számítási algoritmusával.

Tetszőleges fejlesztőeszközök használata

Az R Server on HDInsight megoldás része az R Studio Server Community Edition, amely gyors használatbavételt biztosít az adatszakértők számára. Az ingyenesen letölthető, Visual Studióhoz készült R Tools a megfelelő helyi fejlesztőkörnyezet kialakítását segíti elő.

Nagyvállalati szintű biztonsági szolgáltatás az R Server for HDInsight védelmére

Nagyvállalati szintű biztonság és támogatás

Támaszkodjon az Azure nagyvállalati szintű biztonsági szolgáltatásaira és támogatására, úgy mint a különböző a verziócsomagokra, javításokra, biztonsági frissítésekre és a folyamatos fürtfigyelésre. A Microsoft szolgáltatói szerződése (SLA) pedig védelmet biztosít az R Server for HDInsight-fürtöknek a katasztrofális események ellen, és 99,9%-os rendelkezésre állást garantál.

Gyors beállítás előzetes költségek nélkül

Könnyű beállítás, gyors eredmények

Az R Server for HDInsight nem igényel hosszas telepítést vagy beállítást, mert az Azure mindezt elvégzi Ön helyett. Perceken belül megkezdheti a statisztikai és gépi tanulási modellek betanítását anélkül, hogy új hardvert kellene beszereznie, vagy bármi másra költenie kellene. Csak azért a számítási teljesítményért és tárhelyért számítunk fel díjat, amelyet ténylegesen használ.

Az Apache Hadoop® és a kapcsolódó nyílt forráskódú projektek nevei az Apache Software Foundation védjegyei.

Az R Server for HDInsight kipróbálása