Přeskočit navigaci

Co je hluboké učení?

Hluboké učení je typ strojového učení, který využívá umělé neurální sítě k tomu, aby se digitální systémy mohly učit a rozhodovat na základě nestrukturovaných a neoznačených dat.

Obecně lze říci, že strojové učení trénuje systémy umělé inteligence tak, aby se učily na základě získaných zkušeností s daty, rozpoznávaly vzory, vydávaly doporučení a přizpůsobovaly se. Zejména v případě hlubokého učení digitální systémy namísto pouhého reagování na soubory pravidel budují znalosti na základě příkladů a poté je využívají k tomu, aby reagovaly, chovaly se a fungovaly jako lidé.

Proč je hluboké učení důležité

Odborníci na data a vývojáři využívají software pro hluboké učení, aby naučili počítače analyzovat velké a komplexní datové sady, plnit složité a nelineární úlohy a reagovat na text, hlas nebo obraz, často rychleji a přesněji než lidé. Tyto možnosti nabízejí mnoho praktických aplikací a umožnily vznik řady moderních inovací. Hluboké učení používají například autonomní vozidla ke zpracování obrazu a rozlišování chodců od ostatních objektů na silnici nebo chytrá domácí zařízení k tomu, aby porozuměla vašim hlasovým příkazům.

Hluboké učení je důležité, protože s rostoucím objemem dat a zvyšující se výkonností a cenovou dostupností výpočetní kapacity do hlubokého učení investují společnosti v maloobchodě, zdravotnictví, dopravě, výrobě, technologiích a dalších odvětvích, aby podpořily inovace, využily nové příležitosti a udržely si možnosti uplatnění na trhu.

Jak funguje hluboké učení

Hluboké učení funguje tak, že využívá architektury neurálních sítí ve více vrstvách, vysoce výkonné grafické procesory nasazené v cloudu nebo v clusterech a velké objemy označených dat, které umožňují dosáhnout velmi vysoké úrovně přesnosti rozpoznávání textu, řeči a obrazu. Veškerý tento výkon může vašim vývojářům pomoci vytvářet digitální systémy s něčím, co se podobá lidské inteligenci, a zkrátit dobu realizace zrychlením trénování modelů z týdnů na hodiny.

Například model autonomního vozidla může k natrénování potřebovat tisíce hodin videa a miliony snímků. Bez hlubokého učení by nebylo možné provádět takovou úroveň trénování ve velkém.

Co je architektura hlubokého učení?

V rámci usnadnění implementace složitých modelů strojového učení se vývojáři obracejí architektury hlubokého učení, jako je TensorFlow nebo PyTorch. Tyto rámce pomáhají zefektivnit proces shromažďování dat, která lze následně použít k trénování neurálních sítí. Kromě toho lze s těmito architekturami využívat akcelerátory, jako je modul runtime ONNX, které urychlují trénování a odvozování modelů.

Trénování modelů hlubokého učení

Pro trénování modelů hlubokého učení existují různé strategie a metody. Podívejme se blíže na několik z nich.

Učení pod dohledem

Při použití učení s učitelem se algoritmus trénuje na datových sadách, které jsou označené. To znamená, že když algoritmus provede určení ohledně určité informace, může použít jmenovky, které jsou součástí dat, aby ověřil, jestli je toto určení správné. Při použití učení s učitelem musí data, na kterých se modely trénují, poskytnout lidé, kteří je před použitím k trénování algoritmu označí.

Učení bez dohledu

Při použití učení bez učitele se algoritmy trénují na datech, která neobsahují štítky ani informace, které by algoritmus mohl použít ke kontrole svých určení. Místo toho systém třídí a klasifikuje data na základě vzorů, které sám rozpozná.

Zpětnovazební učení

Při použití zpětnovazebního učení systém řeší úlohy metodou pokusu a omylu, aby postupně učinil řadu rozhodnutí a dosáhl zamýšleného výsledku i v prostředí, které není přímočaré. Při použití zpětnovazebního učení algoritmus k určování nepoužívá datové sady, ale informace, které získává z prostředí.

Hluboké zpětnovazební učení

Když se spojí techniky hlubokého a zpětnovazebního učení, vznikne typ strojového učení označovaný jako hluboké zpětnovazební učení. Hluboké zpětnovazební učení využívá stejné rozhodování metodou pokus-omyl a komplexní dosahování cílů jako zpětnovazební učení, ale ke zpracování a pochopení velkých objemů nestrukturovaných dat se spoléhá také na schopnosti hlubokého učení.

K čemu se hluboké učení využívá?

Hluboké učení se využívá ve firmách v celé řadě odvětví pro širokou škálu případů použití. Tady je několik příkladů běžného použití hlubokého učení:

Rozpoznávání obrazu, řeči a emocí

Software pro hluboké učení se využívá ke zvýšení přesnosti rozpoznávání obrazu, řeči a emocí a k podpoře vyhledávání fotografií, osobních digitálních asistentů, autonomních vozidel, veřejného pořádku, digitálního zabezpečení a dalších inteligentních technologií.

Přizpůsobená prostředí

Streamovací služby, e-shopy a další firmy používají modely hlubokého učení k automatizovanému doporučování produktů, filmů, hudby nebo jiných služeb a ke zdokonalování zákaznických prostředí na základě historie nákupů, dřívějšího chování a dalších dat.

Chatboti

Prozíravé firmy využívají hluboké učení k podpoře textových nebo hlasových online chatbotů pro často kladené dotazy, běžné transakce a zejména pro zákaznickou podporu. Nahrazují týmy zákaznických služeb a fronty čekajících zákazníků automatizovanými, kontextově vhodnými a užitečnými odpověďmi.

Osobní digitální asistenti

Osobní digitální asistenti s hlasovou aktivací využívají hluboké učení k tomu, aby rozuměli řeči, vhodně reagovali na dotazy a příkazy v přirozeném jazyce a dokonce i občas zažertovali.

Autonomní vozidla

Autonomní vozidla, která jsou neoficiálním představitelem umělé inteligence a hlubokého učení, využívají algoritmy hlubokého učení ke zpracování mnoha dynamických datových kanálů ve zlomcích sekund, nikdy se nemusí ptát na cestu a reagují na neočekávané situace rychleji než lidský řidič.

Řada firem využívá opensourcový software pro strojové učení k tomu, aby do svých organizací zavedla řešení hlubokého učení.

Další informace o opensourcovém strojovém učení

Co jsou neurální sítě?

Umělá neurální síť (ANN) je digitální architektura, která napodobuje lidské kognitivní procesy a umožňuje modelovat složité vzory, vytvářet predikce a vhodně reagovat na vnější podněty. Pro mnoho typů strojového učení jsou zapotřebí strukturovaná data, na rozdíl od neurálních sítí, které jsou schopné interpretovat události v okolním světě jako data s možností zpracování.

Kdykoli čtete zprávu, sledujete film, řídíte auto nebo cítíte vůni květiny, miliardy neuronů ve vašem mozku zpracovávají informace prostřednictvím nepatrných elektrických signálů. Každý neuron zpracovává vstupy a tyto výsledky slouží jako vstup pro další neurony, které je následně zpracovávají. Okamžitým a konečným výsledkem potom je obchodní poznatek, pousmání, šlápnutí na brzdu nebo trocha radosti. Neurální sítě ve strojovém učení umožňují digitálním systémům interpretovat situace a reagovat na ně podobným způsobem.

Síť ANN je jako mozek plný digitálních neuronů. Přestože většina sítí ANN je jenom základní napodobeninou skutečného mozku, dokáže zpracovávat velké objemy nelineárních dat a řešit složité problémy, které by jinak vyžadovaly zásah člověka. Například bankovní analytici mohou pomocí ANN zpracovávat žádosti o úvěr a predikovat pravděpodobnost nesplácení úvěru.

K čemu se dají neurální sítě využít

Ve strojovém učení se neurální sítě používají k učení a modelování složitých proměnlivých vstupů a výstupů, k odvozování neznámých vztahů a k předpovědím bez omezení distribuce dat. Modely neurálních sítí jsou základem mnoha aplikací hlubokého učení, jako je počítačové zpracování obrazu a zpracování přirozeného jazyka, které pomáhají podpořit ochranu před podvody, rozpoznávání obličejů nebo autonomní vozidla.

Většina podniků se spoléhá na prognózy, které slouží jako podklad pro obchodní rozhodnutí, prodejní strategie, finanční politiku a využívání zdrojů. Omezení tradičního prognózování ale často ztěžují predikci složitých, dynamických procesů s mnoha a často skrytými základními faktory, jako jsou například ceny na burze. Modely neurálních sítí s hlubokým učením pomáhají odhalovat složité nelineární vztahy a modelovat neznámé faktory, takže podniky mohou vytvářet přesné predikce pro většinu obchodních činností.

Obecné neurální síť

Existují desítky různých typů neurálních sítí AI a každá je vhodná pro jiné aplikace s hlubokým učením. Použijte síť ANN, která je vhodná pro vaše obchodní a technologické požadavky. Tady je několik příkladů běžných neurálních sítí AI:

Konvoluční neurální sítě (CNN)

Vývojáři využívají sítě CNN, aby pomohli systémům AI převést obraz na digitální matice. Sítě CNN se používají především pro klasifikaci obrázků a rozpoznávání objektů, ale jsou vhodné i pro rozpoznávání obličejů, detekci témat a analýzu zabarvení.

Dekonvoluční (hluboké) neurální sítě (DNN)

Pokud se složité nebo velkoobjemové síťové signály ztratí nebo se zapletou s jinými signály, DNN je pomůže najít. Sítě DNN jsou užitečné pro zpracování obrazu s vysokým rozlišením a odhadů optického toku.

Generativní kontradiktorní sítě (GAN)

Technici používají sítě GAN k trénování, jak mají modely generovat nové informace nebo materiály, které napodobují konkrétní vlastnosti trénovacích dat. Sítě GAN pomáhají modelům rozlišovat drobné rozdíly mezi originály a kopiemi, aby bylo možné vytvořit autentičtější kopie. Použití sítí GAN zahrnuje generování vysoce věrných obrázků a videí, pokročilé rozpoznávání tváří a velmi vysoké rozlišení.

Rekurentní neurální sítě (RNN)

Sítě RNN předávají data do skrytých vrstev s určitými časovými prodlevami. Síťové výpočty pracují s historickými informacemi v aktuálních stavech a vyšší vstupy nemění velikost modelu. Sítě RNN jsou dobrou volbou pro rozpoznávání řeči, pokročilé prognózování, robotiku a další složité úlohy hlubokého učení.

Transformátory

Transformátory jsou určené pro zpracování sekvenčních vstupních dat. Neomezují se ale jenom na zpracování těchto dat v sekvenčním pořadí. Místo toho transformátory využívají pozornost – techniku, která modelům umožňuje přiřadit různým částem vstupních dat různé úrovně vlivu a identifikovat kontext jednotlivých částí dat ve vstupní sekvenci. To umožňuje zvýšenou míru paralelizace, která může zkrátit dobu trénování modelu.

Strojové učení vs. neurální sítě

Přestože jsou neurální sítě považované za podmnožinu strojového učení, existují mezi nimi a běžnými modely strojového učení některé významné rozdíly.

Za prvé, neurální sítě jsou obecně složitější a schopné pracovat nezávisleji než běžné modely strojového učení. Neurální síť je například schopna sama určit, zda jsou její predikce a výsledky přesné, zatímco model strojového učení by k tomuto určení potřeboval lidskou zpětnou vazbu.

Neurální sítě jsou navíc strukturované tak, aby se mohly samy dál učit a inteligentně se rozhodovat. Modely strojového učení jsou naproti tomu omezené na rozhodování jenom na základě toho, na čem byly speciálně natrénované.

Začínáme s hlubokým učením v Azure

Využijte možnost podpořit rozpoznávání obrazu pomocí neurálních sítí nebo optimalizovat zpracování přirozeného jazyka pomocí rychlých, snadných a přesných modelů BERT NLP. Prozkoumejte, jak vytvářet, trénovat a nasazovat všechny typy modelů hlubokého učení s využitím Azure Machine Learningu.

Strojové učení pro odborníky na data

Projděte si nástroje pro strojové učení pro odborníky na data a techniky strojového učení a naučte se vytvářet cloudová řešení strojového učení v Azure.