Hoppa över navigering

Vad är djupinlärning?

Djupinlärning är en typ av maskininlärning som använder artificiella neurala nätverk för att göra det möjligt för digitala system att lära sig och fatta beslut baserat på ostrukturerade, omärkta data.

I allmänhet tränar maskininlärning AI-system för att lära sig från förvärvade dataupplevelser, identifiera mönster, ge rekommendationer och anpassa sig. I synnerhet med djupinlärning gäller att digitala system, i stället för att bara svara på regeluppsättningar, bygger kunskap utifrån exempel och sedan använder den kunskapen för att reagera, agera och prestera likt människor.

Varför djupinlärning är viktigt

Dataforskare och utvecklare använder djupinlärningsprogram för att träna datorer att analysera stora och komplexa datamängder, utföra komplicerade och icke-linjära uppgifter samt reagera på text, röst eller bilder, ofta snabbare och mer exakt än människor. Dessa funktioner har många praktiska tillämpningar och har gjort möjliggjort många moderna innovationer. Djupinlärning är till exempel det som förarlösa bilar använder för att bearbeta bilder och skilja fotgängare från andra objekt på vägen, eller vad dina smarta hemenheter använder för att förstå dina röstkommandon.

Djupinlärning blir allt viktigare i takt med att datavolymerna ökar och databehandlingskapaciteten blir mer kraftfull och prisvärd. Företag inom detaljhandel, sjukvård, transport, tillverkning, teknik och andra sektorer investerar i djupinlärning för att driva innovation, frigöra möjligheter och hålla sig aktuella.

Så här fungerar djupinlärning

Djupinlärning använder arkitekturer för neurala nätverk i flera lager, högpresterande grafikprocessorer som distribueras i molnet eller i kluster samt stora volymer märkta data för att uppnå mycket hög precision för text-, tal- och bildigenkänning. All denna kraft kan hjälpa dina utvecklare att skapa digitala system med något som liknar mänsklig intelligens, och korta utvecklingstiden genom att minska modellens behov av träning från veckor till timmar.

En förarlös bil kan till exempel kräva tusentals videotimmar och miljontals bilder som träning. Utan djupinlärning kunde den här nivån av träning inte genomföras i stor skala.

Vad är ramverk för djupinlärning?

För att göra det enklare att implementera komplexa maskininlärningsmodeller använder utvecklare djupinlärningsramverk som TensorFlow eller PyTorch. Dessa ramverk hjälper till att effektivisera processen med att samla in data som sedan kan användas för att träna neurala nätverk. Dessutom kan acceleratorer som ONNX Runtime användas med dessa ramverk för att påskynda tränings- och inferensmodeller.

Träna modeller för djup kunskapsförmedling

Det finns olika strategier och metoder för att träna djupinlärningsmodeller. Låt oss ta en närmare titt på några av dem.

Övervakat lärande

Vid övervakat lärande tränas en algoritm med hjälp av märkta datauppsättningar. Det innebär att när algoritmen gör en bestämning om en del av informationen kan den använda etiketterna som använts för data för att kontrollera om detta är korrekt. Med övervakat lärande måste de data som modeller tränas på tillhandahållas av människor som märker data innan de används för att träna algoritmen.

Oövervakat lärande

Vid oövervakat lärande tränas algoritmer på data som inte innehåller etiketter eller information mot vilka algoritmen kan kontrollera sina bestämningar. I stället sorterar och klassificerar systemet data baserat på de mönster som det känner igen på egen hand.

Kunskapsförmedling

Med kunskapsförmedling löser ett system uppgifter med hjälp av försök och fel, för att fatta en serie beslut och uppnå ett avsett resultat även i en miljö som inte är lätt att förstå. Vid kunskapsförmedling använder algoritmen inte datauppsättningar för att fatta beslut, utan snarare information som den samlar in från en miljö.

Kunskapsförmedling

När tekniker för djupinlärning och kunskapsförmedling kombineras skapar de en typ av maskininlärning som kallas djup kunskapsförmedling. Djup kunskapsförmedling använder samma försök och fel-beslutsfattande och komplexa målresultat som kunskapsförmedling, men förlitar sig också på djupinlärningsfunktioner för att bearbeta och förstå stora mängder ostrukturerade data.

Till vad används djupinlärning?

Djupinlärning används av företag i olika branscher för en mängd olika användningsområden. Här följer några exempel på hur djupinlärning används:

Bild-, tal- och känsloigenkänning

Djupinlärningsprogram används för att öka noggrannheten för bild-, tal- och känsloigenkänning och för att möjliggöra fotosökningar, personliga digitala assistenter, förarlösa fordon, allmänhetens säkerhet, digital säkerhet och andra intelligenta tekniker.

Skräddarsydda upplevelser

Strömningstjänster, online-återförsäljare och andra företag använder djupinlärningsmodeller för att ge automatiserade rekommendationer för produkter, filmer, musik eller andra tjänster och för att skapa perfekta kundupplevelser baserat på inköpshistorik, tidigare beteende och andra data.

Chattrobotar

Smarta företag använder djupinlärning för att driva text- eller röstaktiverade online-chattrobotar för vanliga frågor, rutintransaktioner och inte minst för kundsupport. De ersätter team med tjänstagenter, och köer med väntande kunder, med automatiserade, sammanhangsberoende och användbara svar.

Personliga digitala assistenter

Röstaktiverade personliga digitala assistenter använder djupinlärning för att förstå tal, tolka och besvara frågor samt kommandon på naturligt språk, och till och med för att skämta.

Förarlösa fordon

De inofficiella representanterna för AI och djupinlärning, förarlösa bilar, använder djupinlärningsalgoritmer för att bearbeta flera dynamiska dataflöden på bråkdelar av en sekund, behöver aldrig fråga efter körriktningen och reagerar snabbare på det oväntade än en mänsklig förare.

Många företag använder maskininlärningsprogram med öppen källkod för att ge sina organisationer djupinlärningslösningar.

Mer information om maskininlärning med öppen källkod

Vad är neurala nätverk?

Ett artificiellt neuralt nätverk (ANN) är en digital arkitektur som efterliknar mänskliga kognitiva processer för att modellera komplexa mönster, ta fram förutsägelser och agera på lämpligt sätt på externa signaler. Strukturerade data krävs för många typer av maskininlärning, jämfört med neurala nätverk som kan tolka händelser i världen runt dem som data som kan bearbetas.

När du läser en rapport, tittar på film, kör bil eller luktar på en blomma bearbetas informationen av miljarder neuroner i din hjärna via små elektriska signaler. Varje neuron bearbetar indata och resultatet matas vidare till nästa neuron för ytterligare bearbetning, vilket i slutänden (och omedelbart) resulterar i en affärsinsikt, ett skratt, en fot på bromspedalen eller glädje. Inom maskininlärning gör neurala nätverk att digitala system på ett liknande sätt kan tolka och reagera på situationer.

Ett ANN är som en hjärna full av digitala neuroner, och även om de flesta ANN:er är enkla imitationer av sin förebild, kan de fortfarande bearbeta stora mängder icke-linjära data för att lösa komplexa problem som annars skulle kräva mänskligt ingripande. Bankanalytiker kan till exempel använda ett ANN för att bearbeta låneansökningar och förutsäga sannolikheten låntagaren sköter sitt åtagande.

Vad man kan göra med neurala nätverk

Inom maskininlärning används neurala nätverk för inlärning och modellering av komplexa, ej beständiga indata och utdata, för att dra slutsatser om dolda relationer och för att göra förutsägelser utan begränsningar för datadistribution. Modeller för neurala nätverk utgör grunden för många djupinlärningsprogram, till exempel datorseende och bearbetning av naturligt språk, vilket kan hjälpa till att stödja bedrägeriskydd, ansiktsigenkänning eller förarlösa fordon.

De flesta företag förlitar sig på prognoser för affärsbeslut, försäljningsstrategier, finansiella principer och resursutnyttjande. Begränsningarna i traditionella prognoser gör det dock ofta svårt att förutsäga komplexa, dynamiska processer med flera och ofta dolda underliggande faktorer, till exempel aktiekurser. Modeller för neurala nätverk för djupinlärning hjälper till att exponera komplexa icke-linjära relationer och dolda faktorer, så att företag kan ta fram korrekta prognoser för de flesta affärsaktiviteter.

Vanliga neurala nätverk

Det finns dussintals olika typer av neurala AI-nätverk, lämpliga för olika typer av djupinlärningsprogram. Använd ett ANN som är lämplig för dina affärs- och teknikkrav. Här följer några exempel på vanliga neurala AI-nätverk:

CNN (Convolutional Neural Network – faltningsnätverk)

Utvecklare använder CNN för att hjälpa AI-system att konvertera bilder till digitala matriser. CNN-nätverk används främst för bildklassificering och objektigenkänning och är lämpliga för ansiktsigenkänning, ämnesidentifiering och attitydanalyser.

DNN (Deconvolutional Neural Network – omvänt faltningsnätverk)

Om komplexa eller stora nätverkssignaler försvinner eller konvergeras med andra signaler kan ett DNN hjälpa dig att hitta dem. DNN är användbara för bearbetning av högupplösta bilder och optiska flödesuppskattningar.

GAN (Generative Adversarial Network)

Tekniker använder ett GAN för att träna modeller att generera ny information eller nytt material som efterliknar de specifika egenskaperna för använda data. GAN hjälper modellerna att skilja mellan små skillnader mellan original och kopior för att göra mer verklighetstrogna kopior. GAN-program inkluderar bild- och videogenerering med hög återgivning, avancerad ansiktsigenkänning och superupplösning.

RNN (Recurrent Neural Network)

Ett RNN matar in data till dolda lager med specifika tidsfördröjningar. Nätverksberäkning står för historisk information i aktuella tillstånd, och ytterligare indata ändrar inte modellstorleken. RNN är ett bra alternativ för taligenkänning, avancerade förutsägelser, robotteknik och andra komplexa arbetsbelastningar för djupinlärning.

Omvandlare

Omvandlare är utformade för att hantera sekventiella indata. De är dock inte begränsade till att bearbeta dessa data i sekventiell ordning. I stället använder omvandlare attention (uppmärksamhet) – en teknik som gör att modeller kan tilldela olika nivåer av inverkan till olika delar av indata, och identifiera kontexten för enskilda datadelar i en indatasekvens. Detta möjliggör en högre parallelliseringsnivå, vilket kan minska tiden det tar att träna modellen.

Maskininlärning jämfört med neurala nätverk

Även om neurala nätverk betraktas som en delmängd av maskininlärning finns det några betydande skillnader mellan neurala nätverk och vanliga maskininlärningsmodeller.

Neurala nätverk är vanligtvis mer komplexa och kan i högre grad än vanliga maskininlärningsmodeller fungera oberoende. Ett neuralt nätverk kan till exempel på egen hand avgöra om dess förutsägelser och resultat är korrekta, medan en maskininlärningsmodell skulle kräva indata från en mänsklig tekniker för att dra den slutsatsen.

Dessutom är neurala nätverk strukturerade så att det neurala nätverket kan fortsätta att lära sig och fatta intelligenta beslut på egen hand. Maskininlärningsmodeller är begränsade till beslutsfattande baserat på vad de specifikt har tränats på.

Komma igång med djupinlärning i Azure

Stöd bildigenkänning med hjälp av neurala nätverk eller optimera bearbetning av naturligt språk med snabba, enkla och exakta NLP-modeller i BERT. Utforska hur du skapar, tränar och distribuerar alla typer av djupinlärningsmodeller med Azure Machine Learning.

Utforska maskininlärning för dataforskare

Lär dig skapa maskininlärningslösningar i molnet med Azure och utforska maskininlärningsverktyg för dataforskare och maskininlärningstekniker.

Kan vi hjälpa dig?