Vad är konvolutionella neurala nätverk?

Publicerad den

Maj 3, 2023

Lästid:3 minuter, 26 sekunder

Det finns ett antal former av faltningsneurala nätverk, tillsammans med konventionella CNN, återkommande neurala nätverk, totalt faltningsnätverk och rumsliga transformatornätverk - bland annat.

Konventionella CNN

Konventionella CNN, ofta kända som "vanilj" CNN, omfattar en samling faltnings- och sammanslagna lager, antagna av ett antal helt relaterade lager. Som nämnts tidigare, utför varje faltningslager på denna gemenskap en samling faltningar med en uppsättning inlärbara filter för att extrahera alternativ från entrébilden.

Lenet-5-strukturen, en av många första effektiva CNN:er för handskriven sifferigenkänning, exemplifierar ett konventionellt CNN. Den har två enheter av faltning och poolande lager efter två helt relaterade lager. Effektiviteten hos CNN i bildigenkänning har bekräftats av Lenet-5-strukturen, som dessutom har gjort dem extra brett använda i pc-fantasifulla och förutseende uppgifter.

En arkitektur av modellen Lenet 5

Återkommande neurala nätverk

Återkommande neurala nätverk (RNN) är en sorts neurala nätverk som kan ske med sekventiell kunskap genom att övervaka sammanhanget för tidigare indata. Repetitiva neurala nätverk kan förlopp av ingångar av olika längder och producera utgångar beroende på de tidigare ingångarna, i motsats till typiska neurala nätverk för feedforward, som bara förloppet för in kunskap i en bestämd ordning.

Till exempel kan RNN:er användas i NLP-åtgärder som motsvarar textinnehållseran eller språköversättning. En återkommande neural gemenskap kommer att vara skicklig på par av meningar på två helt olika språk som ska läras att översätta mellan de två.

En arkitektur av ett återkommande neuralt nätverk

RNN bearbetar data efter varandra och producerar vid varje steg ett utdatadokument som förlitar sig på ingångsdokumentet och det tidigare utdatat. RNN kan producera rätt översättningar även för komplicerade texter som ett resultat av att det spårar tidigare in- och utdata.

Helt vikta nätverk

Totally Convolutional Networks (FCNs) är en sorts neurala gemenskapsstrukturer som vanligtvis används i pc fantasifulla och förutseende uppgifter som motsvarar bildsegmentering, objektdetektering och bildklassificering. FCN:er kommer ständigt att vara skickliga att använda backpropagation för att kategorisera eller sektionera foton.

Backpropagation är en coachningsalgoritm som beräknar gradienterna för förlusten som fungerar med hjälp av vikterna av ett neuralt samhälle. En maskin som studerar skyltdockans förmåga att förutsäga den förväntade effekten för en given ingång mäts genom en förlustoperation.

FCN:er baseras mestadels enbart på faltningsskikt eftersom de inte har helt relaterade skikt, vilket gör dem extra anpassningsbara och beräkningsmässigt miljövänliga än konventionella faltningsneurala nätverk. En gemenskap som accepterar en ingångsbild och matar ut placeringen och klassificeringen av objekt i hela bilden är en instans av ett FCN.

Rumslig transformatorgemenskap

En Spatial Transformer Community (STN) används i pc fantasifulla och förutseende uppgifter för att öka den rumsliga invariansen av alternativ som upptäckts från gemenskapen. Flexibiliteten hos ett neuralt samhälle att erkänna mönster eller objekt i en bild oavsett deras geografiska läge, orientering eller dimension kallas rumslig invarians.

En gemenskap som tillämpar en upptäckt rumslig transformation på en ingångsbild tidigare än ytterligare bearbetning är en instans av ett STN. Transformationen kan mycket väl användas för att rikta in objekt genom hela bilden, rätta perspektivförvrängningar eller göra olika rumsliga ändringar för att förbättra samhällets effektivitet på ett visst jobb.

En förändring avser varje operation som modifierar en bild indirekt, motsvarande B. rotera, skala eller beskära. Justering hänvisar tillbaka till sättet att garantera att objekt i en bild är centrerade, inriktade eller placerade i en konstant och signifikant strategi.

Perspektivförvrängning uppstår när objekt i en bild verkar skeva eller förvrängda på grund av vinkeln eller avståndet från vilken bilden togs. Genom att använda ett antal matematiska transformationer till bilden, motsvarande B. affina transformationer, kan man använda sig av rätt perspektivförvrängning. Affina transformationer skyddar parallella spår och avståndsförhållanden mellan faktorer till höger för perspektivförvrängningar eller olika rumsliga modifieringar i en bild.

Rumsliga ändringar kontrollerar med alla förändringar inom den rumsliga konstruktionen av en bild, motsvarande B. Vänd, rotera eller flytta bilden. Dessa modifieringar kan öka coachingkunskapen eller hantera särskilda utmaningar inom processen, motsvarande: B. ljussättning, distinktion eller bakgrundsvariationer.

Källlänk

Lycklig

0 %

Sad

0 %

Upphetsad

0 %

Sömnig

0 %

Arg

0 %

Överraskning

0 %

Azeez Mustafa

Azeez började sin FinTech-karriärväg 2008 efter att ha ökat intresset och intriger om marknadsguider och hur de lyckades segra på den finansiella världens slagfält. Efter ett decennium av lärande, läsning och träning av branschen är han nu en eftertraktad handelsproffs, teknisk / valutaanalytiker och fondförvaltare - samt författare.

Senast uppdaterad : Maj 3, 2023

Vad är konvolutionella neurala nätverk?

Konventionella CNN

Återkommande neurala nätverk

Helt vikta nätverk

Rumslig transformatorgemenskap

crypto News

Nya Inlägg