Det finns ett antal former av faltningsneurala nätverk, tillsammans med konventionella CNN, återkommande neurala nätverk, totalt faltningsnätverk och rumsliga transformatornätverk - bland annat.
Konventionella CNN
Konventionella CNN, ofta kända som "vanilj" CNN, omfattar en samling faltnings- och sammanslagna lager, antagna av ett antal helt relaterade lager. Som nämnts tidigare, utför varje faltningslager på denna gemenskap en samling faltningar med en uppsättning inlärbara filter för att extrahera alternativ från entrébilden.
Lenet-5-strukturen, en av många första effektiva CNN:er för handskriven sifferigenkänning, exemplifierar ett konventionellt CNN. Den har två enheter av faltning och poolande lager efter två helt relaterade lager. Effektiviteten hos CNN i bildigenkänning har bekräftats av Lenet-5-strukturen, som dessutom har gjort dem extra brett använda i pc-fantasifulla och förutseende uppgifter.
Återkommande neurala nätverk
Återkommande neurala nätverk (RNN) är en sorts neurala nätverk som kan ske med sekventiell kunskap genom att övervaka sammanhanget för tidigare indata. Repetitiva neurala nätverk kan förlopp av ingångar av olika längder och producera utgångar beroende på de tidigare ingångarna, i motsats till typiska neurala nätverk för feedforward, som bara förloppet för in kunskap i en bestämd ordning.
Till exempel kan RNN:er användas i NLP-åtgärder som motsvarar textinnehållseran eller språköversättning. En återkommande neural gemenskap kommer att vara skicklig på par av meningar på två helt olika språk som ska läras att översätta mellan de två.
RNN bearbetar data efter varandra och producerar vid varje steg ett utdatadokument som förlitar sig på ingångsdokumentet och det tidigare utdatat. RNN kan producera rätt översättningar även för komplicerade texter som ett resultat av att det spårar tidigare in- och utdata.
Helt vikta nätverk
Totally Convolutional Networks (FCNs) är en sorts neurala gemenskapsstrukturer som vanligtvis används i pc fantasifulla och förutseende uppgifter som motsvarar bildsegmentering, objektdetektering och bildklassificering. FCN:er kommer ständigt att vara skickliga att använda backpropagation för att kategorisera eller sektionera foton.
Backpropagation är en coachningsalgoritm som beräknar gradienterna för förlusten som fungerar med hjälp av vikterna av ett neuralt samhälle. En maskin som studerar skyltdockans förmåga att förutsäga den förväntade effekten för en given ingång mäts genom en förlustoperation.
FCN:er baseras mestadels enbart på faltningsskikt eftersom de inte har helt relaterade skikt, vilket gör dem extra anpassningsbara och beräkningsmässigt miljövänliga än konventionella faltningsneurala nätverk. En gemenskap som accepterar en ingångsbild och matar ut placeringen och klassificeringen av objekt i hela bilden är en instans av ett FCN.
Rumslig transformatorgemenskap
En Spatial Transformer Community (STN) används i pc fantasifulla och förutseende uppgifter för att öka den rumsliga invariansen av alternativ som upptäckts från gemenskapen. Flexibiliteten hos ett neuralt samhälle att erkänna mönster eller objekt i en bild oavsett deras geografiska läge, orientering eller dimension kallas rumslig invarians.
En gemenskap som tillämpar en upptäckt rumslig transformation på en ingångsbild tidigare än ytterligare bearbetning är en instans av ett STN. Transformationen kan mycket väl användas för att rikta in objekt genom hela bilden, rätta perspektivförvrängningar eller göra olika rumsliga ändringar för att förbättra samhällets effektivitet på ett visst jobb.
En förändring avser varje operation som modifierar en bild indirekt, motsvarande B. rotera, skala eller beskära. Justering hänvisar tillbaka till sättet att garantera att objekt i en bild är centrerade, inriktade eller placerade i en konstant och signifikant strategi.
Perspektivförvrängning uppstår när objekt i en bild verkar skeva eller förvrängda på grund av vinkeln eller avståndet från vilken bilden togs. Genom att använda ett antal matematiska transformationer till bilden, motsvarande B. affina transformationer, kan man använda sig av rätt perspektivförvrängning. Affina transformationer skyddar parallella spår och avståndsförhållanden mellan faktorer till höger för perspektivförvrängningar eller olika rumsliga modifieringar i en bild.
Rumsliga ändringar kontrollerar med alla förändringar inom den rumsliga konstruktionen av en bild, motsvarande B. Vänd, rotera eller flytta bilden. Dessa modifieringar kan öka coachingkunskapen eller hantera särskilda utmaningar inom processen, motsvarande: B. ljussättning, distinktion eller bakgrundsvariationer.