Assimilator: En neural nätverksarkitektur för klassificerings- och regressionsuppgifter

I samband med maskininlärning är en assimilator en typ av neural nätverksarkitektur som är utformad för att utföra både klassificerings- och regressionsuppgifter. Termen "assimilator" myntades av forskare på Google som utvecklade den här arkitekturen som ett sätt att kombinera styrkorna hos traditionella klassificeringsmodeller (som logistisk regression) med förmågan hos djupa neurala nätverk. enda neurala nätverk för att utföra både klassificerings- och regressionsuppgifter, snarare än att använda separata modeller för varje uppgift. Detta gör att modellen kan lära sig en delad representation av data som kan användas för båda typerna av förutsägelser, vilket kan leda till förbättrad prestanda och effektivare träning.

Assimilatorarkitekturen består av två huvudkomponenter: en klassificeringsgren och en regressionsgren. Klassificeringsgrenen är vanligtvis ett fullt anslutet neuralt nätverk med ett softmax-utgångsskikt som producerar en sannolikhetsfördelning över de möjliga klasserna. Regressionsgrenen är också ett fullt anslutet neuralt nätverk, men den har inget utdatalager, så den kan användas för att förutsäga kontinuerliga värden som priset på en produkt.

Under träningen tränas assimilatorn från början till slut, med en kombination av klassificerings- och regressionsförlustfunktioner. Detta gör att modellen kan lära sig en delad representation av data som är användbar för båda uppgifterna, samtidigt som den kan specialisera sig på de specifika kraven för varje uppgift.

En fördel med assimilatorn är att den kan vara mer effektiv än att träna separata modeller för klassificering och regression, eftersom det bara kräver en enda uppsättning parametrar för att läras in. Dessutom kan den delade representationen som assimilatorn lärt sig vara användbar för andra uppgifter, såsom klustring eller avvikelsedetektering.