
Apresentamos o roteamento de gradiente, um método para controlar onde o aprendizado ocorre em redes neurais. O roteamento de gradiente aplica máscaras para limitar o fluxo de gradientes durante a retropropagação. Ao fornecer máscaras diferentes para diferentes pontos de dados, o usuário pode induzir subcomponentes especializados dentro de um modelo. Acreditamos que o roteamento de gradiente tem o...