Leer gans versterking?

Leer gans versterking?
Leer gans versterking?
Anonim

Alhoewel dit oorspronklik voorgestel is as 'n vorm van generatiewe model vir leer sonder toesig, het GAN'e ook nuttig bewys vir semi-toesig leer, volledig onder toesig leer, en versterking leer.

Wat is 'n voorbeeld van versterkingsleer?

Die voorbeeld van versterkingsleer is jou kat is 'n agent wat aan die omgewing blootgestel word. Die grootste kenmerk van hierdie metode is dat daar geen toesighouer is nie, slegs 'n reële getal of beloningsein. Twee tipes versterkingsleer is 1) Positief 2) Negatief.

Watter tipe leer is versterkingsleer?

Versterkingsleer is 'n masjienleer-opleidingsmetode gebaseer op die beloning van gewenste gedrag en/of om ongewenstes te straf. Oor die algemeen is 'n versterkende leeragent in staat om sy omgewing waar te neem en te interpreteer, aksies te neem en te leer deur beproewing en fout.

Word versterkingsleer in speletjies gebruik?

Versterkingsleer word baie gebruik in die veld van masjienleer en kan gesien word in metodes soos Q-leer, beleidsoektogte, Deep Q-netwerke en ander. Dit het sterk prestasie behaal in beide die veld van speletjies en robotika.

Is GAN diep leer?

Generative Adversarial Networks, of GAN's, is 'n diep-leer-gebaseerde generatiewe model. Meer algemeen is GAN's 'n modelargitektuur vir die opleiding van 'n generatiewe model, en dit is die algemeenste om diepleermodelle te gebruik inhierdie argitektuur.

Aanbeveel: