s444465/projekt-glebokie

s444501 7ce408fb11 FLAN-T5

2023-02-12 23:22:40 +01:00

424 B

Raw Blame History

Transformer Encoder - RoBERTa

Modyfikacje

Głowa klasyfikacyjna używająca LeakyReLU

Transformer Decoder - GPT-2

Modyfikacje

Zamrożenie pierwszych 40 warstw
Zmiana głowy klasyfikacyjnej poprzez dodanie po 2 warstwy dropout i relu()

Transformer Encoder-Decoder - T5

Modyfikacje

Zamrożenie pierwszych 20 warstw

Transformer w trybie few-shot/zero-shot learning - FLAN-T5

Brak modyfikacji