参数高效微调-Prefix Tuning、Adapter Tuning、LoRA
原创
回顾一下三种参数高效微调方法PrefixTuning、AdapterTuning、LoRAPrefixTuningPrefixTuning在prefixtuning之前的工作主要是人工设计离散的template或者自动化搜索离散template,问题在于最终的性能对人工设计的template的特别敏感:加一个词或者少一个词,或者变动位置,都会造成很大的变化,所以这种离散化的token的搜索出来的结果可能并不是最优的。PrefixTuning方法使用连续的virtualtokenembedding来代替离散的token,且与F...