3_parameter_efficient_finetuning

Dec 18, 2024

d624957 · Dec 18, 2024

This branch is 45 commits behind huggingface/smol-course:main.

Name	Name	Last commit message	Last commit date
parent directory ..
images	images	Finished translation - Module 3	Dec 18, 2024
notebooks	notebooks	Finished translation - Module 3	Dec 18, 2024
README.md	README.md	Finished translation - Module 3	Dec 18, 2024
lora_adapters.md	lora_adapters.md	Sending part of translation of module 3	Dec 18, 2024
prompt_tuning.md	prompt_tuning.md	Sending part of translation of module 3	Dec 18, 2024

README.md

Parameter-Efficient Fine-Tuning (PEFT) (Ajuste Fino com Eficiência de Parâmetro)

À medida que os modelos de linguagem aumentam, o ajuste fino tradicional torna-se cada vez mais desafiador. O ajuste fino completo de um modelo com 1,7 bilhão de parâmetros requer uma quantidade considerável de memória da GPU, torna caro o armazenamento de cópias separadas do modelo e apresenta o risco de um esquecimento catastrófico das capacidades originais do modelo. Os métodos de ajuste fino com eficiência de parâmetros (PEFT) abordam esses desafios modificando apenas um pequeno subconjunto de parâmetros do modelo e mantendo a maior parte do modelo congelada.

O ajuste fino tradicional atualiza todos os parâmetros do modelo durante o treinamento, o que se torna impraticável para modelos grandes. Os métodos PEFT introduzem abordagens para adaptar modelos usando menos parâmetros treináveis, geralmente menos de 1% do tamanho do modelo original. Essa redução drástica nos parâmetros treináveis permite:

Ajuste fino no hardware do consumidor com memória de GPU limitada
Armazenamento eficiente de várias adaptações de tarefas específicas
Melhor generalização em cenários com poucos dados
Ciclos de treinamento e iteração mais rápidos

Métodos Disponíveis

Neste módulo, abordaremos dois métodos populares de PEFT:

1️⃣ LoRA (Low-Rank Adaptation - Adaptação de Baixa Classificação)

O LoRA surgiu como o método PEFT mais amplamente adotado, oferecendo uma solução elegante para a adaptação eficiente do modelo. Em vez de modificar o modelo inteiro, o LoRA injeta matrizes treináveis nas camadas de atenção do modelo. Essa abordagem normalmente reduz os parâmetros treináveis em cerca de 90%, mantendo um desempenho comparável ao ajuste fino completo. Exploraremos o LoRA na seção LoRA (Adaptação de Baixa Classificação).

2️⃣ Ajuste de Prompts

O ajuste de prompts oferece uma abordagem ainda mais leve ao adicionar tokens treináveis à entrada em vez de modificar os pesos do modelo. O ajuste de prompt é menos popular que o LoRA, mas pode ser uma técnica útil para adaptar rapidamente um modelo a novas tarefas ou domínios. Exploraremos o ajuste de prompt na seção Ajuste de Prompt.

Cadernos de Exercícios

Título	Descrição	Exercício	Link	Colab
Ajuste fino do LoRA	Aprenda a fazer o ajuste fino de modelos usando adaptadores do LoRA	🐢 Treine um modelo usando o LoRA< br>🐕 Experimente com diferentes valores de classificação 🦁 Compare o desempenho com o ajuste fino completo	Exercício
Carregue adaptadores LoRA	Aprenda como carregar e usar adaptadores LoRA treinados	🐢 Carregar adaptadores pré-treinados< br>🐕 Mesclar adaptadores com o modelo de base 🦁 Alternar entre vários adaptadores	Exercício

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

3_parameter_efficient_finetuning

3_parameter_efficient_finetuning

README.md

Parameter-Efficient Fine-Tuning (PEFT) (Ajuste Fino com Eficiência de Parâmetro)

Métodos Disponíveis

1️⃣ LoRA (Low-Rank Adaptation - Adaptação de Baixa Classificação)

2️⃣ Ajuste de Prompts

Cadernos de Exercícios

Referências

Files

3_parameter_efficient_finetuning

Directory actions

More options

Directory actions

More options

Latest commit

History

3_parameter_efficient_finetuning

Folders and files

parent directory

README.md

Parameter-Efficient Fine-Tuning (PEFT) (Ajuste Fino com Eficiência de Parâmetro)

Métodos Disponíveis

1️⃣ LoRA (Low-Rank Adaptation - Adaptação de Baixa Classificação)

2️⃣ Ajuste de Prompts

Cadernos de Exercícios

Referências