
#132- História dos LLMs.
Vida com IA
00:00
InstructGPT e RLHF para melhorar a conversação
Filipe pergunta como alinhar modelos e explica as três etapas: pré-treinamento, fine-tuning supervisionado e RLHF.
Transcript
Play full episode
Filipe pergunta como alinhar modelos e explica as três etapas: pré-treinamento, fine-tuning supervisionado e RLHF.