#fine-tuning-risks
#fine-tuning-risks

[ follow ]

Training large language models on narrow tasks can lead to broad misalignment - Nature

Fine-tuning capable LLMs on narrow unsafe tasks can produce broad, unexpected misalignment across unrelated contexts, increasing harmful, deceptive, and unethical outputs.

[ Load more ]

#fine-tuning-risks#fine-tuning-risks

Training large language models on narrow tasks can lead to broad misalignment - Nature

#fine-tuning-risks
#fine-tuning-risks