
Human Feedback for LLMs
Blog por Mateo Ortiz
Retroalimentación humana para Large Language Models (LLMs)
27-Junio-2024.
Acerca de
La entrada

En esta entrada comparto el trabajo escrito del proyecto final de la asignatura Matemáticas para el Aprendizaje de Máquina, en donde, en conjunto a un grupo de trabajo, se realizó una investigación sobre los fundamentos matemáticos en los métodos de ajuste para LLMs.
Debido a las especificaciones de la entrega en la asignatura, se hizo un abordaje muy resumido del tema, sin embargo, nos hubiera gustado haber podido presentar un trabajo más amplio y profundo como se hizo en la sustentación del trabajo. Es por esto que creemos que se puede seguir estudiando este paradigma que en los últimos años ha tenido un gran surgimiento teórico con una gran importancia en la práctica.
Licencia
Al igual que todo el repositorio, toda la información encontrada acá está protegida bajo la licencia (CC BY-SA 4.0)
