El_R1_de_DeepSeek_se_convierte_en_el_primer_LLM_de_IA_importante_revisado_por_pares

El R1 de DeepSeek se convierte en el primer LLM de IA importante revisado por pares

Imagina una IA que pueda resolver complejos rompecabezas matemáticos y programar como un profesional, ¡todo esto sin el costo de Hollywood! R1 de DeepSeek, nacida en la China continental, acaba de hacer historia al convertirse en el primer LLM de IA importante en ser revisado por pares en Nature.

Diseñado para tareas con gran carga de razonamiento, R1 fue lanzado en enero como una alternativa económica a los modelos de renombre de los gigantes tecnológicos de EE. UU. Y es de peso abierto, lo que significa que cualquiera puede descargarlo gratis. ¡No es de extrañar que haya acumulado más de 10.9 millones de descargas en Hugging Face! 🤯

La reseña de Nature elogió el enfoque innovador de aprendizaje por refuerzo puro de DeepSeek. En lugar de estudiar ejemplos preseleccionados, R1 aprendió al recibir recompensas por respuestas correctas e incluso verificó su propio trabajo con un truco de optimización de políticas relativas en grupo.

Lo mejor de todo, DeepSeek compartió el costo de entrenamiento de R1: alrededor de $294,000—una suma modesta comparada con los millones que suelen gastarse. También invirtieron aproximadamente $6 millones para construir el modelo fundamental detrás de él.

"Este es un precedente muy bienvenido," dijo Lewis Tunstall, ingeniero de aprendizaje automático en Hugging Face. "Si no compartimos nuestro proceso, es difícil identificar posibles riesgos." Con R1, DeepSeek ha iniciado una revolución en el desarrollo transparente de IA. 🚀

Leave a Reply

Your email address will not be published. Required fields are marked *

Back To Top