Detrás del ascenso de DeepSeek en China: ¿Quién es Liang Wenfeng?

Nota del editor: En el mundo de la inteligencia artificial (IA), Liang Wenfeng y su creación, DeepSeek, están emergiendo como una \"fuerza misteriosa del Este\". En este artículo, exploramos al hombre detrás de DeepSeek, su ideología y su trayectoria.

Un laboratorio de inteligencia artificial con sede en Hangzhou, en la provincia de Zhejiang al este de China, ha sacudido Silicon Valley con el lanzamiento de su modelo de última generación, entrenado a una fracción del costo de modelos convencionales como ChatGPT de OpenAI. Este avance ha generado críticas de muchos expertos en IA en línea, quienes lo describen como \"contraproducente\" para el intento de EE. UU. de frenar las ambiciones de alta tecnología de China.

DeepSeek, fundada por el gestor de fondos de cobertura Liang Wenfeng, presentó su modelo R1 el pasado lunes, acompañado de un detallado documento que describe cómo entrenar un modelo de aprendizaje por refuerzo (RL) a gran escala sin depender del ajuste fino supervisado (SFT) como paso preliminar.

En cuestión de días, la aplicación de DeepSeek ascendió al primer lugar en las listas de aplicaciones gratuitas para iPhone tanto en China como en EE. UU., superando al otrora dominante ChatGPT.

El lanzamiento del modelo R1 de DeepSeek ha encendido un acalorado debate en Silicon Valley sobre si las empresas de IA mejor financiadas de EE. UU., incluidas Meta y OpenAI, pueden mantener su ventaja tecnológica.

Mientras tanto, Liang se ha convertido en un punto focal de discusión en China. La semana pasada, fue invitado a un simposio en Beijing, donde el primer ministro chino Li Qiang buscó opiniones y sugerencias de expertos, empresarios y representantes de varios sectores—incluyendo educación, ciencia, cultura, salud y deportes—sobre un borrador del informe de trabajo del gobierno.

Sobre Liang Wenfeng

Liang Wenfeng se graduó de la Universidad de Zhejiang con un título en Inteligencia Artificial. Cofundó el fondo de cobertura cuantitativo High-Flyer en 2016, que rápidamente ganó reconocimiento por su uso innovador de estrategias de trading impulsadas por IA. Para 2021, High-Flyer había integrado completamente la IA en sus operaciones, utilizando modelos de aprendizaje automático para predecir tendencias del mercado y tomar decisiones de inversión basadas en datos.

En mayo de 2023, Liang dio un paso audaz al fundar DeepSeek, enfocándose en la investigación de IA para avanzar en el campo de la inteligencia artificial general (AGI). A diferencia de los proyectos tradicionales con fines de lucro, DeepSeek fue concebido como una plataforma para investigación fundamental a largo plazo, donde la exploración impulsada por la curiosidad podría impulsar avances significativos en IA.

Liang Wenfeng ha mantenido un perfil bajo, otorgando entrevistas solo a Anyong, una sub-marca de la media tecnológica comercial de China 36Kr, en 2023 y 2024. A continuación, se presentan extractos traducidos de estas entrevistas, ofreciendo una visión de su filosofía y visión.

El 'largo plazo' de DeepSeek

Para Liang, DeepSeek es más como un proyecto paralelo o hobby, impulsado por una profunda curiosidad y un compromiso con la investigación fundamental. Reconoce que la investigación básica a menudo genera bajos retornos inmediatos de inversión, pero está cautivado por el desafío de explorar campos complejos como las finanzas y el potencial de la inteligencia artificial general (AGI). El enfoque de Liang está en comprender la esencia de la inteligencia humana y los procesos que la sustentan, creyendo que tal exploración es crucial a pesar de la falta de incentivos comerciales inmediatos.

Leave a Reply

Your email address will not be published. Required fields are marked *

Back To Top