Nota del editor: En el mundo de la inteligencia artificial (IA), Liang Wenfeng y su creación, DeepSeek, están emergiendo como una \"fuerza misteriosa desde Oriente\". CGTN está produciendo una serie sobre IA para profundizar en el poder de la innovación y su impacto global. En este artículo, te llevamos detrás de bambalinas para explorar al hombre detrás de DeepSeek, su ideología y su viaje.
Un laboratorio de inteligencia artificial con sede en Hangzhou, en la provincia de Zhejiang al este de China, ha puesto a Silicon Valley en alerta con el lanzamiento de su modelo de última generación, entrenado a una fracción del costo de los modelos mainstream como el ChatGPT de OpenAI. Este avance ha generado críticas de muchos expertos en IA en línea, quienes lo describen como \"contraproducente\" para el intento de EE.UU. de frenar las ambiciones de alta tecnología de China.
DeepSeek, fundado por el gestor de fondos de cobertura Liang Wenfeng, reveló su modelo R1 el pasado lunes, acompañado de un documento detallado que describe cómo entrenar un modelo de aprendizaje por refuerzo (RL) a gran escala sin depender del ajuste fino supervisado (SFT) como paso preliminar.
En cuestión de días, la aplicación de DeepSeek escaló al primer lugar en las listas de aplicaciones gratuitas de iPhone tanto en China como en EE.UU., superando al otrora dominante ChatGPT.
El lanzamiento del modelo R1 de DeepSeek ha encendido un acalorado debate en Silicon Valley sobre si las empresas de IA mejor equipadas de EE.UU., incluyendo Meta y OpenAI, pueden mantener su ventaja tecnológica.
Mientras tanto, Liang se ha convertido en un punto focal de discusión en China. La semana pasada, fue invitado a un simposio en Beijing, donde el primer ministro chino Li Qiang buscó opiniones y sugerencias de expertos, empresarios y representantes de varios sectores —incluyendo educación, ciencia, cultura, salud y deportes— sobre un borrador del informe de trabajo del gobierno.
Sobre Liang Wenfeng
Liang Wenfeng se graduó de la Universidad de Zhejiang con un título en Inteligencia Artificial. Cofundó el fondo de cobertura cuantitativo High-Flyer en 2016, el cual rápidamente ganó reconocimiento por su uso innovador de estrategias comerciales impulsadas por IA. Para 2021, High-Flyer había integrado completamente la IA en sus operaciones, utilizando modelos de aprendizaje automático para predecir tendencias del mercado y tomar decisiones de inversión basadas en datos.
En mayo de 2023, Liang dio un paso audaz al fundar DeepSeek, enfocándose en la investigación de IA y en avanzar en el campo de la inteligencia artificial general (AGI). A diferencia de las empresas tradicionales con fines de lucro, DeepSeek fue concebida como una plataforma para la investigación fundamental a largo plazo, donde la exploración impulsada por la curiosidad podría impulsar avances significativos en IA.
Liang Wenfeng ha mantenido un perfil bajo, otorgando entrevistas solo a Anyong, una submarca de la media de tecnología comercial de China 36Kr, en 2023 y 2024. A continuación se presentan extractos traducidos de estas entrevistas, ofreciendo un vistazo a su filosofía y visión.
El 'long-termismo' de DeepSeek
Para Liang, DeepSeek es más como un proyecto paralelo o pasatiempo, impulsado por una profunda curiosidad y un compromiso con la investigación fundamental. Reconoce que la investigación básica a menudo produce bajos rendimientos inmediatos de inversión, sin embargo, está cautivado por el desafío de explorar campos complejos como las finanzas y el potencial de la inteligencia artificial general (AGI). El enfoque de Liang está en entender la esencia de la inteligencia humana y los procesos que la subyacen, creyendo que tal exploración es crucial a pesar de la falta de incentivos comerciales inmediatos.
🧠✨ La visión de Liang está cambiando el panorama de la IA, demostrando que la pasión y la curiosidad pueden llevar a avances que desafían a los gigantes tecnológicos establecidos.
Reference(s):
Behind China's rising AI startup DeepSeek: Who is Liang Wenfeng?
cgtn.com