En el mundo acelerado de la inteligencia artificial, un nuevo jugador del Este está causando revuelo en todo el globo. Conozcan a Liang Wenfeng, el genio detrás de DeepSeek, una startup de IA que está llamando la atención tanto en China como en Silicon Valley.
Con sede en Hangzhou, provincia de Zhejiang, DeepSeek ha captado la atención de los entusiastas de la tecnología al lanzar su revolucionario modelo R1. Esta innovadora IA fue desarrollada a una fracción del costo de modelos convencionales como el ChatGPT de OpenAI, lo que ha desatado intensos debates entre los expertos en IA. Mientras algunos lo critican como un movimiento contra las ambiciones tecnológicas de Estados Unidos, otros lo ven como un testimonio del poder innovador de China.
Fundada por el gestor de fondos de cobertura Liang Wenfeng, DeepSeek presentó el modelo R1 el pasado lunes. Acompañado por un documento detallado, el modelo demuestra cómo entrenar modelos de aprendizaje por refuerzo (RL) a gran escala sin depender de ajustes supervisados (SFT). El lanzamiento no solo hizo titulares, sino que también impulsó la aplicación de DeepSeek al primer lugar en las listas de aplicaciones gratuitas de iPhone tanto en China como en Estados Unidos, superando incluso al otrora dominante ChatGPT.
Este logro ha encendido un intenso debate en Silicon Valley. ¿Podrán gigantes estadounidenses de la IA con amplios recursos, como Meta y OpenAI, mantener su ventaja tecnológica frente a innovaciones como estas?
Mientras tanto, Liang Wenfeng se ha convertido en una figura prominente en el panorama tecnológico de China. Recientemente, fue invitado a un simposio en Beijing, donde el premier chino Li Qiang buscó ideas de expertos, empresarios y representantes de varios sectores sobre un borrador del informe de trabajo del gobierno.
Sobre Liang Wenfeng
Liang Wenfeng se graduó de la Universidad de Zhejiang con un título en Inteligencia Artificial. En 2016, cofundó el fondo de cobertura cuantitativo High-Flyer, que rápidamente ganó reconocimiento por sus estrategias de trading impulsadas por IA. Para 2021, High-Flyer había integrado por completo la IA en sus operaciones, utilizando modelos de aprendizaje automático para predecir tendencias del mercado y tomar decisiones de inversión basadas en datos.
En mayo de 2023, Liang dio un paso audaz al fundar DeepSeek, con el propósito de avanzar en el campo de la inteligencia artificial general (AGI). A diferencia de las empresas tradicionales con fines de lucro, DeepSeek se creó como una plataforma para la investigación fundamental a largo plazo, impulsada por la curiosidad y el deseo de hacer avances significativos en IA.
A pesar de sus importantes logros, Liang se mantiene discreto, concediendo entrevistas únicamente a Anyong, una submarca de los medios tecnológicos comerciales de China 36Kr, en 2023 y 2024. A través de estas entrevistas, Liang comparte su filosofía y visión del 'long-termism' de DeepSeek.
La visión a largo plazo de DeepSeek
Liang describe DeepSeek como un proyecto apasionado impulsado por una profunda curiosidad y un compromiso con la investigación fundamental. Reconoce que la investigación básica a menudo genera bajos retornos inmediatos de inversión, pero lo motiva el desafío de explorar campos complejos como las finanzas y el potencial del AGI. Liang cree que comprender la esencia de la inteligencia humana y los procesos subyacentes es crucial, a pesar de la falta de incentivos comerciales inmediatos.
Reference(s):
Behind China's rising AI startup DeepSeek: Who is Liang Wenfeng?
cgtn.com