DeepSeek: La misteriosa nueva fuerza de IA de China
¿Has oído hablar de DeepSeek? 🌟 Este laboratorio de inteligencia artificial con sede en Hangzhou, provincia de Zhejiang, está causando sensación en Silicon Valley. Todo gracias a su modelo de vanguardia entrenado a una fracción del costo de gigantes como ChatGPT de OpenAI. 😲
Detrás de este avance está Liang Wenfeng, un exgerente de fondo de cobertura que está atrayendo todas las miradas. La semana pasada, DeepSeek presentó su modelo R1 junto con un documento detallado sobre cómo entrenar un modelo de aprendizaje por refuerzo a gran escala sin depender de la afinación supervisada como paso preliminar. ¡Boom! 💥
En pocos días, la aplicación de DeepSeek se disparó al primer lugar en las listas de aplicaciones gratuitas para iPhone tanto en China como en EE. UU., superando al antes dominante ChatGPT. 📱🔥
El lanzamiento del modelo R1 de DeepSeek ha encendido un acalorado debate en Silicon Valley sobre si las empresas de IA mejor financiadas de EE. UU. pueden mantener su ventaja tecnológica. Mientras tanto, Liang se ha convertido en un punto focal de discusión en China. Recientemente, fue invitado a un simposio en Pekín donde el primer ministro chino, Li Qiang, buscó opiniones de expertos y empresarios de varios sectores. 🎤
¿Quién es Liang Wenfeng?
Liang Wenfeng se graduó de la Universidad de Zhejiang con un título en Inteligencia Artificial. En 2016, cofundó el fondo de cobertura cuantitativo High-Flyer, reconocido por su uso innovador de estrategias comerciales impulsadas por IA. Para 2021, High-Flyer había integrado completamente la IA en sus operaciones, utilizando modelos de aprendizaje automático para predecir tendencias del mercado y tomar decisiones de inversión basadas en datos. 📈🤖
En mayo de 2023, Liang dio un paso audaz al fundar DeepSeek, con el objetivo de realizar investigaciones centradas en la inteligencia general artificial (AGI). A diferencia de los emprendimientos tradicionales con fines de lucro, DeepSeek se concibió como una plataforma para investigaciones fundamentales a largo plazo, donde la exploración impulsada por la curiosidad podría generar avances significativos en IA. 🚀
La filosofía de 'largo plazo' de DeepSeek
Para Liang, DeepSeek es más un proyecto secundario o un pasatiempo, impulsado por una profunda curiosidad y un compromiso con la investigación fundamental. Reconoce que la investigación básica a menudo genera bajos retornos inmediatos de inversión, pero está cautivado por el desafío de explorar campos complejos como las finanzas y el potencial de la AGI. Su enfoque está en comprender la esencia de la inteligencia humana y los procesos que la subyacen, creyendo que tal exploración es crucial a pesar de la falta de incentivos comerciales inmediatos. 💡
Liang ha mantenido un perfil bajo, otorgando entrevistas únicamente a Anyong, una submarca de los medios tecnológicos comerciales de China 36Kr, en 2023 y 2024. En estas entrevistas, ofrece un vistazo a su filosofía y visión. 📰
Reference(s):
Behind China's rising AI startup DeepSeek: Who is Liang Wenfeng?
cgtn.com