La disrupción de DeepSeek: El impacto en Nvidia y la industria de semiconductores
28 enero 2025
Tiempo de Lectura 5 MIN
Tenga en cuenta que VanEck puede tener posiciones en las empresas a las que se hace referencia en este documento.
La reciente afirmación de DeepSeek de obtener resultados de gama alta por una fracción de los costos habituales ha inquietado a los inversores y ha planteado dudas sobre el dominio de Nvidia. Sin embargo, es importante ver más allá de los detalles: los hiperescaladores y las empresas podrían ahora centrarse en aprovechar la infraestructura de IA existente para la inferencia, donde Nvidia sigue teniendo ventajas significativas con su ecosistema de software y sus productos de próxima generación. Mientras tanto, el mercado general de semiconductores está listo para la diversificación, con ASIC especializados y otros fabricantes de chips preparados para captar la demanda. Por lo tanto, la estrategia más prudente sigue siendo invertir de forma equilibrada en el sector de los semiconductores.
- La afirmación revolucionaria: Modelo R1 de DeepSeek
- La enorme CapEx de los hiperescaladores en entrenamiento de IA
- Entrenamiento frente a inferencia en el sector de semiconductores
- La disrupción de DeepSeek: Preocupaciones para Nvidia y otros fabricantes de chips
- Dos formas de interpretar la historia de DeepSeek (y los argumentos a favor de la diversificación)
- La fortaleza de Nvidia y el paso a la inferencia
- Por qué favorecemos un enfoque diversificado
La afirmación revolucionaria: Modelo R1 de DeepSeek
- Se supone que el R1 de DeepSeek ofrece un rendimiento de razonamiento casi de vanguardia a una fracción del costo.
- En comparación con OpenAI y otros laboratorios líderes en IA, DeepSeek afirma que utilizaron chips de calidad inferior y, aun así, lograron resultados impresionantes con un costo de entrenamiento significativamente inferior.
- Esto suscita una pregunta clave en la industria: Si es posible entrenar nuevos modelos a un costo tan reducido, ¿los hiperescaladores aún necesitan inversiones masivas en GPU para alcanzar el máximo rendimiento?
La enorme CapEx de los hiperescaladores en entrenamiento de IA
- En los últimos dos años, los principales proveedores de la nube (AWS, Azure, Google Cloud, etc.) han invertido miles de millones en centros de datos equipados con GPU Nvidia para manejar el entrenamiento de IA a escala.
- La pregunta abierta ha sido cómo planean estos hiperescaladores monetizar esa infraestructura.
- Los investigadores de IA sugieren ahora que el aumento del rendimiento de los cada vez mayores modelos puede ser cada vez menor. De este modo, el mercado dejaría de invertir en clústeres más grandes para centrarse en la monetización de los modelos existentes.
- La dinámica de poder de las GPU ha empezado a cambiar: la propiedad del mercado por parte de Nvidia se ha desplazado hacia el aumento del poder adquisitivo de los hiperescaladores.
Nota: Cada hiperescalador tiene diferentes vías de monetización (suscripciones a la nube, aplicaciones de consumo, servicios empresariales, etc.), lo que reduce la probabilidad de que el código abierto los desplace por sí solo.
Entrenamiento frente a inferencia en el sector de semiconductores
- La industria evoluciona de un enfoque dominado por la formación a la fase de inferencia, donde se producen las aplicaciones en el mundo real y la monetización.
- Tesla es un ejemplo perfecto:
- Entrenan sus modelos de conducción autónoma completa (FSD) en grandes centros de datos.
- La inferencia se realiza en cada vehículo (edge computing), que ejecuta el modelo localmente sin necesidad de realizar constantes viajes de ida y vuelta a la nube.
- Esta inferencia en el borde se monetiza mediante cuotas de suscripción (por ejemplo, 99 dólares al mes para FSD).
La disrupción de DeepSeek: Preocupaciones para Nvidia y otros fabricantes de chips
- El anuncio de DeepSeek -entrenar un modelo de alto rendimiento en un hardware más barato- provocó el nerviosismo del mercado sobre la futura demanda de GPU.
- Las suposiciones previas en torno a las leyes de escala podrían refutarse con este modelo. R1 hizo más con menos recursos computacionales.
- La preocupación: si los hiperescaladores logran resultados de vanguardia con hardware alternativo o menos costoso, el crecimiento de Nvidia en GPU, en concreto para centros de datos, podría ralentizarse. Este sentimiento contribuyó a las recientes caídas de los precios de las acciones de todos los fabricantes de chips de IA.
Dos formas de interpretar la historia de DeepSeek (y los argumentos a favor de la diversificación)
A pesar de los titulares negativos, dos perspectivas principales apuntan a la conveniencia de diversificar las inversiones en semiconductores, por ejemplo, a través de un EFT como el VanEck Semiconductor ETF (SMH).
Si las afirmaciones de DeepSeek son totalmente ciertas…
- La R1 de DeepSeek demuestra que se pueden entrenar modelos de primer nivel con hardware más barato.
- Esto no elimina a Nvidia, pero acelera una línea temporal en la que se normaliza el dominio casi total de Nvidia en el entrenamiento de la IA.
- A medida que se amplía la demanda de hardware de entrenamiento, otros diseñadores de chips (por ejemplo, los fabricantes de ASIC, Broadcom, Intel, AMD, startups especializadas) pueden ganar terreno, especialmente en la inferencia, donde los chips construidos específicamente son eficientes en costes y energía.
- Elemento clave: Incluso si la demanda de entrenamiento de GPU se estabiliza, aún hay una oportunidad significativa en todo el variado ecosistema de semiconductores (es decir, sin fábricas).
Si las afirmaciones de DeepSeek son exageradas…
- Tal vez el logro de DeepSeek no sea tan innovador como parece, o existan limitaciones no reveladas.
- Aun así, el ciclo de la IA a largo plazo se desplaza de forma natural hacia la monetización de los modelos a través de la inferencia.
- Esa fase de inferencia suele favorecer a los ASIC especializados, las instancias de GPU más pequeñas y otros aceleradores (incluidas las mejoras de la CPU), lo que amplía la competencia con las GPU de gama alta de Nvidia.
- Elemento clave: Puede que Nvidia siga liderando el entrenamiento, pero, a medida que la IA se desarrolle, más empresas competirán por diferentes partes de la pila de hardware de IA. Sigue siendo prudente una estrategia diversificada para los semiconductores.
Las continuas fortalezas de Nvidia y el paso a la inferencia
- Nvidia se mantiene como una de las empresas líderes en innovación de hardware y software de IA.
- Han anunciado nuevos productos diseñados para cargas de trabajo de inferencia, como arquitecturas de GPU de nueva generación (por ejemplo, Hopper) y plataformas especializadas que unen el entrenamiento y la inferencia.
- A medida que se produzca la transición en el mercado, es probable que el negocio de GPU para centros de datos de Nvidia experimente un crecimiento más normalizado, pero su ecosistema integral (hardware, software CUDA, asociaciones empresariales) sigue posicionándola como una empresa clave.
- Al mismo tiempo, otros fabricantes de chips aumentan su producción y aparece una selección más amplia de ASIC y CPU, lo que permite una gran variedad de soluciones de inferencia rentables.
Por qué favorecemos un enfoque diversificado
- Entrenamiento frente a inferencia: El enfoque del sector está pasando del entrenamiento masivo (donde Nvidia dominaba) a la inferencia (donde más empresas tendrán ofertas competitivas).
- Monetización: La IA se está adentrando en implementaciones y suscripciones en el mundo real (por ejemplo, el FSD de Tesla), lo que destaca la importancia de un hardware y unas redes de inferencia eficientes.
- El papel de Nvidia: Nvidia sigue bien posicionada al disponer de GPU y soluciones de software líderes, además de nuevos productos orientados a la inferencia. Sin embargo, los días de demanda ilimitada de GPU para centros de datos pueden estar dando paso a un mercado más equilibrado y con múltiples proveedores.
- Estrategia de inversión: En este entorno, la diversificación en el sector de los semiconductores (por ejemplo, a través de ETF como SMH y SMHX) puede servir de cobertura frente a posibles cambios en el liderazgo del mercado, desde las GPU de Nvidia a los ASIC especializados, los diseñadores sin fábrica y otros innovadores del hardware.
En última instancia, el panorama del hardware de IA sigue siendo dinámico. Aunque Nvidia está preparada para permanecer como una fuerza importante, la historia de Deepseek, y el cambio más amplio hacia la inferencia, subraya el valor de una amplia exposición a toda la cadena de valor de los semiconductores.
Related Insights
Related Insights
24 diciembre 2024
09 octubre 2024
24 septiembre 2024