DeepSeek presenta nuevo modelo de IA para competir con rivales como Google y Anthropic

DeepSeek lanzó versiones preliminares de un nuevo modelo insignia de inteligencia artificial un año después de sacudir Silicon Valley, calificándolo como la plataforma de código abierto más poderosa en un desafío a rivales desde OpenAI hasta Anthropic PBC.

La startup china presentó las series V4 Flash y V4 Pro, destacando un rendimiento de primer nivel en pruebas de programación y grandes avances en tareas de razonamiento y agentes. Incluyen mejoras en la arquitectura y optimización, según indicó la empresa en la plataforma Hugging Face. DeepSeek destacó una técnica denominada Hybrid Attention Architecture, que, según afirmó, mejora la capacidad de una plataforma de IA para recordar consultas a lo largo de conversaciones extensas. También impulsó una ventana de contexto de 1 millón de tokens, un salto que permite enviar bases de código completas o documentos largos como una sola instrucción.

El V4 llega más de un año después de que la startup con sede en Hangzhou provocara una caída bursátil de US$1 billón con el lanzamiento de R1, un modelo de código abierto que imita el proceso de razonamiento humano. El R1 competía con el rendimiento de sistemas de IA de última generación de empresas como OpenAI, pero, según se afirmaba, fue construido por una fracción del costo.

Esto no les gusta a los autoritarios

El ejercicio del periodismo profesional y crítico es un pilar fundamental de la democracia. Por eso molesta a quienes creen ser los dueños de la verdad.

Meta despedirá a 8.000 empleados en plena apuesta por la inteligencia artificial, según AFP

Las acciones de fabricantes chinos de chips subían el viernes, ya que los inversionistas apuestan a que el nuevo modelo impulsará la demanda de semiconductores locales. En una publicación en WeChat, DeepSeek señaló que la capacidad de servicio para la serie V4 Pro es extremadamente limitada debido a la escasez de cómputo. Sin embargo, la startup espera que los precios del modelo caigan significativamente tras el lanzamiento en el segundo semestre de clústeres de computación impulsados por los chips Ascend 950 de Huawei Technologies Co. DeepSeek está actualmente en conversaciones con Tencent Holdings Ltd. y Alibaba Group Holding Ltd. para su primera ronda de financiación.

Las acciones de Semiconductor Manufacturing International Corp., principal fabricante de chips de Huawei, subieron hasta un 9,4% en Hong Kong, mientras que Hua Hong Semiconductor Ltd. avanzó más del 13%. Rivales como Knowledge Atlas Technology JSC Ltd. —o Zhipu— cayeron un 8%.

La nueva serie representa un gran avance en escala y eficiencia, que han definido el ascenso de DeepSeek y han ejercido una enorme presión competitiva sobre sus rivales. Tras el R1, empresas tecnológicas e inversionistas comenzaron a replantearse la conveniencia de destinar miles de millones de dólares al desarrollo de IA. Desde entonces, esas inversiones se han reactivado, y se proyecta que los gigantes tecnológicos estadounidenses destinen alrededor de US$650.000 millones en 2026 a infraestructura de IA y centros de datos.

El sistema de un billón de parámetros de DeepSeek utiliza la técnica Mixture-of-Experts, activando selectivamente solo un pequeño subconjunto de expertos y hasta 37.000 millones de parámetros por tarea para mantener los costos de inferencia muy por debajo de modelos comparables de frontera.

La arquitectura y las técnicas posicionan a DeepSeek directamente frente a competidores de Silicon Valley como OpenAI, Google y los modelos más recientes de Anthropic. El viernes, la startup destacó un rendimiento superior al de modelos como GPT-5.2 de OpenAI en pruebas estándar, aunque reconoció que el V4 está rezagado entre 3 y 6 meses respecto a los modelos más avanzados.

Sin embargo, DeepSeek enfatizó que no solo busca maximizar capacidades, sino también reducir costos de manera fundamental. El V4 está diseñado para implementarse en infraestructura más económica.

OpenAI, DeepSeek And ChatGPT Artificial Intelligence Illustrations

“Minimax y Zhipu, como proveedores independientes de modelos, siempre serán vulnerables a la competencia, especialmente de plataformas de internet o proveedores de servicios en la nube que tienen mayor alcance y distribución”, afirmó Vey-Sern Ling, director gerente de Union Bancaire Privée. “Con el tiempo, la brecha en el rendimiento de los modelos será imperceptible para la mayoría de los usuarios”.

DeepSeek también desató un frenesí en China, ya que líderes tecnológicos desde Alibaba hasta Baidu Inc. inundaron el mercado con servicios de IA de bajo costo. Rivales como ByteDance Ltd., Zhipu y Minimax se apresuraron a actualizar sus modelos en las semanas previas a abril, buscando adelantarse a DeepSeek.

Acusaciones contra DeepSeek

Con la notoriedad también llegó el escrutinio. Líderes tecnológicos y funcionarios del gobierno estadounidense han acusado a DeepSeek de utilizar técnicas y hardware ilícitos para desarrollar sus modelos.

Uno de los focos es la llamada destilación, mediante la cual un modelo de IA se apoya en la salida de otro para entrenarse y desarrollar capacidades similares. Tanto OpenAI como Anthropic han señalado que detectaron este tipo de ataques por parte de DeepSeek, una preocupación que OpenAI comenzó a plantear en privado poco después del lanzamiento del modelo R1.

Otra preocupación es que DeepSeek pueda tener acceso a chips de IA de Nvidia Corp. prohibidos, una posibilidad que funcionarios estadounidenses comenzaron a investigar el año pasado.

El gobierno de Estados Unidos cree que la startup china utilizó procesadores Nvidia Blackwell, cuya venta a China está efectivamente prohibida, en un centro de datos en Mongolia Interior, según personas familiarizadas con el asunto.



Fuente: www.perfil.com

Artículos Relacionados

Volver al botón superior