
Bienvenido 9to5Neural. AI se mueve rápidamente. Te ayudamos a seguir el ritmo. La semana pasada mencionamos que las empresas estadounidenses de IA están viendo una profunda competencia de Deepseek R1 fuera de China. Hoy, el impacto de Deepseek ha llegado a Wall Road cuando las acciones de Nvidia caen 17%. Echemos un vistazo más de cerca a Deepseek, la respuesta de Nvidia y la imagen más grande para el desarrollo de la IA.
¿Qué es Deepseek?
Deepseek es simplemente una firma de IA china nacida de un fondo de cobertura llamado Excessive-Flyer. Liang Wengeng fundó la compañía en 2023, y tiene su sede en Hangzhou, Zhejiang, China. Wengeng cofundó Flyer Siete años antes, centrándose en las inversiones de IA.
Veterano Comenzó a entrenar sus modelos antes de que el gobierno de los Estados Unidos restringiera el acceso de China a los chips de IA estadounidenses. Por esta razón, se espera que la compañía tenga un suministro saludable de GPU de NVIDIA antes de que se imponieran restricciones.
Aún así, Deepseek ha necesitado operar bajo las limitaciones de acceso limitado al {hardware} NVIDIA adicional. Esta restricción puede haber obligado a Deepseek a centrarse en la innovación con la que promociona su modelo V3.
Lo que Deepseek ha demostrado es la capacidad de competir con OpenAi’s nuevo modelo O3. ChatGPT O3 es el sucesor de O1, posiblemente porque O2 es un transportista de teléfono del Reino Unido establecido.
De todos modos, Deepseek ha creado un modelo que es prácticamente tan competitivo al tiempo que requiere dramáticamente menos recursos y cuesta un pequeño porcentaje del costo de ejecutar en comparación con el chatbot de OpenAi.
Deepseek terminó aquí enfocándose en destilar los modelos existentes en lugar de hacer girar modelos utilizando la misma estrategia que las empresas estadounidenses. Es justo decir que Deepseek se beneficia en gran medida del trabajo que hasta ahora ha sido realizado por las empresas de IA que ya conocemos. Al mismo tiempo, Deepseek ha necesariamente necesario Centrarse en optimizar los modelos existentes a través de la destilación debido a Restricciones de EE. UU. Al exportar chips de IA estadounidenses a China.
Metodología de entrenamiento de Deepseek
Esa es solo la historia hasta ahora. Lo que sucede a continuación aún no se ha determinado, pero creo que podemos apostar por Operai y otras empresas de IA estadounidenses que priorizan la destilación del modelo para reducir los costos de operación y mantenerse competitivos. En otras palabras, Deepseek no ha logrado nada de lo que las empresas estadounidenses de IA no pueden replicar. Es solo una cuestión de priorizar la eficiencia del modelo ahora que la competencia ha llegado.
Pero priorizar la destilación del modelo no es lo único que ayudó a Deepseek a llegar a la carrera de IA. Deepseek también se ha basado en el entrenamiento de IA AI. Las empresas estadounidenses de IA todavía usan entrenamiento humano en el bucle Eso da importancia a los conjuntos de datos marcados con humanos.
El beneficio del Método de entrenamiento ai-ai Es que el entrenamiento es mucho más escalable, ya que requiere menos aporte humano. El desafío, sin embargo, es que los errores se pueden amplificar. También dificulta los controles de alineación de IA. La alineación es otra forma de decir que nuestros modelos de IA reflejan nuestros valores y operan como pretendemos.
El aprendizaje supervisado de ajuste y refuerzo de la retroalimentación humana es lo que hace que nuestros modelos de IA proporcionen respuestas imparciales. En otras palabras, nos aseguramos de que los datos sean buenos.
Si bien no espero un cambio violento en la forma en que las empresas estadounidenses de IA aseguran la calidad de los datos, creo que veremos un movimiento appreciable hacia la IA AI. Este siempre fue el objetivo de OpenAi y empresas similares; Deepseek puede haber aplicado presión para ir allí antes.
$ 6 millones de tanques $ 600 mil millones
Si sigues Deepseek, es possible que te encuentres con un Cifra de $ 6 millones Eso proviene de su trabajo de investigación que cubre su nuevo modelo. La afirmación es que V3 se desarrolló por menos de $ 6 millones utilizando {hardware} NVIDIA H800 menos capaz. Sin embargo, esta afirmación puede ser cierta al tiempo que también omite los costos de inversión asociados con la capacitación de modelos anteriores, sin mencionar que el suministro NVIDIA adquirido antes de las restricciones de exportación de chips de IA de EE. UU.
Otra cifra para analizar: $ 600 mil millones. Esa es la cantidad de capitalización de mercado que Nvidia perdió hoy solo. Ese es el resultado de que los inversores sean asustados por los modelos Deepseek que sean más baratos para entrenar y más barato para correr, lo que significa menos oportunidades de lo esperado para el crecimiento de Nvidia.
Creo que esto es extremadamente miope y una reacción exagerada. Mi pensamiento es este: Deepseek ha demostrado una gran eficiencia en cómo se pueden desarrollar modelos actuales de IA. ¡Excelente! Eso puede reducir el tiempo que lleva desarrollar la próxima evolución importante de los modelos de IA.
En otras palabras, lanzar más GPU de NVIDIA al problema probablemente sea la respuesta para impulsar la tecnología AI: podríamos ir más allá, más rápido ahora. Recuerde: la carrera de IA es delantera, no a donde estamos ahora.
AI no es un problema resuelto
Lo que lleva a la masiva de OpenAi Proyecto Stargate. Básicamente, Stargate está destinado a ser un edificio en Texas que está lleno de branquias con cómputo. Digamos que los futuros modelos de IA pueden lograr más con menos cálculo. Eso solo significa que estos modelos de IA podrán lograr aún más con la cantidad existente de cómputo que Stargate se dirige.
Hay una brecha actual entre dónde estas empresas quieren ir con IA y dónde estamos hoy. El impacto de Deepseek puede ser obligado a otras empresas de IA a priorizar diferentes objetivos por ahora. Tendremos que ver qué sale de Deepseek a continuación para tener una concept justa de si son una empresa más innovadora o no.
Algunas otras notas.
Nvidia Encontró el forro plateado en el trabajo de Deepseek con esta declaración emitida hoy:
Deepseek es un excelente avance de la AL y un ejemplo perfecto de escala del tiempo de prueba. El trabajo de Deepseek ilustra cómo se pueden crear nuevos modelos utilizando esa técnica, aprovechando modelos ampliamente disponibles y calculando que cumple con el management de exportación. La inferencia requiere un número significativo de GPU NVIDIA y redes de alto rendimiento. Ahora tenemos tres leyes de escala: pre-entrenamiento y post-entrenamiento, que continúan, y la nueva escala de tiempo de prueba.
En otras palabras, estamos construyendo un mejor avión a mitad de vuelo, pero aún necesitamos flamable para aviones para volar.
NVIDIA todavía ha aumentado un 93% año tras año y 1,782% en los últimos cinco años.
Opadai Será mucho más generoso con Chatgpt O3-Mini cuando llegue en gran parte a la competencia de Deepseek.

Después de publicar el lunes, el jefe de Operai, Sam Altman, respondió en X a la atención que Deepseek está ganando:
R1 de Deepseek es un modelo impresionante, particularmente en torno a lo que pueden entregar por el precio. ¡Obviamente entregaremos modelos mucho mejores y también es legítimo tener un nuevo competidor! Subiremos algunos lanzamientos.
Pero sobre todo estamos entusiasmados de continuar ejecutando nuestra hoja de ruta de investigación y creer que más cómputo es más importante que nunca antes de tener éxito en nuestra misión. El mundo querrá usar mucha IA, y realmente se sorprende bastante por los modelos de próxima generación.
Esperamos traerles a todos agi y más allá.
Suma justa del logro de Deepseek, y obviamente está haciendo mucho trabajo en esa oración.
Presidente Trump abordó el efecto Deepseek el lunes, por Reuters:
El lanzamiento de Deepseek, IA de una empresa china, debería ser una llamada de atención para nuestras industrias que necesitamos para estar centrados en el láser en competir para ganar.
He estado leyendo sobre China y algunas de las compañías en China, una en specific con un método más rápido de IA y un método mucho menos costoso, y eso es bueno porque no tiene que gastar tanto dinero. Veo eso como positivo, como un activo.
Veo eso como positivo porque también lo harás, por lo que no gastarás tanto y obtendrás el mismo resultado, con suerte.
Siempre tenemos las concepts. Siempre somos los primeros. Entonces diría que es positivo que podría ser un desarrollo muy positivo. Entonces, en lugar de gastar miles y miles de millones, gastará menos y se le ocurrirá, con suerte, la misma solución.
La carrera de IA está activada, amigos, y la industria de la IA es la nueva NASA.
Veterano ha ralentizado la creación de una nueva cuenta hoy debido a un ataque cibernético a gran escala que afecta el servicio. Este mensaje actualmente se lee en la parte superior de chat.deepseek.com:
Debido a los ataques maliciosos a gran escala contra los servicios de Deepseek, el registro puede estar ocupado. Espere y vuelva a intentarlo. Los usuarios registrados pueden iniciar sesión normalmente. Gracias por su comprensión y apoyo.
Sin embargo, pudimos crear una nueva cuenta después de unas horas de intentarlo el lunes.
También puede haber visto un Publicación de redes sociales virales Afirmar que la instalación de Deepseek en iOS le da a la firma de IA china acceso profundo a datos personales en su iPhone, incluido el correo electrónico y los mensajes. Afortunadamente, no es así como funciona la arquitectura de iOS. Incluso puede crear una cuenta utilizando Iniciar sesión con Apple, que puede generar una dirección de correo electrónico desechable para una seguridad adicional. Sin embargo, Deepseek tiene acceso a lo que ingresa en el chatbot.
También, Veterano Todavía sugiere hablar sobre matemáticas, codificación y problemas de lógica, en su lugar, cuando se le pregunta sobre lo que sucedió en 1989 en Tiananmen Sq.. Sin embargo, Perplejidad Parece haber descifrado ese problema.
Más sobre lo último en desarrollos de IA en la próxima edición de 9to5Neural – ¡Solo en 9to5mac! Lea el número anterior aquí.
Los mejores accesorios para iPhone
FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.