DeepSeek R1 botando el tablero

Hace unos días DeepSeek lanzó su modelo R1 y movió el piso. Tanto como para que las acciones de Nvidia cayeran cerca de un 17%. Todo esto parece ser parte de una nueva guerra fría en la geopolítica y la lucha tecnológica entre China y EE.UU. DeepSeek entrenó su modelo R1 usando las GPUs H800 (de Nvidia), que tienen menos ancho de banda y son menos potentes que las H100 –a las que China no tiene acceso debido a restricciones por sanciones económicas impuestas por EE....

January 27, 2025 · 6 min · 1145 words

Inteligencia artificial, qué es un LLM

Los modelos de lenguaje masivos (LLM, por sus siglas en inglés) son un tipo de modelo de procesamiento de lenguaje que utiliza un gran conjunto de datos para generar lenguaje natural; explicado en simple, esto se logra a través de tres pasos: Un gran número de preguntas son respondidas por humanos y entregadas al modelo El modelo genera respuestas, y se hace una calificación humana de las mejores respuestas Las respuestas son generadas por máquinas y valoradas por una máquina; es decir, robots entrenando a robots https://openai....

December 6, 2022 · 3 min · 557 words