DeepSeek R1 botando el tablero

Hace unos d铆as DeepSeek lanz贸 su modelo R1 y movi贸 el piso. Tanto como para que las acciones de Nvidia cayeran cerca de un 17%. Todo esto parece ser parte de una nueva guerra fr铆a en la geopol铆tica y la lucha tecnol贸gica entre China y EE.UU. DeepSeek entren贸 su modelo R1 usando las GPUs H800 (de Nvidia), que tienen menos ancho de banda y son menos potentes que las H100 鈥揳 las que China no tiene acceso debido a restricciones por sanciones econ贸micas impuestas por EE....

January 27, 2025 路 6 min 路 1145 words

Inteligencia artificial, qu茅 es un LLM

Los modelos de lenguaje masivos (LLM, por sus siglas en ingl茅s) son un tipo de modelo de procesamiento de lenguaje que utiliza un gran conjunto de datos para generar lenguaje natural; explicado en simple, esto se logra a trav茅s de tres pasos: Un gran n煤mero de preguntas son respondidas por humanos y entregadas al modelo El modelo genera respuestas, y se hace una calificaci贸n humana de las mejores respuestas Las respuestas son generadas por m谩quinas y valoradas por una m谩quina; es decir, robots entrenando a robots https://openai....

December 6, 2022 路 3 min 路 557 words