DeepSeek-V2: Un modelo de lenguaje MoE eficiente y avanzado

DeepSeek-V2 es un modelo de lenguaje de última generación basado en la arquitectura Mixture-of-Experts (MoE) que destaca por su eficiencia y potencia. Lanzado en junio de 2024, este modelo cuenta con 236 mil millones de parámetros en total, de los…