Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.
[16][19][18] Las empresas de capital riesgo se mostraron reacias a proporcionar financiación, ya que era poco probable que pudieran generar una salida (retorno sobre la inversión) en un corto período de tiempo.
A pesar del bajo precio cobrado por DeepSeek, fue rentable en comparación con sus rivales que estaban perdiendo dinero.
[20] Hasta el momento, DeepSeek se centra únicamente en la investigación y no tiene planes detallados de comercialización.
[20] Las preferencias de contratación de DeepSeek se centran en las habilidades técnicas más que en la experiencia laboral al reclutar nuevos empleados, por lo que la mayoría de sus nuevos empleados son estudiantes universitarios recientemente graduados o desarrolladores cuyas carreras en IA están menos establecidas.
[21] El código del modelo se hizo de código abierto bajo la licencia MIT, con un acuerdo de licencia adicional sobre el "uso posterior abierto y responsable" del modelo en sí.
Se desarrolló para competir con otros LLM disponibles en ese momento con un rendimiento cercano al de GPT-4.
Sin embargo, enfrentó desafíos en términos de eficiencia computacional y escalabilidad.
[21] También se lanzó una versión de chatbot del modelo llamada DeepSeek Chat.
En cambio, son similares a otros modelos de peso abierto como LLaMA y Qwen, ajustados con datos sintéticos generados por R1.
[36] DeepSeek lanzó su asistente virtual, que utiliza el modelo V3 como una aplicación de bot conversacional para iOS y Android.
[38] Varias publicaciones y medios de comunicación, como The Hill y The Guardian, describieron el lanzamiento de su bot conversacional como un «momento Sputnik» para la IA estadounidense.
[48][49] El presidente estadounidense Donald Trump, quien anunció The Stargate Project, calificó a DeepSeek como una «llamada de atención»[50] y un avance positivo.
[47][53][54] Varias empresas, incluidas Amazon Web Services, Toyota y Stripe, buscan utilizar el modelo en su programa.
Muchos de los artículos para el hogarxde estos fabricantes ya son dispositivos inteligentes que responden a comandos activados por voz, pero los modelos de DeepSeek permitirán una precisión mucho mayor.
Por ejemplo, una aspiradora robotizada que utilice el modelo R1 de DeepSeek podría entender mejor instrucciones complejas, como navegar alrededor de obstáculos mientras realiza tareas específicas como encerar suelos.
[59][60] La IA puede generar inicialmente una respuesta, pero poco después la elimina y la reemplaza con un mensaje como: «Lo siento, eso está más allá de mi alcance actual.
Podemos recopilar su entrada de texto o audio, indicaciones, archivos cargados, comentarios, historial de chat u otro contenido que proporcione a nuestro modelo y Servicios».