Me quito el sombrero ante tu artículo, querido Samuel.
Me parece que has hecho una excelente narrativa de los hechos ocurridos y porqué han pasado, de forma que cualquier persona principiante en este tema que supo de Deepseek ayer por la tarde en un post chapucero de LinkedIn, como yo, pueda con tu ayuda comprender de una mejor manera los hechos y por qué es un tema que ha recibido tanta atención y horas de escritura.
No paso por alto el repaso de conceptos básicos de IA que has hecho, el cual me ha permitido darme cuenta de todo lo que no sé y mejora la base de conocimientos que ya tenía los minutos previos al leer tu artículo.
Justo una hora antes de leer tu artículo, me había expuesto a otro artículo sobre Deepseek, pero este tampoco se centraba en explicar los detalles de la optimización de chips, o investigar sobre si DeepSeek no ha partido desde cero o ha utilizado como entrada la salida de OpenAI para aportar una tenue luz al debate. Nada de eso. Ese artículo se centraba en identificar y desarrollar los principios fundamentales y patrones que cumple el caso de DeepSeek para que los podamos transferir luego a cualquier ámbito de nuestras vidas.
Te lo nombro Samuel porque, mientras tú mencionas los motivos del logro de dicha startup china, como el impedimento del chip ban a China como cuna de la innovación o el descubrimiento de un camino que parecía imposible, el autor de este otro artículo se dedica a desarrollar los hechos que identificas explicando de manera sublime cómo la restricción que parecía condenarlos a ir por detrás se convirtió en la chispa de su ventaja competitiva o cómo pudieron recorrer un camino que era imposible.
Ambos usáis la noticia de Deepseek, no para escribir un nuevo bloque de texto más sobre los detalles, lo técnico, etc. Sino para aportar un enfoque completamente distinto, fresco y enriquecedor. Desde la narrativa de los hechos, tú la complementas con una excelente base de IA, y esta otra persona, con la identificación y desarrollo de los patrones y principios fundamentales, logra que de igual el momento en el que leamos los elementos que expone porque son útiles de manera indefinida o, al menos, durante mucho tiempo.
Me han gustado tanto ambos artículos, y sobretodo, me ha parecido tan fascinante como vuestros artículos se complementan tan bien, que como lector de ambos me hubiese gustado que ambos artículos se pudieran fusionar en uno sólo como he visto que hacen otros escritores cuando colaboran entre ellos. Pero esto sé que es fácil pedirlo desde el lado del consumidor.
Muchas gracias Samuel por dedicarle un artículo a esta noticia y usarla para explicar conceptos los conceptos básicos de IA, que personalmente creo que la mayoría no dominamos tanto como tú, aunque a lo mejor estoy proyectando mi bajo conocimiento sobre este tema en el resto de personas. Al menos tu explicación sobre la tokenización me ha ayudado a despejar dudas que aún mantenía en mi cabeza.
Sobre el artículo que te menciono, te dejo el enlace a él en el final de este mensaje para que puedas poner a prueba lo que digo y verificar que ves el mismo talento y valor que yo detecto en sus líneas. Si llegas a echarle un ojo me gustaría conocer, como lector tuyo, tu opinión sobre ese artículo que aprovecha el caso de Deepseek para aportar algo nuevo, único y valioso para todos. Que sepas que ya he hecho un comentario similar a esta persona sobre tu artículo, a ver si así puedo daros mi agradecimiento en forma de intento de conexión, creo que virtuosa, más que en meras palabras.
Adelante Samuel, si lo llegas a leer te pido por favor que me dejes tu opinión al respecto, pues con la base que tienes sobre IA, creo que será interesante de conocer.
Felicidades por el artículo. Normalmente no es habitual encontrar explicaciones de cómo funciona la IA con la claridad y con los matices importantes que aquí he visto. Las explicaciones en muchos sitios la siguen dejando como una caja negra y abstracta. El resto del artículo también muy aclaratorio, poniendo sobre la mesa muchos elementos para que cada uno haga su propio chain-of-thought :)
Si me permites un complemento, esta arquitectura de transformer permite procesar los token de un prompt en paralelo (los modelos iniciales eran secuenciales), por eso las GPU de NVIDIA subieron tanto de valor, es como una CPU pero con una arquitectura que permite realizar muchas operaciones en paralelo, hasta ahora el caso clásico era el procesamiento gráfico.
Totalmente de acuerdo Darío, "completo" es la palabra que define a la perfección el artículo de Samuel, tal y como intenté reflejar en mi comentario de arriba, el cual te recomiendo echar un ojo porque le afloro a Samuel otro artículo sobre Deepseek que me ha parecido valioso desde que lo descubrí esta mañana, pues mientras Samuel aporta el reportaje de los hechos y la base de IA, el otro autor lo complementa con la identificación y desarrollo de principios y patrones que protagonizan la noticia de este Deepseek.
Lo comparto para intentar aportar algo diferente entre toda la paja y artículos repetitivos que ya hay sobre este tema, razón por la cual me ha gustado el de Samuel, porque se diferencia.
Como le dije a Samuel, si lo llegas a leer, te pido por favor que me dejes tu opinión para yo saber si realmente lo que comparto contigo y el resto de personas realmente tiene valor para ustedes, o al menos se asemeja al mismo que yo percibo. Tienes el acceso a él en mi comentario superior, no dejo de nuevo el enlace aquí por respeto a Samuel y su muro, pues lo último que quiero es caer, desde el noble monte de la compartición de bibliografía de valor, hacia el acantilado del spam.
Buen artículo. DeepSeek ha sacudido los mercados y el debate sobre el futuro de la IA. Su modelo R1 es abierto, eficiente y radicalmente más barato, lo que pone en duda la sostenibilidad del enfoque cerrado de OpenAI y Anthropic.
Pero más allá del impacto financiero, ¿estamos presenciando una verdadera democratización de la IA o simplemente una nueva forma de competencia geopolítica? ¿El código abierto será la clave del dominio de la IA o un riesgo estratégico?
Sobre si esto es una jugada maestra para distorsionar el mercado, me recuerda a:." Si llevas media hora jugando al póker y no sabes quién es el pardillo de la mesa, el pardillo eres tú."Se la atribuyen a Warren Buffet. Creo que los pardillos somos la mayoría.
Sobre la explicación de la IA y su funcionamiento. Felcidades, aunque mi comprensión sigue siendo baja. Creo que la IA es la electricidad del siglo XXI, nada funcionará sin ella.
¡Enhorabuena por el artículo y muchas gracias por compartir tus ideas de forma tan clara y didáctica! A mí tampoco me queda claro qué beneficio obtiene DeepSeek al publicar su modelo como código abierto, especialmente considerando que el gobierno chino lo permite. Supongo que deben tener intereses que, aunque a priori no parezcan muy intuitivos, les resultan beneficiosos.
“Todo pasa y todo queda” como diría Machado. Hoy amanecemos con nuevos modelos de OpenAI que según los primeros tests supera a cualquier otro modelo. Acostumbrémonos a ello. Nos queda mucho por ver.
Muy bueno el post! Claro y didáctico! Válido para cualquier neófito en la materia que se quiera iniciar en este mundo.
Por otro lado, me alegra leer que la oportunidad, ya no está en la capa del modelo sino en la aplicación. Algo que no fueron capaces de ver los “gurús de la inversión” cuando explotó todo con ChatGPT
Enhorabuena por el artículo. Eso sí no has entrado en las dudas conspiranoicas, tendrá una puerta trasera? Demasiado bonito, rápido y fácil para que no haya gato encerrado. El tiempo dirá…. Un abrazo
Me quito el sombrero ante tu artículo, querido Samuel.
Me parece que has hecho una excelente narrativa de los hechos ocurridos y porqué han pasado, de forma que cualquier persona principiante en este tema que supo de Deepseek ayer por la tarde en un post chapucero de LinkedIn, como yo, pueda con tu ayuda comprender de una mejor manera los hechos y por qué es un tema que ha recibido tanta atención y horas de escritura.
No paso por alto el repaso de conceptos básicos de IA que has hecho, el cual me ha permitido darme cuenta de todo lo que no sé y mejora la base de conocimientos que ya tenía los minutos previos al leer tu artículo.
Justo una hora antes de leer tu artículo, me había expuesto a otro artículo sobre Deepseek, pero este tampoco se centraba en explicar los detalles de la optimización de chips, o investigar sobre si DeepSeek no ha partido desde cero o ha utilizado como entrada la salida de OpenAI para aportar una tenue luz al debate. Nada de eso. Ese artículo se centraba en identificar y desarrollar los principios fundamentales y patrones que cumple el caso de DeepSeek para que los podamos transferir luego a cualquier ámbito de nuestras vidas.
Te lo nombro Samuel porque, mientras tú mencionas los motivos del logro de dicha startup china, como el impedimento del chip ban a China como cuna de la innovación o el descubrimiento de un camino que parecía imposible, el autor de este otro artículo se dedica a desarrollar los hechos que identificas explicando de manera sublime cómo la restricción que parecía condenarlos a ir por detrás se convirtió en la chispa de su ventaja competitiva o cómo pudieron recorrer un camino que era imposible.
Ambos usáis la noticia de Deepseek, no para escribir un nuevo bloque de texto más sobre los detalles, lo técnico, etc. Sino para aportar un enfoque completamente distinto, fresco y enriquecedor. Desde la narrativa de los hechos, tú la complementas con una excelente base de IA, y esta otra persona, con la identificación y desarrollo de los patrones y principios fundamentales, logra que de igual el momento en el que leamos los elementos que expone porque son útiles de manera indefinida o, al menos, durante mucho tiempo.
Me han gustado tanto ambos artículos, y sobretodo, me ha parecido tan fascinante como vuestros artículos se complementan tan bien, que como lector de ambos me hubiese gustado que ambos artículos se pudieran fusionar en uno sólo como he visto que hacen otros escritores cuando colaboran entre ellos. Pero esto sé que es fácil pedirlo desde el lado del consumidor.
Muchas gracias Samuel por dedicarle un artículo a esta noticia y usarla para explicar conceptos los conceptos básicos de IA, que personalmente creo que la mayoría no dominamos tanto como tú, aunque a lo mejor estoy proyectando mi bajo conocimiento sobre este tema en el resto de personas. Al menos tu explicación sobre la tokenización me ha ayudado a despejar dudas que aún mantenía en mi cabeza.
Sobre el artículo que te menciono, te dejo el enlace a él en el final de este mensaje para que puedas poner a prueba lo que digo y verificar que ves el mismo talento y valor que yo detecto en sus líneas. Si llegas a echarle un ojo me gustaría conocer, como lector tuyo, tu opinión sobre ese artículo que aprovecha el caso de Deepseek para aportar algo nuevo, único y valioso para todos. Que sepas que ya he hecho un comentario similar a esta persona sobre tu artículo, a ver si así puedo daros mi agradecimiento en forma de intento de conexión, creo que virtuosa, más que en meras palabras.
Y perdona por el textaco.
Un abrazo.
https://josefortes.substack.com/p/56-deepseek-presion-darwiniana-restricciones-lo-imposible-y-la-innovacion
muchas gracias por tu comentario. en cuanto pueda me leo el artículo que enlazas.
Adelante Samuel, si lo llegas a leer te pido por favor que me dejes tu opinión al respecto, pues con la base que tienes sobre IA, creo que será interesante de conocer.
Un saludo!!
"el hambre agudiza el ingenio" y "no se puede poner puertas al campo"
muy de acuerdo y muy en línea con mi artículo!
Felicidades por el artículo. Normalmente no es habitual encontrar explicaciones de cómo funciona la IA con la claridad y con los matices importantes que aquí he visto. Las explicaciones en muchos sitios la siguen dejando como una caja negra y abstracta. El resto del artículo también muy aclaratorio, poniendo sobre la mesa muchos elementos para que cada uno haga su propio chain-of-thought :)
Si me permites un complemento, esta arquitectura de transformer permite procesar los token de un prompt en paralelo (los modelos iniciales eran secuenciales), por eso las GPU de NVIDIA subieron tanto de valor, es como una CPU pero con una arquitectura que permite realizar muchas operaciones en paralelo, hasta ahora el caso clásico era el procesamiento gráfico.
así es!
Uno de los textos en español más completos que he encontrado. Gracias por el nivel de detalle y profundidad!
Totalmente de acuerdo Darío, "completo" es la palabra que define a la perfección el artículo de Samuel, tal y como intenté reflejar en mi comentario de arriba, el cual te recomiendo echar un ojo porque le afloro a Samuel otro artículo sobre Deepseek que me ha parecido valioso desde que lo descubrí esta mañana, pues mientras Samuel aporta el reportaje de los hechos y la base de IA, el otro autor lo complementa con la identificación y desarrollo de principios y patrones que protagonizan la noticia de este Deepseek.
Lo comparto para intentar aportar algo diferente entre toda la paja y artículos repetitivos que ya hay sobre este tema, razón por la cual me ha gustado el de Samuel, porque se diferencia.
Como le dije a Samuel, si lo llegas a leer, te pido por favor que me dejes tu opinión para yo saber si realmente lo que comparto contigo y el resto de personas realmente tiene valor para ustedes, o al menos se asemeja al mismo que yo percibo. Tienes el acceso a él en mi comentario superior, no dejo de nuevo el enlace aquí por respeto a Samuel y su muro, pues lo último que quiero es caer, desde el noble monte de la compartición de bibliografía de valor, hacia el acantilado del spam.
Un saludo!!
Qué buen resumen de la los fundamentos IA, me ha encantado! Enhorabuena por el post
Jeje, y ¿qué parte de la sección, ‘¿y realmente razonan?’ no sería aplicable a humanos?
eso me pregunto yo también 😅
Buen artículo. DeepSeek ha sacudido los mercados y el debate sobre el futuro de la IA. Su modelo R1 es abierto, eficiente y radicalmente más barato, lo que pone en duda la sostenibilidad del enfoque cerrado de OpenAI y Anthropic.
Pero más allá del impacto financiero, ¿estamos presenciando una verdadera democratización de la IA o simplemente una nueva forma de competencia geopolítica? ¿El código abierto será la clave del dominio de la IA o un riesgo estratégico?
Sobre si esto es una jugada maestra para distorsionar el mercado, me recuerda a:." Si llevas media hora jugando al póker y no sabes quién es el pardillo de la mesa, el pardillo eres tú."Se la atribuyen a Warren Buffet. Creo que los pardillos somos la mayoría.
Sobre la explicación de la IA y su funcionamiento. Felcidades, aunque mi comprensión sigue siendo baja. Creo que la IA es la electricidad del siglo XXI, nada funcionará sin ella.
Este tema me explota la cabeza 🤣 Menos mal que me dedico al Agua.
¡Enhorabuena por el artículo y muchas gracias por compartir tus ideas de forma tan clara y didáctica! A mí tampoco me queda claro qué beneficio obtiene DeepSeek al publicar su modelo como código abierto, especialmente considerando que el gobierno chino lo permite. Supongo que deben tener intereses que, aunque a priori no parezcan muy intuitivos, les resultan beneficiosos.
“Todo pasa y todo queda” como diría Machado. Hoy amanecemos con nuevos modelos de OpenAI que según los primeros tests supera a cualquier otro modelo. Acostumbrémonos a ello. Nos queda mucho por ver.
Muy bueno el post! Claro y didáctico! Válido para cualquier neófito en la materia que se quiera iniciar en este mundo.
Por otro lado, me alegra leer que la oportunidad, ya no está en la capa del modelo sino en la aplicación. Algo que no fueron capaces de ver los “gurús de la inversión” cuando explotó todo con ChatGPT
Enhorabuena por el artículo. Eso sí no has entrado en las dudas conspiranoicas, tendrá una puerta trasera? Demasiado bonito, rápido y fácil para que no haya gato encerrado. El tiempo dirá…. Un abrazo
Te he dado las herramientas para que juzgues por ti mismo ;-)
Si puedes ver el código y puedes ejecutar tu propia instancia donde quieras o usar la versión alojada en proveedores en los que confíes…
Tienes toda la razón, has hecho un análisis exhaustivo y claro, lo cual no es fácil y te lo agradezco