Alan
ftenjoyer.bsky.social
Alan
@ftenjoyer.bsky.social
ML/AI - NLP, multimodality and more. Media accesibility. Finetuning enjoyer. Investigación aplicada. También hago aplicaciones web. ES/EN
En el panorama de la IA europeo también se están haciendo algunos desarrollos muy interesantes, como esto de Kyutai (🇫🇷)

Un modelo de interpretación simultánea (real-time), capaz hasta de reproducir el acento del orador, ¡y corre en un móvil!

De momento solo francés->inglés, pero muy prometedor:
February 8, 2025 at 2:04 PM
Dudaba de ello, pero empiezo a pensar que sí es factible construir un 'modelo del mundo', aunque sea aproximado, a partir de simples secuencias de imágenes.
December 17, 2024 at 8:40 PM
Fotorealismo y consistencia en composiciones que [casi seguro] no están entre los datos de entrenamiento es un reto mayúsculo.
December 17, 2024 at 8:40 PM
Los niveles de consistencia física de Veo2, el nuevo modelo de vídeo de Google, son alucinantes. Ya está, se han pasado el juego.
December 17, 2024 at 8:40 PM