banner
minkoro1.bsky.social
@minkoro1.bsky.social
Je suis assez absent ici, mais je pense que cela va changer. Pourquoi ? Parce qu'apparemment, selon un certain Serbe gigolo sur youtube, c'est un repaire de losers
September 9, 2025 at 3:56 AM
Reposted
Si ça intéresse quelqu'un, l'examen qui a eu lieu ce matin pour le cours de théories des jeux (“théories” au pluriel, merci) que je donne à Télécom Paris est ici: perso.enst.fr/madore/mitro...

Et le corrigé est là: perso.enst.fr/madore/mitro...
June 26, 2025 at 11:03 AM
Reposted
Il y a 25 ans, le 4 mai 2000, fut lancé le virus informatique « I love you » qui se cachera derrière une fausse lettre d’amour envoyée par email et infectera près de 10% des ordinateurs dans le monde #LaPetiteInfoDuJour
May 4, 2025 at 1:28 PM
Damn, je devrais publier un peu plus sur ce réseau.
March 1, 2025 at 9:58 PM
Récemment, j'ai découvert un livre extraordinaire sur l'économétrie. C'est un domaine qui, je l'avoue, me passionne sans pour autant me dépayser. Il mérite une attention particulière, surtout si ton objectif est de devenir quant.
February 9, 2025 at 6:04 PM
Ça fait longtemps ici
February 9, 2025 at 5:47 PM
Reposted
SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

- RL generalizes in rule-based envs, esp. when trained with an outcome-based reward
- SFT tends to memorize the training data and struggles to generalize OOD
January 29, 2025 at 1:43 PM
Reposted
RIP: Rejecting Instruction Preferences by @jasonweston.bsky.social (one of the author)

A method to curate high quality data, or create high quality synthetic data. Using Llama 3.3-70B-Instruct, RIP improves Arena-Hard from 67.5 to 82.9.
January 31, 2025 at 4:48 AM
Reposted
ProLip: A probabilistic trained SigLIP

ProLIP is the first from-scratch trained probabilistic vision-language model, which is comparable with CLIP or SigLIP

Paper: Probabilistic Language-Image Pre-Training ( arxiv.org/abs/2410.18857 )
Models: huggingface.co/collections/...
ProLIP - a SanghyukChun Collection
Official ProLIP weights
huggingface.co
January 24, 2025 at 7:39 AM
Que pensez-vous de la bibliothèque TensorFlow ? Personnellement, je la préfère à PyTorch.
January 11, 2025 at 6:44 PM
Reposted
Video Generation Models Explosion 2024 by Yen-Chen Lin

He reviews all the key techniques that are used in building state-of-the-art video generation models.

yenchenlin.me/blog/2025/01...
January 11, 2025 at 6:30 PM
Reposted
I have a draft of my introduction to cooperative multi-agent reinforcement learning on arxiv. Check it out and let me know any feedback you have. The plan is to polish and extend the material into a more comprehensive text with Frans Oliehoek.

arxiv.org/abs/2405.06161
A First Introduction to Cooperative Multi-Agent Reinforcement Learning
Multi-agent reinforcement learning (MARL) has exploded in popularity in recent years. While numerous approaches have been developed, they can be broadly categorized into three main types: centralized ...
arxiv.org
January 7, 2025 at 4:25 PM
Haha salut. Désolé, ce n'est vraiment pas terrible comme premier post
January 8, 2025 at 5:41 AM