Al_th
alth.fr
Al_th
@alth.fr
Applied Math Ph.D, R&D engineer (Image processing, numerical modeling, Machine Learning) in the healthcare sector. #MLsky

Also cooking (Pâté en croûte maker) and slowly learning guitar.

Alth.fr
@althcuisine on Instagram
@AlthCuisine on YouTube

FR/EN
www.lemonde.fr/m-perso/arti...

"Le flan n’est pas prétentieux comme un macaron ; il est « terroir », mais pas snob comme le pâté en croûte. "

Je vous jure, je suis trigger de fou.
Le running, c’est pas du flan (quoique)
La multiplication des clubs de course à but gourmand prouve que le réconfort vaut désormais autant que l’effort. Au Running Flan Club, à Paris, on s’épuise sur quelques kilomètres avant de se retrouve...
www.lemonde.fr
March 21, 2025 at 10:43 AM
Reposted by Al_th
🔥🔥🔥 CV Folks, I have some news! We're organizing a 1-day meeting in center Paris on June 6th before CVPR called CVPR@Paris (similar as NeurIPS@Paris) 🥐🍾🥖🍷

Registration is open (it's free) with priority given to authors of accepted papers: cvprinparis.github.io/CVPR2025InPa...

Big 🧵👇 with details!
March 21, 2025 at 6:43 AM
Reposted by Al_th
A bit frustrated by how arXiv accounts are integrated in the #MLSky feed.

Endless scrolling of links without context is uninformative, and just leads to me to ignore them all.

I can block but is this really a good route…
February 25, 2025 at 6:58 AM
Impressive.

I really like the fact that you can interrupt. It's always difficult to speak with an AI algorithm, or even do speech to text as the moment you stop talking, it's the algorithm's "turn".

IRL we do not play turn-based, it's much more subtle than that.
Crossing the uncanny valley of conversational voice
At Sesame, our goal is to achieve “voice presence”—the magical quality that makes spoken interactions feel real, understood, and valued.
www.sesame.com
February 28, 2025 at 12:36 PM
A bit frustrated by how arXiv accounts are integrated in the #MLSky feed.

Endless scrolling of links without context is uninformative, and just leads to me to ignore them all.

I can block but is this really a good route…
February 25, 2025 at 6:58 AM
Il faut les comprendre. Le MO coûte cher ! 😂
February 24, 2025 at 7:02 AM
Il y a une discussion entre deux personnes dans cette salle.

Celle qui porte la culotte, si vous me pardonnez cette expression un peu datée, n’est pas celle que vous croyez.

Go girl !
TRUMP: The NCAA has complied immediately. That's good. But I understand Maine -- is the governor of Maine here?

JANET MILLS: Yeah I'm here

TRUMP: Are you not gonna comply?

JM: I'm going to comply with state and federal law

T: You better do it bc you're not gonna get any federal funding at all
February 22, 2025 at 9:31 AM
An arguably "easy to read" simple GRPO implementation, for teaching purpose

#MLSky
alth.fr Al_th @alth.fr · Feb 6
github.com/Al-th/grpo_e...

I hope it's a reasonable implementation...

Tokenizer and Transformer models are very naive, based on Karpathy's transformer from scratch video. Data is also based on Karpathy's video.
GitHub - Al-th/grpo_experiment: Experiment on reimplementation of GRPO RL
Experiment on reimplementation of GRPO RL . Contribute to Al-th/grpo_experiment development by creating an account on GitHub.
github.com
February 7, 2025 at 12:46 PM
It’s really funny to me that the hottest RL algorithm in town is just a simplification (z-score normalization for advantage calculation) of a simplification (KL penalization over hard KL constraint).

GRPO is quite intuitive, although I guess the devil is in the details and « convergence » speeds
February 6, 2025 at 5:07 PM
I implemented GRPO from scratch to RL a tiny toy LLM and it works surprisingly well.

Rule base reward inspired by @dorialexander.bsky.social to make my Shakespeare shout more.

I went for Outcome Supervision as both OS and PS we’re kind of close in DeepseekMath paper…
February 5, 2025 at 5:20 PM
Reposted by Al_th
2/2

Cette conclusion provient de plusieurs types d'analyses combinées (géochimie, granulométrie, minéralogie des argiles, activités des radionucléides et de leur signature isotopique, rétro-trajectoires des masses d’air...)

Source @cnrs.bsky.social INSU : www.insu.cnrs.fr/fr/cnrsinfo/...
Poussières sahariennes : la radioactivité ne provient pas des essais nucléaires menés par la France
Les poussières désertiques représentent la première source mondiale en masse d’aérosols dans l’atmosphère.
www.insu.cnrs.fr
February 3, 2025 at 8:50 PM
Reposted by Al_th
I release my first attempts at training a base model with GRPO. In a similar spirit to R0, this colab notebook transforms Pleias-350m into an RL poet without any post-training data, using only reward functions. t.co/tYSp8NYI1s
February 2, 2025 at 11:30 PM
Je suis mort de rire : un médecin retraité >>>>n’exerçant plus aucune activité médicale rémunérée <<<< doit toujours filer ses 100 balles a l’ordre des médecins 😂
January 26, 2025 at 8:19 AM
Reposted by Al_th
Vraiment il sera intéressant de voir un peu les algos de "X". Notre compte est interdit de publier des "notes de la communauté". Nous aurions trop de statut "inutile". Pourtant la 2ème capture prouve que c'est faux; et nous sommes allé vérifier.
Conclusion? Les algos de X manipulent les résultats.
January 24, 2025 at 3:45 PM
AGI milestone passed
January 24, 2025 at 9:15 AM
J’aime cet article parce qu’il utilise le prétexte d’un fait divers pour éduquer.

Mieux, il éduque à la fois sur la sémantique et sur la prise en charge des cancers.
January 23, 2025 at 10:55 AM
Reposted by Al_th
🟡 J’appelle mes collègues député.es à voter à l’identique ma proposition de loi instaurant un nombre minimum de soignants /patients.

🏥 Il s’agit d’une vraie réponse à la crise des hôpitaux. Une loi urgente et soutenue par la communauté des soignants ! @placepublique.bsky.social
@cih75.bsky.social
January 22, 2025 at 5:46 PM
I must be using DeepSeek’s distilled r1 model wrong but I’m sincerely unimpressed by the reasoning bit.

Reasoning often gets circular, and just gets ignored at the end by the model.

My inputs might be too vague for current capabilities probably…
January 22, 2025 at 5:30 PM
Y’en avait un peu marre de la frangipane, alors j’ai œuvré avec une galette cochonne, comme dirait Verot…
January 22, 2025 at 4:32 PM
I unfortunately don't have access to the underlying article.

That being said, I remember vividly being under critics on X, when I discussed the data on organic food health benefits and argued for a cautious stance (see second skeet below)

1/2
People are bad at reporting what they eat. That’s a problem for dietary research
Studies that use surveys to link dietary patterns to human health may be irredeemably biased, new paper suggests
www.science.org
January 21, 2025 at 1:43 PM
Pecan biscuit, apple and dates, whipped cream

🍽️
January 21, 2025 at 7:18 AM
Does the NLP community know if there is a context size threshold under which KV caching does not make sense ?

I guess for small sizes, matmul may be cheaper than slicing of a PyTorch tensor ?

#NLP #LLM
January 21, 2025 at 7:11 AM
Reposted by Al_th
Merci merci 1000x fois merci pour ce fil génial qui montre a quel point il faut intégrer une dose de vigilance supplémentaire sur des recherches d’images !
Bonjour tout le monde ! Aujourd'hui, on fait un petit exercice d'autodéfense botanique. Vous êtes prêt.es, allez, c'est parti ! Je vous présente Diphylleia grayi ! Une plante INCROYABLE qui devient TRANSPARENTE lorsqu'elle est mouillée. 🤯
Déroulez le fil 🔽🔽🔽
January 18, 2025 at 9:58 AM
Sur le réseau social du démon, j'ai à N=3 liens (record : d'habitude l'algo me pousse de l'ED en direct), une vidéo de Bardella qui """"défend la liberté d'expression"""" et prend en exemple les élections Roumaines.

Rappel que @flefgraph.bsky.social fait un boulot d'utilité publique...
Analyse de la manipulation algorithmique pendant les élections présidentielles roumaines.

Résultat : De l'astroturfing et des milliers de menaces de mort/d'insurrection, d'insultes, de messages antisémites...

shorturl.at/A8Hlx

Mais petit résumé (et carto HD) en thread 🧵
January 15, 2025 at 8:26 AM
Reposted by Al_th
Consistent Flow Distillation for Text-to-3D Generation

TL;DR: Consistent Flow Distillation leveraging the gradient of the diffusion ODE or SDE sampling process to guide the 3D generation; multi-view consistent Gaussian noise on the 3D object
January 14, 2025 at 12:25 PM