Guillaume Plique
banner
yomguithereal.bsky.social
Guillaume Plique
@yomguithereal.bsky.social
Research Engineer at SciencesPo's médialab.
Just published version 0.54.0 of ✨xan✨, @medialab-scpo.bsky.social's CSV magician!

xan now uses our homegrown Rust SIMD CSV parser for up to 8x faster CSV wrangling 🔥.

See the full changelog over there: github.com/medialab/xan...

The parser: docs.rs/simd-csv/lat...
Release v0.54.0 · medialab/xan
The SIMD update. Breaking Bumping MSRV to 1.83.0. Dropping xan plot -Y/--add-series. It is now possible to select multiple columns as <y> in xan plot <x> <y> instead. Dropping the -C/--force-colo...
github.com
November 17, 2025 at 2:50 PM
Reposted by Guillaume Plique
Great news! 🎉 Our Open Research devroom has been accepted for another year at @fosdem.org CfP is now OPEN. Go to our website to see how you can submit a talk on anything research: research-fosdem.github.io
🗓️ Sunday 1st February
📍 Brussels, Belgium

Looking forward to seeing you all at #FOSDEM2026 👩🏽‍💻
a cartoon character says good news in front of a futurama sign
ALT: a cartoon character says good news in front of a futurama sign
media.tenor.com
November 10, 2025 at 7:37 PM
Just released xan v0.53.0 ! A bunch of fixes and new features such as xan map --overwrite and more moonblade functions.

Check out the changelog: github.com/medialab/xan...
Release v0.53.0 · medialab/xan
Breaking xan partition now normalizes filenames to lowercase to correctly deal with case-insensitive filesystems. xan partition also gets a related -C/--case-sensitive flag. Features Adding all ...
github.com
September 19, 2025 at 3:43 PM
Reposted by Guillaume Plique
📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.

Retrouvez le cahier des charges et les informations pour candidater ici 👇
Recherche prestataire en design et développement de site web dans le cadre du projet RésIn | médialab Sciences Po
Le médialab de Sciences Po recherche une entreprise prestataire dans le cadre du projet RésIn pour une mission de refonte du front-office d’un site web.
medialab.sciencespo.fr
September 11, 2025 at 8:21 AM
Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...

Be sure to pivot correctly!
July 31, 2025 at 7:55 AM
Reposted by Guillaume Plique
Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com
July 28, 2025 at 12:45 PM
Reposted by Guillaume Plique
Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.

Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.

Vidéo disponible ci-dessous 👇
Retour sur la conférence « Social Science and Generative AI » | médialab Sciences Po
Retrouvez en image la conférence « Social Science and Generative AI: Inquiries, Instruments, Consequences » organisée par le médialab le 5 juin 2025. Des intervenants internationaux ont discuté des qu...
medialab.sciencespo.fr
July 4, 2025 at 11:29 AM
Just released: xan v0.51.0.

Looooots of new features, bugfixes and a novel approach to CSV file single-pass segmentation for map-reduce-like parallel computation over your data!

Check out the changelog over here: github.com/medialab/xan...
Release v0.51.0 · medialab/xan
The parallel update. Breaking Dropping undocumented xan index and related interactions (in xan count, xan sample, xan slice & xan split --jobs). Dropping now useless coalesce moonblade function. x...
github.com
June 30, 2025 at 10:55 AM
Soon: xan sample n -§/--cursed!

What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)
May 15, 2025 at 4:45 PM
Reposted by Guillaume Plique
🔧 Découvrez Xan, l'outil ultime pour dompter vos fichiers CSV en ligne de commande ! Optimisez votre temps 🚀 #CSV #Tech #Productivité
Xan - Un outil surpuissant pour manipuler vos fichiers CSV en ligne de commande | Le site de Korben
Alors on est en 2025 et y’a encore des gens qui utilisent du CSV comme source de données. Non mais “allo quoi” comme on disait en 2013 ! ...
korben.info
March 31, 2025 at 1:55 PM
Reposted by Guillaume Plique
Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷

"The CSV magician"

Version actuelle 0.48.0

👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....
March 31, 2025 at 4:28 PM
Quoting with some image! Alas the fury!
March 31, 2025 at 11:42 AM
But What if you quote a quote? Does it become a quotequote?
Quoting a test is, in itself, a quote.
This here is a test.
March 31, 2025 at 11:41 AM
Quoting a test is, in itself, a quote.
This here is a test.
March 31, 2025 at 11:40 AM
Reposted by Guillaume Plique
New release of xan (v0.48.0) by the research engineering team of the médialab!

Better scraping, smarter CSV commands — and more.

Check it out ⬇️
March 28, 2025 at 10:03 AM
Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.

I just published a guide about how xan does it here: github.com/medialab/xan...
github.com
March 26, 2025 at 4:23 PM
Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!

Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!

github.com/medialab/xan...
GitHub - medialab/xan: The CSV magician
The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.
github.com
March 26, 2025 at 10:53 AM
Reposted by Guillaume Plique
I found the ultimate CLI tool for processing CSV files! 🔥

🪄✨ xan: The CSV magician.

💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.

🦀 Written in Rust & uses @ratatui.rs

⭐ GitHub: github.com/medialab/xan

#rustlang #ratatui #tui #csv #cli #commandline
February 13, 2025 at 11:45 AM
Reposted by Guillaume Plique
Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !

Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)
February 13, 2025 at 10:08 AM
Reposted by Guillaume Plique
Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...

Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!
Search Engines Bookmarklet
medialab.github.io
February 13, 2025 at 10:08 AM
Reposted by Guillaume Plique
Besoin de scraper des moteurs de recherche ?
On vient de refondre notre vieil outil GoogleBookmarklets :
SearchEnginesBookmarklets permet désormais de collecter en CSV des résultats Google, DuckDuckGo, Qwant, Baidu, Google & DuckDuckGo Images & Google Scholar ! medialab.sciencespo.fr/actu/collect...
February 13, 2025 at 10:08 AM
Reposted by Guillaume Plique
Le médialab a répondu en décembre 2024, à la consultation de @ec.europa.eu abordant l’accès des chercheurs aux données des grandes plateformes en ligne et moteurs de recherche via l’Article 40 du Digital Services Act.

Entre transparence, efficacité et accessibilité : Découvrez notre contribution. ⬇️
Accès des chercheurs aux données des plateformes : le médialab contribue à la consultation européenne | médialab Sciences Po
Le médialab a répondu au mois de décembre 2024 à la consultation de la Commission Européenne sur l’implémentation du droit d’accès des chercheurs aux données des grandes plateformes en ligne et moteur...
medialab.sciencespo.fr
January 10, 2025 at 1:59 PM
Just released v0.39.0 of xan, our CSV cli wrangling tool written in Rust! Now supporting probabilistic methods of computing quantiles, cardinality and top-k in constant memory 🔥

github.com/medialab/xan
GitHub - medialab/xan: The CSV magician
The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.
github.com
January 9, 2025 at 5:06 PM
Reposted by Guillaume Plique
Mardi 5/12 à 14h, Robin de Mourat, Clémence Seurat et 
Thomas Tari présenteront leur livre « Le champ des possibles : une enquête collective à Sevranville » au séminaire du #médialab.

Séminaire ouvert à tous ; info et réservation sur medialab.sciencespo.fr/actu/le-cham...
Le champ des possibles : une enquête collective à Sevran | médialab Sciences Po
Robin de Mourat, Clémence Seurat et Thomas Tari présenteront l'ouvrage issu du projet <i>Zone critique – Controverses en action</i> au séminaire du médialab.
medialab.sciencespo.fr
December 1, 2023 at 2:35 PM
This here is a test.
October 10, 2023 at 7:04 PM