David Graus
banner
graus.nu
David Graus
@graus.nu
Assistant Professor in AI (Information Retrieval and NLP) at ILLC, @uva.nl & ICAI @opengov.nl Lab Manager | PhD from @irlab-amsterdam.bsky.social | Treasurer @setuputrecht.bsky.social | Commissie Persoonsgegevens Amsterdam | https://www.graus.nu
Reposted by David Graus
Can LLMs accurately aggregate information over long, information-dense texts? Not yet…

We introduce Oolong, a dataset of simple-to-verify information aggregation questions over long inputs. No model achieves >50% accuracy at 128K on Oolong!
November 7, 2025 at 5:07 PM
Ben benieuwd! Of dat dus gewoon kan zal de komende maanden moeten blijken, me dunkt.
Internationaal Strafhof dumpt Microsoft
en kiest voor Europees alternatief
zodat Trump niet met druk op de knop
ze uit hun systemen en data kan gooien tweakers.net/nieuws/24095...

DAT KAN DUS GEWOON!!
🧵/1 #Tech #ICT #MS
November 6, 2025 at 12:26 PM
Reposted by David Graus
Built on top of WooGLe, it shows how LLMs can assist government search, not replace it. Read the full recap by @maiklarooij.nl: opengov.nl/blog/2025/11...
November 6, 2025 at 8:34 AM
Whenever I participate in hackathons I bring a hidden agenda of re-introducing 80s Information Retrieval methods (pseudo-relevance feedback!) repackaged with LLMs into shiny-looking interfaces!

Here, too, ✅ success.
We joined the “Terminal Woo” hackathon at the Fokker Terminal with @opengov.nl; pitching an IR-inspired fix for a real problem in Dutch FOIA (Woo) search.
November 6, 2025 at 9:38 AM
Reposted by David Graus
We joined the “Terminal Woo” hackathon at the Fokker Terminal with @opengov.nl; pitching an IR-inspired fix for a real problem in Dutch FOIA (Woo) search.
November 6, 2025 at 8:34 AM
Reposted by David Graus
We attended the @uva.nl thesis fairs! Read @maiklarooij.nl's writeup on @opengov.nl: opengov.nl/blog/2025/10...
November 3, 2025 at 9:13 PM
Dit is zo'n belangrijk inzicht! Tegenwicht voor zowel AI doomers (AI is slecht) als AI boosters (zet je schrap voor AGI): beiden zitten er natuurlijk naast!

"als we incalculeren dat AI fundamenteel onbetrouwbaar is, kan het ook heel nuttig zijn, zegt Wiggers"
www.trouw.nl/duurzaamheid...
Vertrouw AI-taalmodellen niet, waarschuwt deze expert. ‘Ze zijn fantastisch, maar tegelijk heel dom.’
Kunstmatig intelligente taalmodellen zoals ChatGPT zijn fundamenteel onbetrouwbaar, zegt lector Pascal Wiggers. “Maar als je dat weet, kunnen ze best handig zijn.”
www.trouw.nl
October 30, 2025 at 9:06 AM
Reposted by David Graus
In short, the ANES data shows:
📉 Social media use is shrinking
💥 Twitter/X posting has moved ~50 points to the right
🧩 Platforms are splintering
🔊 Fewer people are talking — but those still talking are more politically extreme
October 30, 2025 at 8:09 AM
Als OpenGovver erger ik me kapot aan documenten die nauwelijks naar buiten komen!
October 29, 2025 at 6:48 PM
Reposted by David Graus
Voor in het achterhoofd: peilingen kunnen er *flink* naast zitten. De slotpeiling van 2023 zat er 24 zetels naast (hallo.)

Uit het Algemeen Dagblad: www.ad.nl/politiek/paa...
October 26, 2025 at 11:14 AM
Dit ziet er echt ongezellig uit. Blij dat ik het niet heb gezien! Volgende keer kijk ik ook niet.
October 23, 2025 at 8:37 PM
Reposted by David Graus
22 news organizations, including BBC, just released damning research on AI assistants' news accuracy.

Results: across 4 LLMS, 45% of responses contained
at least one significant issue of any type. Sourcing is the single
biggest cause of significant issues (31%) 🤐🤐
www.ebu.ch/Report/MIS-B...
October 22, 2025 at 5:17 AM
Hoera het plan werkt. Moet je ze toch nageven (?)

nos.nl/artikel/2587...
Voor het eerst in jaren minder internationale studenten in hoger onderwijs
De afgelopen tien jaar verdubbelde het aantal bachelorstudenten, maar nu neemt hun aantal af, door verschillende maatregelen.
nos.nl
October 21, 2025 at 3:08 PM
Reposted by David Graus
Wel fijn dat je feature requests tegenwoordig ook in de krant kwijt kunt
October 18, 2025 at 12:57 PM
Georganiseerd door (o.a.) @setuputrecht.bsky.social! Komt dat zien 👇🏻
October 18, 2025 at 12:23 PM
Ik weet dat archiefmensen dol zijn op expliciete structuur, documenten in bakjes stoppen, en in- en uitklapbare inventarissen, maar natuurlijk moeten we zo'n prachtig archief volledig ontsluiten obv (semantic) search, learning to rank, en andere hedendaagse zoekmethoden! Ja of ja?!
October 18, 2025 at 9:28 AM
Reposted by David Graus
Novel approach adopted by a one govt department re: FOI redactions.

The blacked out redactions are now whited out redactions.

Makes it less embarrassing for them I guess.
October 15, 2025 at 11:51 PM
Reposted by David Graus
Looking forward to this!
Students @uva.nl in #AI, #datascience, and computer science: come meet us at the (AI) Thesis Fairs this Friday, October 17th and talk about our #OpenGov MSc thesis projects! opengov.nl/events/2025/...
October 13, 2025 at 9:53 AM
This 👇
One more thought: AI tools are a very useful research accelerator for an expert, and I plan to use them whenever I can. But at the moment it is very easy to be led down false paths if you let them get ahead of yourself and lure you too far from your expertise.
October 8, 2025 at 10:29 AM
Reposted by David Graus
Congrats to Floris Bos (not pictured), who won the Best Short Paper Award at #TPDL2025 (Tampere 🇫🇮) for his @opengov.nl MSc thesis “Linking References to Documents in Parliamentary Debates.”
Paper co-authored with Marc van Opijnen & Maarten Marx (who received the award). #OpenGov
September 26, 2025 at 7:11 AM
Reposted by David Graus
And new paper out: Pleias 1.0: the First Family of Language Models Trained on Fully Open Data

How we train an open everything model on a new pretraining environment with releasable data (Common Corpus) with an open source framework (Nanotron from HuggingFace).

www.sciencedirect.com/science/arti...
September 27, 2025 at 11:44 AM
🤩
Lab Swag!
September 25, 2025 at 3:46 PM