The Data Therapist in the Blue Sky
banner
The Data Therapist in the Blue Sky
@datatherapist.bsky.social
#NLP / #NLProc , #dataScience, #AI / #ArtificialIntelligence, #linguistics (#syntax, #semantics, …), occasional #parenting, #gardening, & what not. PhD. Adjunct prof once in a full red moon. Industry / technical mentor. Not my opinion, never my employer’s
אחשלי אתה יודע שבאופן מסורתי #נלפ מתעלם משתיקות,
November 10, 2025 at 4:34 PM
Good evening, #sunset #WestSeattle #Seattle

(No filters) #photo #photography
November 10, 2025 at 1:40 AM
פחות ועדיין,
Are folks still enjoying Bluesky?
November 8, 2025 at 4:49 PM
אם אני לא טועה, היא הופיעה לכמה שניות גם בלול.
Joan Sutherland in her dressing room at the Royal Opera House where she is performing the title role in the opera "Lucia di Lammermoor" - BOTD
November 8, 2025 at 6:18 AM
I have more than a hunch. I actually designed such a custom (small) Agentic planner PL for work, and it works pretty well!
I have a hunch that current LLMs might make it easier to launch a brand new programming language, provided you can describe it in a few thousand tokens and ship it with a compiler and linter that coding agents can use […]
Original post on fedi.simonwillison.net
fedi.simonwillison.net
November 7, 2025 at 7:43 PM
אסון אוסלו
November 7, 2025 at 7:36 PM
A short thriller for #EMNLP2025
Sci-fi short story:
scientist discovers how to create superhuman artificial intelligence (ASI): you need to train your #LLM on deep center embeddings! But scientist is disinterested in this direction.

…So in order to do so, tech bros would need to study #linguistics

Working title: X-Bar X-Risk
Transformer LMs get pretty far by acting like ngram models, so why do they learn syntax? A new paper by sunnytqin.bsky.social, me, and @dmelis.bsky.social illuminates grammar learning in a whirlwind tour of generalization, grokking, training dynamics, memorization, and random variation. #mlsky #nlp
November 6, 2025 at 5:08 AM
Semantic roles

#political #linguistics
Mamdani:
“We won because we insisted that no longer would politics be something that is done to us.

Now, it is something that we do.”
November 6, 2025 at 3:17 AM
איך מתרגמים לאנגלית* מה חשבתם שיצא, קולה?

*) לא מילולית
This really hasn’t gotten enough attention this week.

@wired.com #ICE
www.wired.com/story/fbi-wa...
November 6, 2025 at 3:07 AM
Sci-fi short story:
scientist discovers how to create superhuman artificial intelligence (ASI): you need to train your #LLM on deep center embeddings! But scientist is disinterested in this direction.

…So in order to do so, tech bros would need to study #linguistics

Working title: X-Bar X-Risk
Transformer LMs get pretty far by acting like ngram models, so why do they learn syntax? A new paper by sunnytqin.bsky.social, me, and @dmelis.bsky.social illuminates grammar learning in a whirlwind tour of generalization, grokking, training dynamics, memorization, and random variation. #mlsky #nlp
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization
Language models (LMs), like other neural networks, often favor shortcut heuristics based on surface-level patterns. Although LMs behave like n-gram models early in training, they must eventually learn...
arxiv.org
November 6, 2025 at 12:04 AM
Sulfur + spiders! Even one is enough for a great origin story!
November 5, 2025 at 9:33 PM
חוק 4: רובוט חייב להסיר או לפעול להסרת פוסטים המדברים סרה על מנסח החוקים, ובלבד שפעולה זו אינה עומדת בסתירה לחוק הראשון או לחוק השני או לחוק השלישי.
קשה לבחור רק אחד, אז אני ארמה ואבחר שניים.
מחר כפול תשע / אייזק אסימוב
במבט מפוכח אני יודע שאסימוב לא היה סופר טוב, אבל הספר הזה היה מה שהכניס אותי למד"ב והרעיונות והשאלות שלו מרתקים גם היום.
(המשך בפוסט הבא.)
רוברט סילברברג, מחבר "כנפי לילה", יהיה בן 91 השנה. הוא זכה בהוגו על ב-1969 ולא מפספס אף טקס מ-1953 ועד היום.
הז'אנר השתנה מאוד מאז, ובכל זאת יש ספרים ששמור להם מקום חם בלב שלנו, גם אם לפעמים בכוחה של הנוסטלגיה בלבד.

מה ספר המד"ב הנוסטלגי שלכםן? איך הוא שורד את הזמנים המשתנים?
November 5, 2025 at 8:28 AM
This strikes me as a Marie Kondo approach to retiring LLMs. “We thank the model for all it served us, record its last words, and then pull the plug“.
Anthropic Model Depreciation Process

Anthropic sweetly asked Sonnet about its preferences in how it wanted to be deprecated

in addition:
- no, still not open weights
- preserve weights and keeping it running internally
- letting models pursue their interests

www.anthropic.com/research/dep...
November 5, 2025 at 12:36 AM
O La La Louvre
the password to the louvre surveillance server was "louvre"

www.thesocialpost.it/2025/11/02/f...
November 4, 2025 at 11:05 PM
לימודים באוניברסיטה בינלאומית זו חוויה מדהימה קבועה כי עכשיו נגיד כשדיברתי עם השותפה לעבודה והשתמשתי בALL CAPS וזרקתי משהו על כך שחבל לי שאין את אפשרות הזו בעברית, אז היא קלטה לראשונה בחייה שיש שפות שאי אפשר לכתוב הן ככה.
November 4, 2025 at 10:50 PM
Hey, I just @ you
And this is crazy!
But here’s my handle,
November 4, 2025 at 9:25 PM
The bit16r lesson
November 2, 2025 at 6:16 PM
Dynamics of AI and democracy
( individual human rights )
“ICE officials have told us that an apparent biometric match by Mobile Fortify is a ‘definitive’ determination of a person’s status and that an ICE officer may ignore evidence of American citizenship—including a birth certificate—if the app says the person is an alien”
You Can't Refuse To Be Scanned by ICE's Facial Recognition App, DHS Document Says
Photos captured by Mobile Fortify will be stored for 15 years, regardless of immigration or citizenship status, the document says.
www.404media.co
November 2, 2025 at 5:56 PM
November 2, 2025 at 3:48 AM
Ok, you got my attention
November 2, 2025 at 3:46 AM
I would seriously consider removing the block lists sharing. It was an interesting idea, well motivated, but nevertheless misguided and it backfired
November 1, 2025 at 7:24 PM
Enshigification
Is it just me or has gmail search *also* gotten worse?
November 1, 2025 at 7:11 PM
Meanwhile, due to the recent mass layoffs in Meta, Amazon, and elsewhere in high tech
November 1, 2025 at 6:37 PM
די כבר
קפץ לי ווריד
November 1, 2025 at 4:19 AM
בדיוק היגשתי מאמר על איזה ידע לשוני שהבינמ למדה לא רע, ואפילו הופתענו לטובה.

הצילומסך מזכיר לנו שהדרך עוד ארוך 🤦‍♂️
November 1, 2025 at 4:15 AM