Yoav Goldberg
yoavgo.bsky.social
Yoav Goldberg
@yoavgo.bsky.social
or as i wrote two years ago:

gist.github.com/yoavg/59d174...
November 16, 2025 at 5:27 PM
הנה מצאתי. תרומתי לאירוע.
November 8, 2025 at 10:21 PM
אגב, הנה מהספר שלו בו הוא מסביר למה 9/11 זה לא ממש טרור, בעצם, אלא מאורע היסטורי בלתי נמנע. תובנה לגבי ישראל:
November 8, 2025 at 2:08 PM
אשים פה את האחרון, מסוף הספר, כטיזר שגם מסכם את העניין:
November 8, 2025 at 12:34 PM
we could probably invent DL without any linalg concepts if these didnt exist. all we need is scalar addition and multiplication (and associated calculus rules). yes, this includes regularization and things like LoRA. figures like the one below kinda proves the point:
July 3, 2025 at 7:38 PM
או "ההסטוריון":
June 14, 2025 at 1:12 PM
הם לא כתבו שהכל שקר. כתבו משהו יותר מורכב מזה. אבל כמובן ש:
June 14, 2025 at 1:09 PM
a good gag from the other social network:
June 8, 2025 at 9:35 PM
this "class 9" is such a cool idea for an LLM course!

(from ufal.mff.cuni.cz/courses/npfl... via @zdenekkasner.bsky.social )
June 8, 2025 at 8:45 PM
(niche) This is a nice paper but it seems they don't really understand what the word "recursive" means for CFGs, and hence their results are significantly weaker than they think.
May 8, 2025 at 8:58 AM
that was also my impression, but then how do you interpret this text?
May 8, 2025 at 4:45 AM
"LLM on way to replace doctors" gets published in Nature.

meanwhile "LLM judgement not as good as human MDs" gets a spot in "Physical Therapy and Rehabilitation Journal".
May 4, 2025 at 3:39 PM
thats the relevant figure from the paper. lying or not?
April 29, 2025 at 5:25 PM
April 10, 2025 at 7:49 AM
so... this is what google image search looks like today for "ghibli style". this is crazy. especially since the few real ones stand out like they do.
March 30, 2025 at 7:42 PM
אין לי מושג אם זה נכון, אבל הנה קלוד 3.7
March 13, 2025 at 6:55 PM
כזה?
March 12, 2025 at 7:37 PM
ניתן על ידי פרומפט נכון להכווין את הכלי לתוצאות שיכולות להיות מדהימות (כמובן שצריך גם להזהר, כי אם יודעים את התשובה ניתן בטעות להזליג אותה למודל בלי לשים לב, ולחשוב שהוא טוב יותר ממה שהוא. אך גם להפך.)
March 12, 2025 at 7:17 PM
one final achievement to go
February 19, 2025 at 2:10 AM
it is apparently not that great at following simple instructions 🤪
January 30, 2025 at 12:12 AM
והנה לשאלת ההמשך:
January 28, 2025 at 7:44 AM
ומה לגבי המודל החושב R1? ובכן, נראה שהוא חוזר אחורה והוא פחות מוצלח מהגרסה השולפת מהמותן שראינו למעלה. הנה התשובה לשאלה הראשונה:
January 28, 2025 at 7:44 AM
ואז ממשיך לתשובה שהיא כל כך כל כך קרובה (שתי השורות האחרונות) אבל גם מצליחה לפספס את זה ש״אזרח ותיק״ ו״אזרח ותיק״ זה בעצם אותו הביטוי (שתי השורות האחרונות). לא ממש מפתיע אותי אבל קצת מצחיק:
January 28, 2025 at 7:44 AM
בואו נראה את הסינים. המודל של deep seek (בלי רכיב ה״חשיבה״ של R1) מתחיל אותו הדבר:
January 28, 2025 at 7:44 AM
והנה הוא מגיב לאפשרות של ״אזרח וגם תיק״:
January 28, 2025 at 7:44 AM