Karuko
k4ruko.bsky.social
Karuko
@k4ruko.bsky.social
Die 5.5 Millionen Dollar für DeepSeek V3 (nicht R1) sind doch im entsprechenden Paper ganz klar dem finalen Trainingslauf zugeordnet. Natürlich haben die auch viel mehr GPUs herumstehen, aber darauf laufen auch noch andere Projekte (und das OpenAI-Thema ist auch nicht ganz so einfach)
February 5, 2025 at 9:14 PM