Lightnews — Scholar-powered news

画像系AIを触ってると、プロンプトに指定した要素をモデルが覚えていないっぽくて空振り多そうでも（ガチャするとまれに出てくるパターン）それに関連したワードを追加で足して寄せたりすると高確率で出てきたりするので、まるで連想するワードを教えて思い出させるみたいな、ヒトに記憶を思い出させてるような感覚に陥ることがままある…

やっぱりAIもヒト脳もこの辺はもしかしたら似たような感じなのではないかと…

March 24, 2025 at 9:01 AM

クロマ@bluesky

@chromarock.bsky.social

NAI v4、condition用にT5が出てきたということはやっぱり最近のDiT+T5 (SD3.5系列)なのかなと

March 11, 2025 at 3:48 AM

クロマ@bluesky

@chromarock.bsky.social

NAIが作ったT5のgithubこれか
github.com/NovelAI/t5

GitHub - NovelAI/t5: Model code for inferencing T5

Model code for inferencing T5. Contribute to NovelAI/t5 development by creating an account on GitHub.

github.com

March 11, 2025 at 3:45 AM

クロマ@bluesky

@chromarock.bsky.social

NAI、謎にV4で使っているT5だけオープンで出してきた
x.com/novelaioffic...

X

x.com

March 11, 2025 at 3:42 AM

クロマ@bluesky

@chromarock.bsky.social

小型LLMを使う問題はうまく回さないとVRAM足らなくなるくらいかねぇ

March 5, 2025 at 12:09 AM

クロマ@bluesky

@chromarock.bsky.social

Sanaも確か小型LLM＋DiTな構成だったような
VAEに独特の特徴があるけど

March 5, 2025 at 12:07 AM

クロマ@bluesky

@chromarock.bsky.social

これもUnetじゃなくてDiT(Transformer系)らしい
TE部分はGLM-4-9Bということで小型LLM？
SD3.5もSanaも確かDiTだしもうDiTの流れなんだろうなと
→
とうとう現れたSDXLの後継？CogView4-6Bを解説する | 動詞
zenn.dev/discus0434/a...

とうとう現れたSDXLの後継？CogView4-6Bを解説する

zenn.dev

March 5, 2025 at 12:06 AM

クロマ@bluesky

@chromarock.bsky.social

これからはComfyUIの時代だなぁと思って、ComfyUIのAPI触ってWebからじゃなくてC++のアプリから動かすやつをC++(With websocket)使ってやったのだけど、これまた資料まじで少ないのでしんどかった…
(A1111は割とかんたんで、すでにできていて色々やれるようになってる)

websocketでやり取りできて、とりあえず形にはなった

February 22, 2025 at 10:43 AM

クロマ@bluesky

@chromarock.bsky.social

最近はOSSを履き違えしている人たちが多くて、無料でなんでもしてくれるみたいなことを思う人も結構居る
こ◎きは際限なく要求してくるからノー(NO!)と言えることが大事

February 14, 2025 at 5:18 AM

クロマ@bluesky

@chromarock.bsky.social

これを見て思ったのだけど、この方は繊細というかサービス精神旺盛だったんだなぁと。。。。
OSS開発者にはある種の図太さが必要
→
marcan.st/2025/02/resi...

Resigning as Asahi Linux project lead

Back in the late 2000s, I was a major contributor to the Wii homebrew scene. At the time, I worked on software (people call them “jailbreaks” these days) to allow users to run their own unofficial app...

marcan.st

February 14, 2025 at 5:17 AM

クロマ@bluesky

@chromarock.bsky.social

noobは後ろに大きなパトロンが居るか、もしくはオタクが狂って全財産投入したんではみたいに思ってる

February 13, 2025 at 1:45 AM

クロマ@bluesky

@chromarock.bsky.social

高性能AIモデルを作ってお披露目するのは、それで商売をするのではなくて、別に本業があって本業で儲かってカネ余ってしょうがないみたいな企業が売名のためにやるくらいしか難しいのではみたいに思ってる
（例えばDeepSeekみたいに…あれは本業が儲かったので作ったっぽいし）

February 13, 2025 at 1:41 AM

クロマ@bluesky

@chromarock.bsky.social

モデルを作るのはお金も時間も手間もかかるわけで、何処かでそれを回収しないといけないのだけど、ずっと回収できないままだと投資している人から詰められるだろうし（あるいは自腹を切ることになる）、AIモデルを作ってそれで商売をするのが如何に難しいかがよくわかる

February 13, 2025 at 1:36 AM

クロマ@bluesky

@chromarock.bsky.social

noobが出てきてかなり使えてしまったことが、Omonの人たちが当初考えていた図と大きな誤算だったんだろうなぁ感はある

Fluxみたいに最低でも1.0、1.1、3.5全部揃えてから「これ有料だけどこれ無料だよ」ってリリースするべきだった
→
Developer of Illustrious model has post a message on Korean website
www.reddit.com/r/StableDiff...

Developer of Illustrious model has post a message on Korean website

www.reddit.com

February 13, 2025 at 1:34 AM