クロマ@bluesky
banner
chromarock.bsky.social
クロマ@bluesky
@chromarock.bsky.social
Programming cat.l love programming.
Native language is c/c++
インターネッツリサーチャー/INTJ-T

https://chromabox.github.io/140m/
Twitter(X)まともに動かんなあ
April 1, 2025 at 1:42 AM
今回OpenAIがお出しになられた生成機能は、これまで出てきたのとはちょっと違ってて割と謎な機構で動いている感あるし、結構GPUパワーつかってそうだよなぁとは思う
March 28, 2025 at 12:00 AM
意外と処理重たいのかなと

ChatGPTの新画像生成、利用急増で無料ユーザー向け延期 「GPUが溶けてる」とCEO - ITmedia NEWS www.itmedia.co.jp/news/article...
ChatGPTの新画像生成、利用急増で無料ユーザー向け延期 「GPUが溶けてる」とCEO
OpenAIは、「ChatGPT」の新たな画像生成機能の無料ユーザーへの提供を延期すると発表した。予想をはるかに上回る人気で、一時的にレート制限を導入するとしている。X上には「ジブリ風」と指定したアニメ画像が多数投稿されている。
www.itmedia.co.jp
March 27, 2025 at 11:58 PM
というかOpenAIがここまでやる前からこうなることはわかっていたわけで、この後に及んで今更たたき棒にするのはどうなんかねぇとは思う
結局叩きたいだけでしょみたいな感
March 27, 2025 at 4:33 AM
画風に著作権が認められるかは結構難しくて、しかも著作権って国によって解釈が違うこともあるからここでも結構ハードルは高い
March 27, 2025 at 4:31 AM
画像系AIを触ってると、プロンプトに指定した要素をモデルが覚えていないっぽくて空振り多そうでも(ガチャするとまれに出てくるパターン)それに関連したワードを追加で足して寄せたりすると高確率で出てきたりするので、まるで連想するワードを教えて思い出させるみたいな、ヒトに記憶を思い出させてるような感覚に陥ることがままある…

やっぱりAIもヒト脳もこの辺はもしかしたら似たような感じなのではないかと…
March 24, 2025 at 9:01 AM
NAI v4、condition用にT5が出てきたということはやっぱり最近のDiT+T5 (SD3.5系列)なのかなと
March 11, 2025 at 3:48 AM
NAIが作ったT5のgithubこれか
github.com/NovelAI/t5
GitHub - NovelAI/t5: Model code for inferencing T5
Model code for inferencing T5. Contribute to NovelAI/t5 development by creating an account on GitHub.
github.com
March 11, 2025 at 3:45 AM
NAI、謎にV4で使っているT5だけオープンで出してきた
x.com/novelaioffic...
X
X
x.com
March 11, 2025 at 3:42 AM
小型LLMを使う問題はうまく回さないとVRAM足らなくなるくらいかねぇ
March 5, 2025 at 12:09 AM
Sanaも確か小型LLM+DiTな構成だったような
VAEに独特の特徴があるけど
March 5, 2025 at 12:07 AM
これもUnetじゃなくてDiT(Transformer系)らしい
TE部分はGLM-4-9Bということで小型LLM?
SD3.5もSanaも確かDiTだしもうDiTの流れなんだろうなと

とうとう現れたSDXLの後継?CogView4-6Bを解説する | 動詞
zenn.dev/discus0434/a...
とうとう現れたSDXLの後継?CogView4-6Bを解説する
zenn.dev
March 5, 2025 at 12:06 AM
これからはComfyUIの時代だなぁと思って、ComfyUIのAPI触ってWebからじゃなくてC++のアプリから動かすやつをC++(With websocket)使ってやったのだけど、これまた資料まじで少ないのでしんどかった…
(A1111は割とかんたんで、すでにできていて色々やれるようになってる)

websocketでやり取りできて、とりあえず形にはなった
February 22, 2025 at 10:43 AM
最近はOSSを履き違えしている人たちが多くて、無料でなんでもしてくれるみたいなことを思う人も結構居る
こ◎きは際限なく要求してくるからノー(NO!)と言えることが大事
February 14, 2025 at 5:18 AM
これを見て思ったのだけど、この方は繊細というかサービス精神旺盛だったんだなぁと。。。。
OSS開発者にはある種の図太さが必要

marcan.st/2025/02/resi...
Resigning as Asahi Linux project lead
Back in the late 2000s, I was a major contributor to the Wii homebrew scene. At the time, I worked on software (people call them “jailbreaks” these days) to allow users to run their own unofficial app...
marcan.st
February 14, 2025 at 5:17 AM
noobは後ろに大きなパトロンが居るか、もしくはオタクが狂って全財産投入したんではみたいに思ってる
February 13, 2025 at 1:45 AM
高性能AIモデルを作ってお披露目するのは、それで商売をするのではなくて、別に本業があって本業で儲かってカネ余ってしょうがないみたいな企業が売名のためにやるくらいしか難しいのではみたいに思ってる
(例えばDeepSeekみたいに…あれは本業が儲かったので作ったっぽいし)
February 13, 2025 at 1:41 AM
モデルを作るのはお金も時間も手間もかかるわけで、何処かでそれを回収しないといけないのだけど、ずっと回収できないままだと投資している人から詰められるだろうし(あるいは自腹を切ることになる)、AIモデルを作ってそれで商売をするのが如何に難しいかがよくわかる
February 13, 2025 at 1:36 AM
noobが出てきてかなり使えてしまったことが、Omonの人たちが当初考えていた図と大きな誤算だったんだろうなぁ感はある

Fluxみたいに最低でも1.0、1.1、3.5全部揃えてから「これ有料だけどこれ無料だよ」ってリリースするべきだった

Developer of Illustrious model has post a message on Korean website
www.reddit.com/r/StableDiff...
Developer of Illustrious model has post a message on Korean website
www.reddit.com
February 13, 2025 at 1:34 AM
モデルを作るのもタダじゃないからねぇ
www.reddit.com/r/StableDiff...
Lmao Illustrious just had a stability AI moment 🤣
www.reddit.com
February 12, 2025 at 3:47 AM
流行りなんで書きました
ローカルLLMデビューしたい

140文字以上: ollamaをUbuntu 24.04 にインストールしてDeepSeek(の量子化モデル)に触れてみる
chromabox.github.io/140m/linux/u...
ollamaをUbuntu 24.04 にインストールしてDeepSeek(の量子化モデル)に触れてみる
chatGPTなどの高性能AIに比類し、しかもそれのモデルが公開されており「ローカルPCでもChatGPTのような高性能LLM動かせるじゃな
chromabox.github.io
February 2, 2025 at 10:27 AM
Animazineを作ったチーム、V4.1を作った後はモデルを作るんじゃなくてノベルゲーを作りたいらしい
モデル作るのにはとにかくお金と時間と手間がかかるから、SD3.5とかこれ以上大きなモデル規模になってくると厳しいからかな

cagliostrolab.net/posts/animag...
Announcing Anim4gine: The Ultimate Rendition of Animagine - CagliostroLab
Cagliostro Research Lab
cagliostrolab.net
January 28, 2025 at 7:44 AM