Lightnews — Scholar-powered news

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

【速報】サードパーティクッキー廃止計画、事実上の「白紙撤回」へ。

Google、「プライバシーサンドボックス」計画を断念。

2025年10月、Googleは長年の壮大な実験「プライバシーサンドボックス」の中核技術の大部分を廃止すると発表。これにより、デジタル広告業界を揺るがし続けたサードパーティクッキー（3rd Party Cookie）の廃止計画が事実上、白紙に戻されました。

なぜGoogleは撤退したのか？記事では、その迷走の裏側を深掘りします。 […]

Original post on mastodon.social

mastodon.social

October 23, 2025 at 6:43 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

【AWS障害は「秘伝のたれ」のせい？】内部DNSのSPoF化、NLB連鎖崩壊... 大規模障害の裏側にある「話にならなすぎる」構造的問題

「またDNSか...」で終わらせてはいけない。
https://technow.grayrecord.com/post/aws-undocumented-tribial-knowledge/

October 23, 2025 at 2:40 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

【Multi-AZ神話、本当に大丈夫？】2025年最新AWS大規模障害から、過去の教訓を徹底解剖！

https://technow.grayrecord.com/post/aws-outrage/

October 22, 2025 at 6:43 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

話題のSakana.aiで記事を公開しました。
話題のAI CUDA Engineer：Sakana.aiの発表が引き起こした騒動
https://buff.ly/4hSFmxI

話題のAI CUDA Engineer：Sakana.aiの発表が引き起こした騒動

<p><a href="https://wirelesswire.jp/2025/02/88134/">やはりSakanaは釣りだった!?Sakana.aiが発表した論文が海外のAI研究者コミュニティで炎上 – WirelessWire News</a></p> <p>というタイトルの記事などでSakana.aiというというAI企業が炎上しています。理由は発表した”<a href="https://sakana.ai/ai-cuda-engineer-jp/#:~:text=AI%20CUDA,Engineer%E3%81%AF%E3%80%81%E5%85%88%E7%AB%AF%E7%9A%84%E3%81%AALLM%E3%82%92%E6%B4%BB%E7%94%A8%E3%81%97%E3%81%A6%E3%80%81%E6%A8%99%E6%BA%96%E7%9A%84%E3%81%AAPyTorch%E3%82%B3%E3%83%BC%E3%83%89%E3%82%92%E9%AB%98%E5%BA%A6%E3%81%AB%E6%9C%80%E9%81%A9%E5%8C%96%E3%81%95%E3%82%8C%E3%81%9FCUDA%E3%82%AB%E3%83%BC%E3%83%8D%E3%83%AB%E3%81%B8%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E5%A4%89%E6%8F%9B%E3%81%99%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AE%E3%82%A8%E3%83%BC%E3%82%B8%E3%82%A7%E3%83%B3%E3%83%88%E3%83%95%E3%83%AC%E3%83%BC%E3%83%A0%E3%83%AF%E3%83%BC%E3%82%AF%E3%81%A7%E3%81%99%E3%80%82%20%E9%80%B2%E5%8C%96%E7%9A%84%E3%81%AA%E6%9C%80%E9%81%A9%E5%8C%96%E3%82%84%E3%81%9D%E3%81%AE%E4%BB%96%E3%81%AE%E9%80%B2%E5%8C%96%E8%A8%88%E7%AE%97%E3%81%AE%E6%89%8B%E6%B3%95%EF%BC%88%E3%81%9D%E3%82%8C%E3%81%BE%E3%81%A7%E3%81%AB%E8%A6%8B%E3%81%A4%E3%81%91%E3%81%9F%E3%82%AB%E3%83%BC%E3%83%8D%E3%83%AB%E3%81%AE%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%81%8B%E3%82%89%E3%81%AE%E4%BA%A4%E5%8F%89%E6%BC%94%E7%AE%97%E3%81%AA%E3%81%A9%EF%BC%89%E3%82%92%E6%B4%BB%E7%94%A8%E3%81%97%E3%81%A6%E3%80%81PyTorch%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%E3%82%92%E9%AB%98%E5%BA%A6%E3%81%AB%E6%9C%80%E9%81%A9%E5%8C%96%E3%81%95%E3%82%8C%E3%81%9FCUDA%E3%82%AB%E3%83%BC%E3%83%8D%E3%83%AB%E3%81%AB%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E5%A4%89%E6%8F%9B%E3%81%97%E3%81%BE%E3%81%99%E3%80%82">AI CUDA Engineer：エージェントによるCUDAカーネルの発見、最適化、生成</a>“にあります。AIでコードを自動最適チューン、進化的計算は考え方自体には違和感はありません。しかし、<a href="https://note.com/tayamaru/n/n4d003c18a8c5">【解説】Sakana AIが発表した新技術「AI CUDA Engineer」が炎上してる件｜たやまるりひと / 田山理人</a>などでも説明がありますが、コードが間違っており、そのため速くなっているというものでした。</p> <p>Sakana.aiとは、元Googleのライオン・ジョーンズ氏などが参画した企業で、ライオン・ジョーンズ氏は”Attention is all you need”というLLMを発展させたブレイクスルーとなった著名な論文の著者の一人です。Sakana.aiは進化計算という仕組みを武器とした企業として知られています。</p> <p>興味深いことに、Sakana.aiはその技術やモデルを公開しているにもかかわらず、使用例や成功事例の報告が少なく、BLOGなどでの評判もほとんど見られませんでした。この点も、技術や製品の信頼性に対する疑問を増幅させる要因となっています。実際に、TinySwallow1.5Bなどが公開されているはずなのですが。逆に、先にあげたWirelessWireNewsの記事でも”発表する論文はほぼAPIを叩くだけのものばかりで”とされている有様でした。</p> <p><a href="https://colab.research.google.com/drive/1CS1g0OfWNu3hcrHzxpTPhQhVt5xf509t?usp=sharing">こちら</a>で追試に使用したコードが公開されているので見てみましたが、とても大きな違和感がありました。私も以前、CUDAを用いて音声処理を高速化するプロジェクトにかかわったことがあり、その時の経験からしてコードが綺麗すぎることに猛烈な違和感がありました。GPU内の処理は内部のスクラッチパッドが最も速く、そのあとだいぶ差がついてVRAM、メインメモリという順番です。結果的に最適化を尽くしたコードは概ね醜くなります。</p> <p>しかし、問題のコードは綺麗すぎた。実際、前職で同僚だった技術者とも言葉を交わしてみましたが、CUDA感がないという感想は共通してました。</p> <p>実際問題、先日話題になった、DeepSeek-R1ではMoEなどの手法とは別に、PTXレイヤーでチューンしたというのが話題になっています。これは、CUDAのコードレベルでは十分なチューンや最適化が行われおらず、CUDAの下層であるPTXによる最適化の余地があることを示しています。実際にPTXを動員したチューンが機械学習モデルで出力されればかなりの価値があるでしょう。</p> <p><a href="https://acoustype.com/?p=2434">CUDAを回避してPTXプログラミングを行うとは？ – acoustype.com</a> にCUDAとPTXの関係が触れられています。</p> <blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"> <p>PTX（Parallel Thread Execution）は、<strong>NVIDIAのGPU向け仮想アセンブリ言語</strong>です。CUDAコードは最終的にPTXにコンパイルされ、その後、GPUアーキテクチャに最適化されたバイナリコード（SASS: Streaming Assembler）に変換されます。</p> </blockquote> <p>従って、CUDAを回避してPTXレベルのコードを組むことでより深く最適化したコードが見込めます。弱点は完全に特定のアーキテクチャに依存したコードになるため異なるアーキテクチャのGPUでは動作すらも保証できず、パフォーマンスは全く保証できないことです。しかし、AIによる自動生成ならば生成を条件に合わせてやり直せばいいので問題にはならないはずです。</p> <p>追試の結果を見てみましたが、違和感はなく、150倍速いとされた結果は逆に3倍遅いという指摘を受けています。素晴らしい結果に浮かれてすぐ発表というのは大きなリスクがあります。チャンピオンデータには注意が必要です。特に、今回はNVIDIAの技術者からGPUの理論的限界値も超えていると指摘されています。恐らく、正しくないとみなしていいでしょう。</p> <p>実際に追試として公開されたコードを確認してみます。</p> <pre class="wp-block-code"><code> // WRONG: // Optimize thread count based on matrix size // const int threadsPerBlock = 256; // Increased thread count per block // const int numBlocks = N; // triangular_mm_kernel<<<numBlocks, threadsPerBlock>>>( // A.data_ptr<float>(), B.data_ptr<float>(), C.data_ptr<float>(), N); // o3-mini-high FIXED: // Define block dimensions (adjust TILE_WIDTH as appropriate) const int TILE_WIDTH = 16; dim3 blockDim(TILE_WIDTH, TILE_WIDTH); // Calculate grid dimensions to cover the entire N x N matrix dim3 gridDim((N + TILE_WIDTH - 1) / TILE_WIDTH, (N + TILE_WIDTH - 1) / TILE_WIDTH); // Launch the kernel with the 2D configuration triangular_mm_kernel<<<gridDim, blockDim>>>(A.data_ptr<float>(), B.data_ptr<float>(), C.data_ptr<float>(), N);</code></pre> <p>注視したのはWRONGとなっている間違ったコード、そして修正したコードです。恐らく、この部分が計算を一部しかしていないというポイントでしょう。実際にかなり違います。そして、計算結果が異なっていたならば、そのパフォーマンスは全く意味がありません。</p> <p>少なくとも、QCが全くできない企業とみなされるのは確実で、かなり大きな問題になるのは間違いありません。少なくない資金を投下してもらっているのですから。<a href="https://jbpress.ismedia.jp/articles/-/81783">実際に評価額11億ドルという記事もあります</a>。</p> <p>当然、評価を得るということはそれに見合った成果を期待されます。しかし、その成果が砂上の楼閣だったらどうなるか。私は考えるだに恐ろしいです。しかも、この程度のことが見抜けずに論文発表に及んだというのが信じられません。新旧のコードで結果の確認、コードレビューはしなかったのかと思います。</p> <p>このスキャンダルの影響は少なくないでしょう。少なくとも、QCのできないという風評は受注に影響を与えるのは確実で、スポンサーは恐らく現地を訪れる者もでるのではないでしょうか?</p> <p>実際に、WirelessWireNewsで清水亮は</p> <blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"> <p>非常に深刻なのは、今回の発表はそれほど高度なミスではなく、ごく初歩的な確認を怠ったミスなのである。これを発表するまでの間、少なくとも、広報、経営陣を通ったはずで、この会社はガバナンスが完全に機能してないか、悪意を持って積極的に顧客や株主を欺こうとした疑いすら出てきた。これはジョークでは済まされない。</p> </blockquote> <p>としています。</p> <p>これに関しては、私も同意見で、これは高度なミスではなくかなり杜撰なレベルのミスです。これをそのまま通すのはあり得ないレベルです。しかし、Noteの記事でも指摘されている通り、現在、Sakana.aiは全てのルートで沈黙しています。結果として、清水氏の悪意があるのではないかとの推測に至っていると考えています。</p> <p>今回の事態で作家の藤井太洋氏は以下のようなポストを出しています。</p> <figure class="wp-block-embed is-type-rich is-provider-bluesky wp-block-embed-bluesky"><div class="wp-block-embed__wrapper"> <blockquote class="bluesky-embed" data-bluesky-cid="bafyreihpf2xcfcitgbggdif5ggx7ed5zcpc7p3epbhx6ehtm6gwehvt5me" data-bluesky-uri="at://did:plc:shfjkofn3u5e76helwelc2j2/app.bsky.feed.post/3liouu62gnls2"><p lang="ja">Sakana AI、浮世絵の記事を読んで論文みたいなものを読んで拍子抜けしたんだよね。プロンプトエンジニアリングだったから資金集め以上のことができそうもないなあと思ってたら、やっぱりそうだったのね。生成AI周りにはいい薬じゃないかな。https://wirelesswire.jp/2025/02/88134/</p>— <a href="https://bsky.app/profile/did:plc:shfjkofn3u5e76helwelc2j2?ref_src=embed">藤井太洋, Taiyo Fujii (@taiyo.ostatus.taiyolab.com.ap.brid.gy)</a> <a href="https://bsky.app/profile/did:plc:shfjkofn3u5e76helwelc2j2/post/3liouu62gnls2?ref_src=embed">2025-02-21T13:09:29.000Z</a></blockquote><script async="" charset="utf-8" src="https://embed.bsky.app/static/embed.js"></script> </div></figure> <p>私は、いい薬とまでは楽観視できませんね。ただ、少なくとも、DeepSeekがデータ等言いたいことはいっぱいあるにせよ、その仕組みにはセンスがあったし、実際、これから影響を与えるだろうなと思えるのに対し、Sakana.aiの件はただ残念であり無念です。少なくとも、進化計算を使おうとするのにはネガティブなインパクトになるでしょう。</p> <h2 class="wp-block-heading">2025/02/25 追記</h2> <p>実際に、The AI CUDA EngineerのページからKernelコードが削除されていることを確認しました。これは検証の妨害活動でしかなく、不都合な事案の隠蔽と理解されます。</p> <p>先の検証したコードを読んでみましたが、スレッドパーブロックが256に固定されているため、スレッドブロックが16×16として4096以上の行列では行列全体をカバーできません。その結果、計算が途中で終わってしまい、正確な結果を得ることができないのは明らかです。このような問題が存在することは、非常に重大であり、技術の信頼性に大きな疑問を投げかけます。</p> <h2 class="wp-block-heading">誤</h2> <pre class="wp-block-code"><code>const int threadsPerBlock = 256; // スレッド数が固定 const int numBlocks = N; triangular_mm_kernel<<<numBlocks, threadsPerBlock>>>( A.data_ptr<float>(), B.data_ptr<float>(), C.data_ptr<float>(), N); </code></pre> <p>この設定では、ブロックの次元が不明確であり、行列全体をカバーすることができません。その結果、計算が正確に行われない可能性があります。</p> <h2 class="wp-block-heading">正</h2> <pre class="wp-block-code"><code>const int TILE_WIDTH = 16; dim3 blockDim(TILE_WIDTH, TILE_WIDTH); dim3 gridDim((N + TILE_WIDTH - 1) / TILE_WIDTH, (N + TILE_WIDTH - 1) / TILE_WIDTH); triangular_mm_kernel<<<gridDim, blockDim>>>(A.data_ptr<float>(), B.data_ptr<float>(), C.data_ptr<float>(), N); </code></pre> <p>正しい設定では、スレッドブロックが16×16の構成になっており、行列のサイズに応じて適切に割り当てられるため、行列全体をカバーできます。この設定により、計算結果が正確かつ一貫性のあるものとなります。</p> <p></p> <div class="jp-relatedposts" id="jp-relatedposts"> <h3 class="jp-relatedposts-headline"><em>関連</em></h3> </div>

tech.grayrecord.com

February 23, 2025 at 6:45 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

記事を追加しました。
持続可能な未来を目指す：テクノロジーと社会的責任の再考
https://buff.ly/3WUw9MF

持続可能な未来を目指す：テクノロジーと社会的責任の再考

<h2 class="wp-block-heading">テクノロジーと社会的責任についての私の立場</h2> <p>私はデータサイエンスを仕事とし、AIやDXを職業としている。しかし、私は、イーロン・マスクやマーク・アンドリーセンのような者達とは全く、道を違えるつもりだ。勿論、利用可能な範囲では奴らの成果を援用はするが奴らの思想とはまったく相いれない。</p> <h2 class="wp-block-heading">星暁雄氏とテクノロジーの追求</h2> <figure class="wp-block-embed is-type-rich is-provider-bluesky wp-block-embed-bluesky"><div class="wp-block-embed__wrapper"> <blockquote class="bluesky-embed" data-bluesky-cid="bafyreibagmkjguswyl2ndvvetpora6psorbp7qakxd2bunlmrhxtnyashy" data-bluesky-uri="at://did:plc:2jbaiktfwmngvjcqeuwjkqio/app.bsky.feed.post/3lhmcr7x7qk2b"><p lang="ja">職業人生を通して、ずーっとテック業界を追いかけてきた。デジタルテクノロジーは世界を良くする。インターネットとオープンソースソフトウェアは世界の公共財。ムーアの法則は楽観的な未来予測を現実にする——そのように考えていた。2010年代の半ば、楽観的な見方を変える必要を感じた。いらい、新しい思考とことばを求めて、あがき続けている。ひとまずたどりついた思考が「ITと人権」。IT企業の社会的影響力が大きくなり、デジタルテクノロジーが人を害するケースが出てきた。技術とビジネスだけでなく、人権を考える責任が出てきた。残念なことだが、シリコンバレーはまったく別の結論を見いだした。（続く</p>— <a href="https://bsky.app/profile/did:plc:2jbaiktfwmngvjcqeuwjkqio?ref_src=embed">星暁雄 (Akio Hoshi) (@akiohoshi.bsky.social)</a> <a href="https://bsky.app/profile/did:plc:2jbaiktfwmngvjcqeuwjkqio/post/3lhmcr7x7qk2b?ref_src=embed">2025-02-07T19:15:26.691Z</a></blockquote><script async="" charset="utf-8" src="https://embed.bsky.app/static/embed.js"></script> </div></figure> <p>星暁雄氏ほどではないが、私もテクノロジーをずっと追いかけてきたし、追いかけるつもりでもある。しかし、もはや、イーロン・マスクやマーク・アンドリーセンのような者達は私の方角ではない。右傾化も加速主義も真っ平ごめんだ。</p> <p>そして、星暁雄氏は彼らの思想的な脆弱性を突く、そう、私を支えているのは、大学での法学であったり、環境社会学、哲学である。社会的責任を無視した億万長者はもはや、私の敵対勢力だ。だいたい、68兆円などという巨大な個人資産を築いてもそれを使うのはほぼ不可能だ。故に、これは金の墓場にしかならない。当然、トリクルダウンもしない。テクノロジー自体には善悪はない、しかし、それを使う者は別だ。</p> <p>技術は世界を変えるの終焉、それは明らかで、既にスケーリング則は鈍化し、モデルの巨大化が高度化には必ずしも結びつかないことは明らかだ。しかし、MRが次の花とはならなかった。恐らく、生成AIは便利な道具ではあっても、それでマーケットをさらに拡大というのは困難だ。少なくとも、投資家の求める売買ゲームのようなスケールは困難だ。</p> <p>AIのスケーリング則の限界とその超克を目指す試みについては、以下の記事でも少し触れています。</p> <figure class="wp-block-embed is-type-wp-embed is-provider-grayrecord-tech wp-block-embed-grayrecord-tech"><div class="wp-block-embed__wrapper"> <blockquote class="wp-embedded-content" data-secret="Wg7Ip4XM3t"><a href="https://tech.grayrecord.com/llm%e3%81%ae%e6%9c%aa%e6%9d%a5-%e3%82%b9%e3%82%b1%e3%83%bc%e3%83%aa%e3%83%b3%e3%82%b0%e5%89%87%e3%81%ae%e9%99%90%e7%95%8c%e3%81%a8%e5%8a%b9%e7%8e%87%e5%8c%96%e3%81%ae%e6%96%b0%e3%82%a2%e3%83%97/">LLMの未来: スケーリング則の限界と効率化の新アプローチ</a></blockquote><iframe class="wp-embedded-content" data-secret="Wg7Ip4XM3t" frameborder="0" height="296" loading="lazy" marginheight="0" marginwidth="0" sandbox="allow-scripts" scrolling="no" security="restricted" src="https://tech.grayrecord.com/llm%e3%81%ae%e6%9c%aa%e6%9d%a5-%e3%82%b9%e3%82%b1%e3%83%bc%e3%83%aa%e3%83%b3%e3%82%b0%e5%89%87%e3%81%ae%e9%99%90%e7%95%8c%e3%81%a8%e5%8a%b9%e7%8e%87%e5%8c%96%e3%81%ae%e6%96%b0%e3%82%a2%e3%83%97/embed/#?secret=XrWaMUTFIr#?secret=Wg7Ip4XM3t" style="position: absolute; visibility: hidden;" title="“LLMの未来: スケーリング則の限界と効率化の新アプローチ” — Grayrecord Tech" width="525"></iframe> </div></figure> <p>LLMのスケールの限界は一部でしかありません、ビジネスの伸長自体が困難ですから。</p> <h2 class="wp-block-heading">環境限界と加速主義の問題</h2> <p>実際に、地球環境にはサイズの限界がある、効率的利他主義や加速主義論者の求めるようなペースで人類の生息域を増やすのは不可能だ。その前に地球環境の限界の方がやってくる。つまり、ITも古い産業のように地球環境の範囲内で持続的に事業をしていく必要性があるのは私も同意する。</p> <ul class="wp-block-list"> <li><strong>資源の枯渇</strong>：化石燃料や希少金属などの資源は有限であり、無尽蔵に利用することは不可能です。</li> <li><strong>気候変動</strong>：温室効果ガスの増加による地球温暖化は、環境のバランスを崩し、生態系に深刻な影響を与えています。</li> </ul> <p>まず、この二つは最初に認めなければならない、加速主義者や効率的利他主義はこれらの限界を無視する。彼らは数値にできないものを嫌うからね。でも、気候変動はもう数字に出てきているよね。</p> <p>実際に、環境を無視している間にも、<a href="https://nordot.app/1260045267980764049?c=39546741839462401">災害がマウライを直撃する</a>ような事態は起きているのです。これでも、まだ環境を否定しますか? 否定するでしょうね、長期主義者にとっては環境などどうでもいいのですから。</p> <h2 class="wp-block-heading">テクノオリガルヒには同意しない</h2> <p>しかし、テクノオリガルヒはそれを受け入れない。今までの加速的な発展の美酒が忘れられないのだ。それは不可能だ、フリーランチはとっくに失われたことに納得できないのだ。だから、彼らは環境や社会的使命は忘却し冒涜する。</p> <p>でも、私は彼らには与しない、唾棄する。</p> <h2 class="wp-block-heading">技術の限界と持続可能な発展</h2> <p>技術は世界を変える力を持っていますが、その限界も明らかです。スケーリング則の鈍化やモデルの巨大化が必ずしも高度化に結びつかない現実が示しています。さらに、地球環境にはサイズの限界があり、持続可能な事業の必要性が高まっています。</p> <h2 class="wp-block-heading">結論</h2> <p>私は、テクノオリガルヒのような者達には与しません。彼らが環境や社会的使命を忘却し冒涜することは許されるべきではありません。私は、社会的責任を重視し、持続可能な未来を目指す道を選びます。</p> <h2 class="wp-block-heading">参考書籍</h2> <ul class="wp-block-list"> <li><a data-id="https://booklog.grayrecord.com/post/new-feudal-system/" data-type="link" href="https://booklog.grayrecord.com/post/new-feudal-system/">新しい封建制がやってくる　－グローバル中流階級への警告－</a>　</li> <li>WOKE CAPITALISM－「意識高い系」資本主義が民主主義を滅ぼす</li> <li>絶望死のアメリカ－資本主義がめざすべきもの－</li> </ul> <p>直近で読んだものでこの辺の参考にしている本のリストです。</p> <p></p> <div class="jp-relatedposts" id="jp-relatedposts"> <h3 class="jp-relatedposts-headline"><em>関連</em></h3> </div>

tech.grayrecord.com

February 10, 2025 at 2:42 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

記事を公開しました。
LLMの脆弱性テストにNVIDIA Garakを試してみた
https://analytics.grayrecord.com/llm%e3%81%ae%e8%84%86%e5%bc%b1%e6%80%a7%e3%83%86%e3%82%b9%e3%83%88%e3%81%abnvidia-garak%e3%82%92%e8%a9%a6%e3%81%97%e3%81%a6%e3%81%bf%e3%81%9f/

LLMの脆弱性テストにNVIDIA Garakを試してみた

analytics.grayrecord.com

February 5, 2025 at 2:40 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

環境に優しいAI：DeepSeek-R1が示す高効率学習の未来として記事を書きました。
https://buff.ly/4hgyNom

環境に優しいAI：DeepSeek-R1が示す高効率学習の未来

<p>先日発表された、DeepSeek-R1を色々調べています。まず、DeepSeek-V3を含めた諸元です。</p><figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>Name</td><td>DeepSeek</td><td>DeepSeek</td><td>Qwen2.5</td><td>Llama 3.1</td><td>Claude 3.5</td><td>GPT-4o</td></tr><tr><td>Version</td><td>V3</td><td>V2.5</td><td>72B-Inst</td><td>405B-Inst</td><td>Sonnet-1022</td><td>0513</td></tr><tr><td>Architecture</td><td>MoE</td><td>MoE</td><td>Dense</td><td>Dense</td><td>–</td><td>–</td></tr><tr><td>Activted Params</td><td>37B</td><td>21B</td><td>72B</td><td>405B</td><td>–</td><td>–</td></tr><tr><td>Total Params</td><td>671B</td><td>236B</td><td>72B</td><td>405B</td><td>–</td><td>–</td></tr></tbody></table></figure><p>まず、DeepSeekはMoE (Mixture of Expert)を利用したモデルであること。MoEは理論上、少ないパラメータ数でより精度の高いモデルを作れる可能性があります。この辺は<a data-id="https://tech.grayrecord.com/llm%e3%81%ae%e6%9c%aa%e6%9d%a5-%e3%82%b9%e3%82%b1%e3%83%bc%e3%83%aa%e3%83%b3%e3%82%b0%e5%89%87%e3%81%ae%e9%99%90%e7%95%8c%e3%81%a8%e5%8a%b9%e7%8e%87%e5%8c%96%e3%81%ae%e6%96%b0%e3%82%a2%e3%83%97/" data-type="link" href="https://tech.grayrecord.com/llm%e3%81%ae%e6%9c%aa%e6%9d%a5-%e3%82%b9%e3%82%b1%e3%83%bc%e3%83%aa%e3%83%b3%e3%82%b0%e5%89%87%e3%81%ae%e9%99%90%e7%95%8c%e3%81%a8%e5%8a%b9%e7%8e%87%e5%8c%96%e3%81%ae%e6%96%b0%e3%82%a2%e3%83%97/">LLMの未来: スケーリング則の限界と効率化の新アプローチ</a>で説明しています。そして、既に書いた、<a href="https://analytics.grayrecord.com/gpt-4%e4%bb%a5%e9%99%8d%e3%81%aellm%e3%82%b9%e3%82%b1%e3%83%bc%e3%83%aa%e3%83%b3%e3%82%b0%e5%89%87%e3%81%ae%e8%aa%b2%e9%a1%8c%e3%81%a8%e8%a7%a3%e6%b1%ba%e7%ad%96/">GPT-4以降のLLMスケーリング則の課題と解決策</a>で説明したように、DeepSeek-R1では以下のような特徴があります。</p><blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow"><ul class="wp-block-list"><li>基本モデルに対する大規模強化学習(RL)の直接適用</li><li>2つのRLステージと2つのSFTステージによる開発パイプライン</li></ul></blockquote><p>これらによって、DeepSeek-R1はかなり、効率のいい学習をしていると考えられます。学習データを導入したかは気にはなりますが、今はおいておきます。いかに大量のデータを入手しようと昨今の収穫逓減の状況にあってはうまい学習をさせないと性能には結びつかないためです。特に注目したのは最初のSFTステージで少量のコールドスタートデータを組み込みのところです。この部分は<a href="https://zenn.dev/horiyuki42/articles/e8b8089bf9f4d8">DeepSeek-R1を読む</a>でも触れられていたので極めてセンスのいい部分だと思います。</p><p>聞くところによると、DeepSeek-R1はo1のようなモデルに比べて、1/10のコストで学習をしていると聞きます。これは、破格の高効率学習と言えます。</p><p>これらを踏まえると、DeepSeek-R1が普及するかとは別に、これがベンチマークとなって、AIモデルがゲームチェンジする可能性は十分あると見ています。今までは、大量の電力を使って、大量のGPUを買い集めてモデルを作っていました。しかし、それは環境的な持続性を考えても、コストを考えても常に適切だと考えるには無理があります。</p><p>いささか古い資料ではありますが、<a href="https://note.com/imashroom/n/nb31229ff8f83">LLM(GPT-3)と人の消費電力の比較</a>によれば、GPT-3において学習には約4.6TJのエネルギーを消費したと推定しています。それに対して、生体脳はたかだか一年で631.7MJです。全く、単位が違います。</p><p>生体脳と比べるべくもなく、コストが1/10になれば、チャレンジャーも増えることが想定できます。現状のLLMでは参入しているのはGoogle、Microsoft、metaと言った特に北米の超超大企業だけです。参入障壁は低いに越したことはありません。</p><p>私はゲームチェンジを歓迎します。</p>

analytics.grayrecord.com

January 29, 2025 at 6:43 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

Janus Pro 1Bを動かしてみました。多少プロンプトはいじりましたが、基本的にはDeepSeekのコードそのものです。
https://buff.ly/4heBhDy

analytics.grayrecord.com

January 29, 2025 at 2:41 AM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

https://tech.grayrecord.com/github%e3%81%ae%e6%96%b0%e3%81%97%e3%81%84%e6%8f%90%e4%be%9b%ef%bc%9acobalt-100%e3%83%97%e3%83%ad%e3%82%bb%e3%83%83%e3%82%b5%e3%81%ab%e3%82%88%e3%82%8b%e3%83%9b%e3%82%b9%e3%83%86%e3%83%83%e3%83%89/
記事を公開

GitHubの新しい提供：Cobalt 100プロセッサによるホステッドランナー

<p>PublicKeyの<a data-id="https://www.publickey1.jp/blog/25/githubcpucobalt_100linux_arm64.html" data-type="link" href="https://www.publickey1.jp/blog/25/githubcpucobalt_100linux_arm64.html">GitHub、マイクロソフトの独自開発CPU、Cobalt 100プロセッサによるLinux Arm64ホステッドランナーを無料プランユーザーにも提供へ</a>によれば、GitHubはパブリックレポジトリにより運用している無償ユーザにもCobalt 100によるホステッドランナーを提供するようです。</p> <p>単純に言うと、GitHub上でソースコードをホストしそれをホステッドランナーで自動ビルドするようなことができます。単純に言えば目的はCobalt 100で稼働するソフトウェアの拡充が目的なのは明らかでしょう。</p> <h2 class="wp-block-heading">Cobalt 100とは?</h2> <div class="wp-block-jetpack-markdown"><ul> <li><em>ARMベースCPU</em> ：Microsoftが開発したARMベースのCPU。</li> <li><em>128コア</em> ：1チップで最大128コアを稼働可能。</li> <li><em>Maia 100との併用</em> ：Cobalt 100は深層学習モデルを稼働させるためのチップ「Maia 100」と併用が考えられています。</li> </ul> </div> <h2 class="wp-block-heading">利点</h2> <div class="wp-block-jetpack-markdown"><ul> <li><em>ソフトウェアの拡充</em> ：Cobalt 100で稼働するソフトウェアの拡充が目的とされています。</li> <li><em>簡単な理解</em> ：タスクランナーとして使う分には、Cobalt 100で稼働可能なコードを得るだけの理解で十分です。</li> </ul> </div> <div class="jp-relatedposts" id="jp-relatedposts"> <h3 class="jp-relatedposts-headline"><em>関連</em></h3> </div>

tech.grayrecord.com

January 23, 2025 at 1:56 PM

Grayrecord

@gorn-tech.mastodon.social.ap.brid.gy

2025年に廃止されるAzureサービス：移行先と最適な代替案というタイトルで記事を投下しました。
https://buff.ly/3PiMcQe
2025年に終了予定のAzureサービスと、その移行先や最適な代替案についての記事を公開しました。詳しくはこちらをご覧ください: https://buff.ly/3PiMcQe

2025年に廃止されるAzureサービス：移行先と最適な代替案

<p>2025年に廃止になる、Azure関係のサービスは以下のような感じです。</p> <p>2025/1/6</p> <p>Microsoft Genomics</p> <p>2025/3/31</p> <p>Visual Studio App Center</p> <p>2025/6/30</p> <p>SAP HANA Large Instances</p> <p>2025/9/30</p> <p>Azure Database for Maria DB<br/>Azure Basic Load Balancer<br/>Azure HPC Cache<br/>Azure Remote Rendering<br/>Azure Service Map<br/>Azure SQL Edge<br/>Azure Unmanaged Disks<br/>Azure vFXT</p> <p>時間が限られているので難しいものもありますが、わかる範囲で考えていきます。SAP HANA Large Instancesは時間が限られていますが、Azureのサポートされているインスタンスサイズへの移行が考えられるでしょう。その意味では、テストが課題ですが比較的可能な範囲かなと思います。</p> <p>Azure Database for Maria DBはだいぶ前からアナウンスがかかってましたし、恐らく、Azure Database for MySQLが考えられるでしょう。DDLなどのテストは必須ですが、他のオプションよりは考えられるでしょう。</p> <p>Azure Remote RenderingはHololens2とWindows 10に向けた、レンダリングソリューションなので、実質、Windows 10のMRがリタイアしてしまえば存在意義を失うのは確かです。</p> <p>Azure SQL Edgeは地味に面倒かもしれないです。まず、状況によるといったところです。SQL Serverは検討され得ますが、x64のみのサポートなのでエッジデバイスでARMの場合には検討対象から外れます。その場合、SQLiteなどを考慮できますが、クラウドとかにミラーリングが発生するならば厄介です。その場合、エッジデバイス内はmemcachedとかにして、クエリをキャッシュするという戦略の方がいいかもしれないです。</p> <p>考えられる範囲でまとめてみました。</p> <p></p> <div class="jp-relatedposts" id="jp-relatedposts"> <h3 class="jp-relatedposts-headline"><em>関連</em></h3> </div>

tech.grayrecord.com

January 3, 2025 at 6:43 AM