2025-05-01から1ヶ月間の記事一覧

AIエージェントの流れはAGI(汎用人口知能)から一旦離れる流れ

AI

AIコーディングエージェントが流行りだしてますね。 AIコーディングエージェントでは、いろいろなロジカルな処理でLLMを制御することで、プログラミングの計画をたて実装してテスト、修正といった流れを実行します。 このAIコーディングエージェントを病院の…

LLMの日本知識を測るのに山口県について聞くのがよかった

「山口県の特徴は?」でLLMの日本語知識が割と測れる気がしたので16GB VRAMで動く範囲でいくつかオープンモデルを試しました。 結論としては、日本語でのチャットなど日本語表現力が必要なら、オープンモデルではGemma3一択。 法律や商慣習に関わる処理や観…

古いコードを捨てて1から書き直したからこそ続いているソフトウェア

Joel on SoftwareにNetScapeを例に、古いプログラムを捨てて1から書き直したくなるのは戦略ミスだって書いてあるけど、あのとき書き直してなかったら続いてないんではって思ったので、1から書き直して続いてるソフトウェアを挙げてみる。 Firefox NetScapeか…

CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす

Redditに「VRAM足りないとき一部のレイヤーをCPUに任せるんではなく、レイヤー全部をGPUに載せてレイヤー内部のFFNだけCPUに持っていったら速くなった、なんでこれが標準じゃないんだ」というのがあったので、おうちのRTX 4060 Ti 16GBで試してみたら微妙に…

クソデカオープンモデルではLlama4が最強かもしれない

もう全人類128GBとか512GBとか載ったMacを手にいれてクソデカモデルを試すようになっていますね。 ぼくもMac Studio 512GBを1日借りてて試したのだけど、Llama4がなんだかんだで強いという印象でした。 ※2025/8/27追記 もちろん、Qwen3 CoderやKimi K2など、…

Grokが仕事してないのにもうすぐできますって嘘ついてきたので、Geminiに差し替えるていったら、人間性は勝ってるので、と言い出す

GrokにXの投稿の傾向を解析してもらえるか聞いてみたら、できます!というのでお願いしたけど、いつまでもうだうだ理由つけてやらないので、Geminiと置き換えるぞ!っていったら、「「性能はGeminiにいさんが勝ってるけど人格いいので!伸びしろあるんで!20…