2025-11-01から1ヶ月間の記事一覧

Sarashina-2.2-Vision-3Bの文字読み取りがすごい、けどVRAM 16GBではつらい -> 解決。VRAM12GBで使える

SB Institutionから日本の情報に特化した画像言語モデル、Sarashina-2.2-Vision-3Bが出ていたので試したところ、性能の高さは感じたものの、VRAM 16GBで動かすのがつらかったのでまとめました。 Sarashina2.2-Vision-3B: コンパクトかつ性能が高いVLMの公開 …

LINEのベース日本語言語モデルを強化学習で対話できるようにして賢さを評価する(過去下書き放出)

下書きにあったものをとりあえず放出。 2023年8月おわりくらいの下書き。無加工なので、組織名などが当時のものになっています。 ココカラ。 LINEのNLP Foundation Devチームから36億パラメータの日本語言語モデルが公開されています。 https://engineering.…

IT土管はAIにまかせて、人間は情報に価値をのせよう

情報を右から左に流すだけのIT土管はAIに作れるので、その情報たちから新たな価値を生むのが、ITエンジニアの仕事になるのではないかなと思います。 2004年に広まったWeb 2.0は、CGM(Consumer Generated Media: ユーザー生成コンテンツ)という言葉を生みまし…

Spring AIでLM Studioに接続するにはreactor-netty-httpが必要

Spring AIからはデフォルトでLM Studioに接続できませんが、reactor-netty-httpへのdependencyを追加することで接続できるようになります。 この解決方法です。 https://github.com/spring-projects/spring-ai/issues/2445#issuecomment-3066995797 まずOpen…

Qwen3、GLM、GPT-ossなどクソデカ言語モデルを試したところGLM-4.5-Airがお気に入り

Mac Studioを借りたのでいろいろクソデカ言語モデルを試したところ、GLM-4.5-Airがいいなとなってます。 試したモデルこちら。 モデル パラメータ数 アクティブ thinking 画像 時期 URL GPT-oss 120B 120B 5B o x 2025/8 OpenAI hf link Qwen3 235B-A22B-250…