2025-10-01から1ヶ月間の記事一覧

DeepSeek-OCRの弱点をつく

AI

DeepSeek-OCRの仕組みが面白いので遊んでしまっている。 最初に試したときは、純粋にOCRさせてますね。きれいな心をしている。 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい - きしだのHatena そして前回はランダムな文字列を読ませて誤認…

DeepSeek-OCRにはランダム文字列が読めない

DeepSeek-OCRの精度が高くて驚いたところですが、仕組み的にランダムな文字列での認識率がかなり落ちるんではないかと試してみたところ、やっぱりかなり悪かったです。 DeepSeek-OCRについてはこちら。 画像でテキストをトークン圧縮するDeepSeek-OCRがいろ…

画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい

おとといくらいにDeepSeek-OCRというのが出てました。 https://github.com/deepseek-ai/DeepSeek-OCR ただのOCRじゃなくて、「テキストを画像にしたほうがトークンサイズを小さくできるのでは?」というのをやっていて、テキストを画像にしてトークン化した…

計算量を具体的に見てみる 2025年版

2009年に「計算量を具体的に見てみる」という、処理から計算量を視覚化するブログを書いてた。 計算量を具体的に見てみる - きしだのHatena これJava 6時代なので、Java 25で書き直してみた。 より詳しい解説は元ブログのほうを見てください。 O(1) まず基本…

Javaでプラットフォームスレッドだと終了を待ってくれるのに仮想スレッドだと途中でプロセスが終わる

Javaで、プラットフォームスレッドだとmainメソッドが終わってもスレッド終了を待ってくれるのに、仮想スレッドだとmainスレッドが終わると仮想スレッドの処理が途中でもプロセスが終わるの何でだろうな、と思った話。 こういうコードを動かします。 void ma…

ComfyUIでQwen ImageやQwen Image Editを動かしてJavaから呼び出す

「Javaのコードから画像生成したいな、ローカルで」と思って、どうやらComfyUIだとAPI呼び出しができるようなので、やってみた。 ついでに、Qwen Imageを試したかったので、ここを参考にインストール。 徹底解説:Comfy UI + GGUF Qwen Image / Edit 2509 を…

AIが読み書きするコードも読みやすいほうがいい(トランスフォーマの特性の考慮やリーダブルコードについて追記)

AI

AIが読むんだから読みやすくする必要はないんでは、という話が流れてきた。 けど、実際にはAIにも読みやすさは大事だと思う。 データ形式によって、そのデータに関する回答精度がどうかわるかという調査がある。 Which Table Format Do LLMs Understand Best…