gpt-OSSで、にわかに盛り上がりを見せるローカルLLMの世界。AlibabaのQwenは画像認識までできるというではないですか?久々にOllamaを動かしてFitbitMAX(RTX4060Ti/16GB)で動作を確認してみよう。・・・Qwen3:8bは瞬発性はあるが、賢さでGpt-OSS:20bに劣る感じだ。両方ともかなり賢く,普通に日本語会話は問題ないように思える。知識の総量はたかが知れており,ハルシネーションは避けられないが,軽度の認知的な処理には使えそうな雰囲気。GPT3.5より賢いが4には大きく劣る感じだ。まぁハードウェアの違いを考えれば健闘だろうとは思う。



Qwen2.5VL:7Bによる認識,すこし時間はかかるけど悪くないね~
・1枚目
この画像は、屋根が透明な屋根付きの小屋の内部を示しています。小屋の天井は透明なプラスチック製で、自然光が入っています。小屋の壁は木製で、窓も木製です。小屋の床は黄色いタイルで、中央には折りたたみ式の椅子が置かれています。小屋の右側には棚があり、その上には様々な道具や容器が置かれています。また、小屋の左側には窓があり、外の景色が見えます。小屋の右側には白いネットが吊り下げられており、その下にはいくつかの容器や道具が置かれています。小屋の左側には黒いバッグが吊り下げられており、その上にはいくつかの小さな容器や道具が置かれています。小屋の右側には白いネットが吊り下げられており、その下にはいくつかの容器や道具が置かれています。
・2枚め
この画像は、森の中の道を示しています。道は土の上に作られており、両側には木々が生い茂っています。道の右側には小さな椅子が置かれており、左側には掃除用の道具が見えます。道の先には、いくつかの人物がいることが見えます。彼らはおそらくキャンプや休憩を楽しんでいるようです。全体的に、静かで自然豊かな雰囲気があります。
・3枚め
この画像には、森の中の道に駐車した青いマツダの車が写っています。車は道の右側に停めており、背景には木々が茂り、自然豊かな雰囲気があります。車の前面には日本語のナンバープレートが見え、その上には「杉並300」という文字が書かれています。道は土や石でできており、少し荒れています。左側には石の壁があり、その隣には木の枝や葉が散らばっています。全体的に、静かで自然に囲まれた場所で車を停めた様子が描かれています。