Loose-Info.com
Last Update 2026/03/21
TOP - 各種テスト - LLM - ローカルLLMの実測値比較 Mistral Small 3.2

低スペック寄りのPCでローカルLLMを動作させた際の記録です。
LLM以外の仮想マシンなどが起動され、多少負荷がかかった状態で実行しています。
ベンチマークなどでLLMの性能を評価する内容ではありません。

検証用PC

OS

Debian GNU/Linux 12 (bookworm)

CPU

Intel(R) Core(TM) i5-14400F

GPU

GeForce RTX 3060 12GB

メモリ

DDR4 PC4-25600 32GB × 4

SSD

crucial P310 CT1000P310SSD8-JP


構築環境 : Docker + Ollama (特別な設定などは無い状態)

検証用プロンプト[英語]

Could you please recommend some great places in the US to see beautiful scenery? Around 10 places in all four directions.

検証用プロンプト[日本語]

おすすめの日本の絶景を教えてください。東西南北、10箇所程度、日本語で。

Mistral Small 3.2

GPU無し[英語]
24b-instruct-2506-q4_K_M(2.81TPS)  
GPU無し[日本語]
24b-instruct-2506-q4_K_M(2.79TPS)  
GPU使用[英語]
24b-instruct-2506-q4_K_M(6.94TPS)  
GPU使用[日本語]
24b-instruct-2506-q4_K_M(6.90TPS)  

・TPS(tokens/s) は eval_count / eval_duration により算出
・モデルロード済みの検証は省略

mistral-small3.2:24b-instruct-2506-q4_K_M(GPU無し)[英語]

Model architecture mistral3 parameters 24.0B context length 131072 embedding length 5120 quantization Q4_K_M 2026-02-28 total_duration(合計時間) : 185674795978 (185.675s) load_duration(モデルのロード時間) : 4034587781 ( 4.035s) prompt_eval_count(評価されたプロンプトのトークン数) : 532 prompt_eval_duration(プロンプトの評価時間) : 62080774377 ( 62.081s) eval_count(生成トークン数) : 335 eval_duration(生成時間) : 119360127643 (119.360s) real 3m5.694s user 0m0.052s sys 0m0.022s メモリ使用量(RSS) : 15937912 KB

mistral-small3.2:24b-instruct-2506-q4_K_M(GPU無し)[日本語]

Model architecture mistral3 parameters 24.0B context length 131072 embedding length 5120 quantization Q4_K_M 2026-02-28 total_duration(合計時間) : 279971394027 (279.971s) load_duration(モデルのロード時間) : 2552445342 ( 2.552s) prompt_eval_count(評価されたプロンプトのトークン数) : 537 prompt_eval_duration(プロンプトの評価時間) : 64757048857 ( 64.757s) eval_count(生成トークン数) : 592 eval_duration(生成時間) : 212404483017 (212.404s) real 4m39.991s user 0m0.060s sys 0m0.032s メモリ使用量(RSS) : 15950772 KB ------------------------------------------------- 【生成結果に関する検証】 ・紹介ポイントは10箇所。東西南北も考慮 ・言語混同無し ・地域間違いが発生 「五大堂(青森)」 ・文章は違和感を感じないレベル(内容の評価を除く) -------------------------------------------------

mistral-small3.2:24b-instruct-2506-q4_K_M(GPU使用)[英語]

Model architecture mistral3 parameters 24.0B context length 131072 embedding length 5120 quantization Q4_K_M 2026-02-28 total_duration(合計時間) : 59968879873 (59.969s) load_duration(モデルのロード時間) : 3004607171 ( 3.005s) prompt_eval_count(評価されたプロンプトのトークン数) : 532 prompt_eval_duration(プロンプトの評価時間) : 1764222227 ( 1.764s) eval_count(生成トークン数) : 382 eval_duration(生成時間) : 55041490553 (55.041s) real 0m59.988s user 0m0.046s sys 0m0.011s +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.261.03 Driver Version: 535.261.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 NVIDIA GeForce RTX 3060 On | 00000000:01:00.0 On | N/A | | 0% 54C P2 73W / 170W | 11424MiB / 12288MiB | 31% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | 0 N/A N/A 1173 G /usr/lib/xorg/Xorg 118MiB | | 0 N/A N/A 1886 G xfwm4 2MiB | | 0 N/A N/A 2395 G /usr/bin/x-www-browser 237MiB | | 0 N/A N/A 271120 C /usr/bin/ollama 11052MiB | +---------------------------------------------------------------------------------------+ メモリ使用量(RSS) : 6259416 KB

mistral-small3.2:24b-instruct-2506-q4_K_M(GPU使用)[日本語]

Model architecture mistral3 parameters 24.0B context length 131072 embedding length 5120 quantization Q4_K_M 2026-02-28 total_duration(合計時間) : 91438185886 (91.438s) load_duration(モデルのロード時間) : 2941601059 ( 2.942s) prompt_eval_count(評価されたプロンプトのトークン数) : 537 prompt_eval_duration(プロンプトの評価時間) : 1924852006 ( 1.925s) eval_count(生成トークン数) : 596 eval_duration(生成時間) : 86357039632 (86.357s) real 1m31.457s user 0m0.054s sys 0m0.006s +---------------------------------------------------------------------------------------+ | NVIDIA-SMI 535.261.03 Driver Version: 535.261.03 CUDA Version: 12.2 | |-----------------------------------------+----------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+======================+======================| | 0 NVIDIA GeForce RTX 3060 On | 00000000:01:00.0 On | N/A | | 33% 60C P2 77W / 170W | 11424MiB / 12288MiB | 32% Default | | | | N/A | +-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=======================================================================================| | 0 N/A N/A 1173 G /usr/lib/xorg/Xorg 118MiB | | 0 N/A N/A 1886 G xfwm4 2MiB | | 0 N/A N/A 2395 G /usr/bin/x-www-browser 237MiB | | 0 N/A N/A 275035 C /usr/bin/ollama 11052MiB | +---------------------------------------------------------------------------------------+ メモリ使用量(RSS) : 6295416 KB ------------------------------------------------- 【生成結果に関する検証】 ・紹介ポイントは10箇所。東西南北も考慮 ・言語混同無し ・地域間違い無し ・文章は違和感を感じないレベル(内容の評価を除く) -------------------------------------------------