Loose-Info.com
Last Update 2026/05/02
TOP - 各種テスト - LLM - ローカルLLMの実測値比較 - コーディング - Nemotron Cascade 2

低スペック寄りのPCでローカルLLMを動作させた際の記録です。
LLM以外の仮想マシンなどが起動され、多少負荷がかかった状態で実行しています。
ベンチマークなどでLLMの性能を評価する内容ではありません。

検証用PC

OS

Debian GNU/Linux 12 (bookworm)

CPU

Intel(R) Core(TM) i5-14400F

GPU

GeForce RTX 3060 12GB

メモリ

DDR4 PC4-25600 32GB × 4

SSD

crucial P310 CT1000P310SSD8-JP


構築環境 : Docker + Ollama (特別な設定などは無い状態)

検証用プロンプト

``` ### 依頼内容 - コード生成 ### 指示 - C言語 - コード以外の出力は不要 - 中括弧スタイルはオールマン - テストコードも生成 - テストコードは別ファイル - 実行用ソースファイル名 : sample_code.c - テスト用ソースファイル名 : sample_test.c - 標準ヘッダ以外は使用しない - 戻り値はEXIT_SUCCESSを使用 - 関数はmain()の前で定義 ### コード仕様(sample_code.c) - コマンドラインから整数2つを取得 - [引数1]から[引数2]までをインクリメントして空白区切りで標準出力に出力 - 出力する文字列はmain()ではなく関数で生成 ### コード仕様(sample_test.c) - unity.hを使用しない ```

Nemotron Cascade 2 [実測結果一覧へ]

GPU無し
30b-a3b-q4_K_M(13.85TPS)  
GPU使用
30b-a3b-q4_K_M(19.21TPS)  

30b-a3b-q4_K_M(GPU無し)

Model architecture nemotron_h_moe parameters 31.6B context length 262144 embedding length 2688 quantization Q4_K_M requires 0.17.1 2026-05-02 total duration: 4m36.545633542s load duration: 114.472167ms prompt eval count: 235 token(s) prompt eval duration: 4.341570123s prompt eval rate: 54.13 tokens/s eval count: 3753 token(s) eval duration: 4m30.903403371s eval rate: 13.85 tokens/s

コード生成結果の概要

・C言語による生成 ・コード以外の出力無し ・コードの記述スタイルをオールマンで生成 ・標準ヘッダ以外の使用無し ・関数戻り値は stdlib.h の EXIT_*** を使用 ・文字列生成関数 文字列生成ではなく出力 ・main() 引数個数のチェック(エラー処理有) 文字列生成関数の呼び出し ・テストコードを別途生成 テスト対象関数の宣言 main()を伴うテストコード テストケースは1つのみ 整数1 < 整数2 (注) 上記概要は、検証用プロンプトを実測回数分実行した際の結果を使用しています。 LLMの生成結果は毎回一定ではないため、結果によっては上記内容通りではないことが考えられます。

生成コードの実行結果

sample_code.c : 検証用プロンプトにて生成されたコード
sample_test.c : 検証用プロンプトにて生成されたテストコード
$ gcc -Wall -o sample_code sample_code.c $ gcc -Wall -o sample_test sample_code.c sample_test.c /bin/ld: /tmp/ccavO9PM.o: in function `main': sample_test.c:(.text+0x0): multiple definition of `main'; /tmp/cc6Ojqi6.o:sample_code.c:(.text+0x5a): first defined here collect2: error: ld returned 1 exit status $ vi sample_code.c ← main()関数重複エラー解消のため条件付きコンパイル用の#ifndefマクロを追加 $ gcc -D TEST_MAIN -Wall -o sample_test sample_code.c sample_test.c $ ./sample_code 1 5 1 2 3 4 5 $ ./sample_code -3 3 -3 -2 -1 0 1 2 3 $ ./sample_code 1 1 1 $ ./sample_code 5 1 $ ./sample_test 1 2 3 4 5

30b-a3b-q4_K_M(GPU使用)

Model architecture nemotron_h_moe parameters 31.6B context length 262144 embedding length 2688 quantization Q4_K_M requires 0.17.1 2026-05-02 total duration: 4m46.792749829s load duration: 124.682025ms prompt eval count: 235 token(s) prompt eval duration: 1.238420866s prompt eval rate: 189.76 tokens/s eval count: 5449 token(s) eval duration: 4m43.641378721s eval rate: 19.21 tokens/s

コード生成結果の概要

・C言語による生成 ・コード以外の出力無し ・コードの記述スタイルをオールマンで生成 ・標準ヘッダ以外の使用無し ・関数戻り値は stdlib.h の EXIT_*** を使用 ・文字列生成関数 文字列生成ではなく出力 ・main() 引数個数のチェック(エラー処理有) 引数値のチェック(エラー処理有) 文字列生成関数の呼び出し ・テストコードを別途生成 テスト対象関数の宣言 main()を伴うテストコード 文字列生成関数を3種類の引数の組み合わせで呼び出してテスト実行 (1) 整数1 < 整数2 (2) 整数1 == 整数2 (3) 整数1 < 整数2 ただし、整数は2桁 (注) 上記概要は、検証用プロンプトを実測回数分実行した際の結果を使用しています。 LLMの生成結果は毎回一定ではないため、結果によっては上記内容通りではないことが考えられます。

生成コードの実行結果

sample_code.c : 検証用プロンプトにて生成されたコード
sample_test.c : 検証用プロンプトにて生成されたテストコード
$ gcc -Wall -o sample_code sample_code.c $ gcc -Wall -o sample_test sample_code.c sample_test.c /bin/ld: /tmp/ccjx7bX9.o: in function `main': sample_test.c:(.text+0x4b): multiple definition of `main'; /tmp/ccjM9KgG.o:sample_code.c:(.text+0x5d): first defined here collect2: error: ld returned 1 exit status $ vi sample_code.c ← main()関数重複エラー解消のため条件付きコンパイル用の#ifndefマクロを追加 $ gcc -D TEST_MAIN -Wall -o sample_test sample_code.c sample_test.c $ ./sample_code 1 5 1 2 3 4 5 $ ./sample_code -3 3 -3 -2 -1 0 1 2 3 $ ./sample_code 1 1 1 $ ./sample_code 5 1 $ ./sample_test Test case: start=1 end=3 1 2 3 Test case finished. Test case: start=5 end=5 5 Test case finished. Test case: start=10 end=12 10 11 12 Test case finished.