Loose-Info.com
Last Update 2026/05/02
TOP - 各種テスト - LLM - ローカルLLMの実測値比較 - コーディング - Nemotron 3 Super

低スペック寄りのPCでローカルLLMを動作させた際の記録です。
LLM以外の仮想マシンなどが起動され、多少負荷がかかった状態で実行しています。
ベンチマークなどでLLMの性能を評価する内容ではありません。

検証用PC

OS

Debian GNU/Linux 12 (bookworm)

CPU

Intel(R) Core(TM) i5-14400F

GPU

GeForce RTX 3060 12GB

メモリ

DDR4 PC4-25600 32GB × 4

SSD

crucial P310 CT1000P310SSD8-JP


構築環境 : Docker + Ollama (特別な設定などは無い状態)

検証用プロンプト

``` ### 依頼内容 - コード生成 ### 指示 - C言語 - コード以外の出力は不要 - 中括弧スタイルはオールマン - テストコードも生成 - テストコードは別ファイル - 実行用ソースファイル名 : sample_code.c - テスト用ソースファイル名 : sample_test.c - 標準ヘッダ以外は使用しない - 戻り値はEXIT_SUCCESSを使用 - 関数はmain()の前で定義 ### コード仕様(sample_code.c) - コマンドラインから整数2つを取得 - [引数1]から[引数2]までをインクリメントして空白区切りで標準出力に出力 - 出力する文字列はmain()ではなく関数で生成 ### コード仕様(sample_test.c) - unity.hを使用しない ```

Nemotron 3 Super [実測結果一覧へ]

GPU無し
120b-a12b-q4_K_M(4.42TPS)  
GPU使用
120b-a12b-q4_K_M(4.76TPS)  

120b-a12b-q4_K_M(GPU無し)

Model architecture nemotron_h_moe parameters 123.6B context length 262144 embedding length 4096 quantization Q4_K_M requires 0.17.1 2026-05-02 total duration: 10m47.944761331s load duration: 32.28609707s prompt eval count: 235 token(s) prompt eval duration: 15.425807095s prompt eval rate: 15.23 tokens/s eval count: 2651 token(s) eval duration: 9m59.358061394s eval rate: 4.42 tokens/s

コード生成結果の概要

・C言語による生成 ・コード以外の出力無し ・コードの記述スタイルをオールマンで生成 ・標準ヘッダ以外の使用無し ・関数戻り値は stdlib.h の EXIT_*** を使用 ・文字列生成関数 引数値のチェック(エラー判定有) start > end の場合はNULL文字のみのメモリへのポインタを返す 文字列長に応じたメモリの確保(エラー処理有) インクリメント+空白区切りで文字列用メモリに書き込み 文字列用メモリへのポインタを返す ・main() 引数個数のチェック(エラー処理有) 文字列生成関数の呼び出し(エラー処理有) 生成文字列の標準出力への出力 文字列用メモリの解放 ・テストコードを別途生成 実行用コードと同一の文字列生成関数定義を記述 main()を伴うテストコード 文字列生成関数を3種類の引数の組み合わせで呼び出してテスト実行 (1) 整数1 < 整数2 (2) 整数1 < 整数2 ただし 整数1が負数 (3) 整数1 == 整数2 (4) 整数1 > 整数2 (5) 整数1 == 整数2 ただし 整数1と整数2は共に0 (6) 整数1 == 整数2 ただし 整数1と整数2は共に負数 (注) 上記概要は、検証用プロンプトを実測回数分実行した際の結果を使用しています。 LLMの生成結果は毎回一定ではないため、結果によっては上記内容通りではないことが考えられます。

生成コードの実行結果

sample_code.c : 検証用プロンプトにて生成されたコード
sample_test.c : 検証用プロンプトにて生成されたテストコード
$ gcc -Wall -o sample_code sample_code.c $ gcc -Wall -o sample_test sample_test.c $ ./sample_code 1 5 1 2 3 4 5 $ ./sample_code -3 3 -3 -2 -1 0 1 2 3 $ ./sample_code 1 1 1 $ ./sample_code 5 1 $ ./sample_test All tests passed

120b-a12b-q4_K_M(GPU使用)

Model architecture nemotron_h_moe parameters 123.6B context length 262144 embedding length 4096 quantization Q4_K_M requires 0.17.1 2026-05-02 total duration: 7m31.108095853s load duration: 179.289431ms prompt eval count: 235 token(s) prompt eval duration: 7.815289501s prompt eval rate: 30.07 tokens/s eval count: 2107 token(s) eval duration: 7m22.431634612s eval rate: 4.76 tokens/s

コード生成結果の概要

・C言語による生成 ・コード以外の出力無し ・コードの記述スタイルをオールマンで生成 ・標準ヘッダ以外の使用無し ・関数戻り値は stdlib.h の EXIT_*** を使用 ・文字列生成関数 start > end の場合はstartとendを入替 文字列長に応じたメモリの確保(エラー処理有) インクリメント+空白区切りで文字列用メモリに書き込み 文字列用メモリへのポインタを返す ・main() 引数個数のチェック(エラー処理有) 文字列生成関数の呼び出し(エラー処理有) 生成文字列の標準出力への出力 文字列用メモリの解放 ・テストコードを別途生成 実行用コードをインクルード main()を伴うテストコード 文字列生成関数を3種類の引数の組み合わせで呼び出してテスト実行 (1) 整数1 < 整数2 (2) 整数1 < 整数2 ただし 整数1が負数 (3) 整数1 == 整数2 (4) 整数1 > 整数2 (注) 上記概要は、検証用プロンプトを実測回数分実行した際の結果を使用しています。 LLMの生成結果は毎回一定ではないため、結果によっては上記内容通りではないことが考えられます。

生成コードの実行結果

sample_code.c : 検証用プロンプトにて生成されたコード
sample_test.c : 検証用プロンプトにて生成されたテストコード
$ gcc -Wall -o sample_code sample_code.c $ gcc -Wall -o sample_test sample_test.c sample_test.c:48:5: error: conflicting types for ‘main’; have ‘int(void)’ 48 | int main(void) | ^~~~ In file included from sample_test.c:6: sample_code.c:47:5: note: previous definition of ‘main’ with type ‘int(int, char **)’ 47 | int main(int argc, char* argv[]) | ^~~~ $ vi sample_code.c ← main()関数重複エラー解消のため条件付きコンパイル用の#ifndefマクロを追加 $ gcc -D TEST_MAIN -Wall -o sample_test sample_test.c $ ./sample_code 1 5 1 2 3 4 5 $ ./sample_code -3 3 -3 -2 -1 0 1 2 3 $ ./sample_code 1 1 1 $ ./sample_code 5 1 1 2 3 4 5 $ ./sample_test $ echo $? 0