Generate perplexity and kld scores

Browse files

Files changed (12) hide show

scores/DeepSeek-R1-Distill-Llama-8B-iq3_m.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-iq3_s.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-iq4_nl.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q3_k_l.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q3_k_m.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q3_k_s.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q4_k_m.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q4_k_s.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q5_k_m.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q5_k_s.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q6_k.log +37 -0
scores/DeepSeek-R1-Distill-Llama-8B-q8_0.log +37 -0

scores/DeepSeek-R1-Distill-Llama-8B-iq3_m.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  15.074649 ±   0.125392
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  96.24%
+Mean ln(PPL(Q)/PPL(base))     :   0.073299 ±   0.002303
+Mean PPL(Q)/PPL(base)         :   1.076052 ±   0.002479
+Mean PPL(Q)-PPL(base)         :   1.065433 ±   0.034120
+====== KL divergence statistics ======
+Mean    KLD:   0.231125 ±   0.001065
+Maximum KLD:  15.317444
+99.9%   KLD:   4.158607
+99.0%   KLD:   1.925704
+99.0%   KLD:   1.925704
+Median  KLD:   0.108549
+10.0%   KLD:   0.004011
+ 5.0%   KLD:   0.000968
+ 1.0%   KLD:   0.000097
+Minimum KLD:  -0.000002
+====== Token probability statistics ======
+Mean    Δp: -2.727 ± 0.032 %
+Maximum Δp: 99.189%
+99.9%   Δp: 58.452%
+99.0%   Δp: 28.292%
+95.0%   Δp: 11.053%
+90.0%   Δp:  5.190%
+75.0%   Δp:  0.345%
+Median  Δp: -0.134%
+25.0%   Δp: -4.078%
+10.0%   Δp: -14.463%
+ 5.0%   Δp: -24.044%
+ 1.0%   Δp: -50.741%
+ 0.1%   Δp: -83.958%
+Minimum Δp: -99.686%
+RMS Δp    : 12.503 ± 0.061 %
+Same top p: 79.332 ± 0.107 %

scores/DeepSeek-R1-Distill-Llama-8B-iq3_s.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  15.334981 ±   0.127912
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  95.98%
+Mean ln(PPL(Q)/PPL(base))     :   0.090421 ±   0.002383
+Mean PPL(Q)/PPL(base)         :   1.094635 ±   0.002609
+Mean PPL(Q)-PPL(base)         :   1.325764 ±   0.036143
+====== KL divergence statistics ======
+Mean    KLD:   0.248986 ±   0.001138
+Maximum KLD:  17.916763
+99.9%   KLD:   4.568046
+99.0%   KLD:   2.008440
+99.0%   KLD:   2.008440
+Median  KLD:   0.118888
+10.0%   KLD:   0.004193
+ 5.0%   KLD:   0.000998
+ 1.0%   KLD:   0.000099
+Minimum KLD:  -0.000002
+====== Token probability statistics ======
+Mean    Δp: -2.891 ± 0.033 %
+Maximum Δp: 99.825%
+99.9%   Δp: 60.879%
+99.0%   Δp: 28.581%
+95.0%   Δp: 11.317%
+90.0%   Δp:  5.294%
+75.0%   Δp:  0.331%
+Median  Δp: -0.141%
+25.0%   Δp: -4.267%
+10.0%   Δp: -15.067%
+ 5.0%   Δp: -25.229%
+ 1.0%   Δp: -52.525%
+ 0.1%   Δp: -84.834%
+Minimum Δp: -99.864%
+RMS Δp    : 12.940 ± 0.062 %
+Same top p: 78.391 ± 0.109 %

scores/DeepSeek-R1-Distill-Llama-8B-iq4_nl.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.150903 ±   0.119732
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  98.72%
+Mean ln(PPL(Q)/PPL(base))     :   0.010063 ±   0.001356
+Mean PPL(Q)/PPL(base)         :   1.010114 ±   0.001369
+Mean PPL(Q)-PPL(base)         :   0.141687 ±   0.019129
+====== KL divergence statistics ======
+Mean    KLD:   0.081957 ±   0.000567
+Maximum KLD:   9.373822
+99.9%   KLD:   2.712739
+99.0%   KLD:   0.913387
+99.0%   KLD:   0.913387
+Median  KLD:   0.029345
+10.0%   KLD:   0.000732
+ 5.0%   KLD:   0.000163
+ 1.0%   KLD:   0.000012
+Minimum KLD:  -0.000014
+====== Token probability statistics ======
+Mean    Δp: -0.342 ± 0.019 %
+Maximum Δp: 95.532%
+99.9%   Δp: 53.636%
+99.0%   Δp: 21.914%
+95.0%   Δp:  8.298%
+90.0%   Δp:  4.309%
+75.0%   Δp:  0.568%
+Median  Δp: -0.003%
+25.0%   Δp: -1.122%
+10.0%   Δp: -5.580%
+ 5.0%   Δp: -10.127%
+ 1.0%   Δp: -23.871%
+ 0.1%   Δp: -51.466%
+Minimum Δp: -97.545%
+RMS Δp    :  7.192 ± 0.050 %
+Same top p: 87.782 ± 0.086 %

scores/DeepSeek-R1-Distill-Llama-8B-q3_k_l.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.871865 ±   0.126955
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  97.50%
+Mean ln(PPL(Q)/PPL(base))     :   0.059756 ±   0.001903
+Mean PPL(Q)/PPL(base)         :   1.061577 ±   0.002020
+Mean PPL(Q)-PPL(base)         :   0.862649 ±   0.028722
+====== KL divergence statistics ======
+Mean    KLD:   0.154127 ±   0.000850
+Maximum KLD:  11.128032
+99.9%   KLD:   3.615189
+99.0%   KLD:   1.488761
+99.0%   KLD:   1.488761
+Median  KLD:   0.061692
+10.0%   KLD:   0.001610
+ 5.0%   KLD:   0.000344
+ 1.0%   KLD:   0.000026
+Minimum KLD:  -0.000067
+====== Token probability statistics ======
+Mean    Δp: -1.010 ± 0.027 %
+Maximum Δp: 97.798%
+99.9%   Δp: 57.985%
+99.0%   Δp: 26.935%
+95.0%   Δp: 11.279%
+90.0%   Δp:  5.918%
+75.0%   Δp:  0.729%
+Median  Δp: -0.010%
+25.0%   Δp: -1.838%
+10.0%   Δp: -8.856%
+ 5.0%   Δp: -16.093%
+ 1.0%   Δp: -39.077%
+ 0.1%   Δp: -76.112%
+Minimum Δp: -99.152%
+RMS Δp    : 10.103 ± 0.058 %
+Same top p: 83.151 ± 0.099 %

scores/DeepSeek-R1-Distill-Llama-8B-q3_k_m.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  15.028835 ±   0.128791
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  97.12%
+Mean ln(PPL(Q)/PPL(base))     :   0.070255 ±   0.002045
+Mean PPL(Q)/PPL(base)         :   1.072782 ±   0.002194
+Mean PPL(Q)-PPL(base)         :   1.019619 ±   0.031378
+====== KL divergence statistics ======
+Mean    KLD:   0.176316 ±   0.000924
+Maximum KLD:  12.648300
+99.9%   KLD:   3.905615
+99.0%   KLD:   1.629902
+99.0%   KLD:   1.629902
+Median  KLD:   0.073991
+10.0%   KLD:   0.001869
+ 5.0%   KLD:   0.000395
+ 1.0%   KLD:   0.000032
+Minimum KLD:  -0.000021
+====== Token probability statistics ======
+Mean    Δp: -1.132 ± 0.028 %
+Maximum Δp: 98.577%
+99.9%   Δp: 60.593%
+99.0%   Δp: 28.113%
+95.0%   Δp: 12.093%
+90.0%   Δp:  6.356%
+75.0%   Δp:  0.792%
+Median  Δp: -0.010%
+25.0%   Δp: -2.011%
+10.0%   Δp: -9.787%
+ 5.0%   Δp: -17.659%
+ 1.0%   Δp: -41.512%
+ 0.1%   Δp: -79.331%
+Minimum Δp: -99.621%
+RMS Δp    : 10.735 ± 0.059 %
+Same top p: 82.001 ± 0.101 %

scores/DeepSeek-R1-Distill-Llama-8B-q3_k_s.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  15.513099 ±   0.129202
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  94.85%
+Mean ln(PPL(Q)/PPL(base))     :   0.101969 ±   0.002698
+Mean PPL(Q)/PPL(base)         :   1.107350 ±   0.002987
+Mean PPL(Q)-PPL(base)         :   1.503883 ±   0.041148
+====== KL divergence statistics ======
+Mean    KLD:   0.320092 ±   0.001344
+Maximum KLD:  17.145338
+99.9%   KLD:   5.248430
+99.0%   KLD:   2.399956
+99.0%   KLD:   2.399956
+Median  KLD:   0.171489
+10.0%   KLD:   0.005972
+ 5.0%   KLD:   0.001335
+ 1.0%   KLD:   0.000109
+Minimum KLD:  -0.000000
+====== Token probability statistics ======
+Mean    Δp: -3.246 ± 0.037 %
+Maximum Δp: 99.963%
+99.9%   Δp: 71.232%
+99.0%   Δp: 34.565%
+95.0%   Δp: 13.472%
+90.0%   Δp:  6.248%
+75.0%   Δp:  0.411%
+Median  Δp: -0.166%
+25.0%   Δp: -5.212%
+10.0%   Δp: -17.956%
+ 5.0%   Δp: -28.544%
+ 1.0%   Δp: -57.576%
+ 0.1%   Δp: -87.811%
+Minimum Δp: -99.472%
+RMS Δp    : 14.572 ± 0.064 %
+Same top p: 75.385 ± 0.114 %

scores/DeepSeek-R1-Distill-Llama-8B-q4_k_m.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.049490 ±   0.119296
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  98.90%
+Mean ln(PPL(Q)/PPL(base))     :   0.002871 ±   0.001257
+Mean PPL(Q)/PPL(base)         :   1.002875 ±   0.001261
+Mean PPL(Q)-PPL(base)         :   0.040274 ±   0.017652
+====== KL divergence statistics ======
+Mean    KLD:   0.071652 ±   0.000563
+Maximum KLD:   9.861359
+99.9%   KLD:   2.837626
+99.0%   KLD:   0.888377
+99.0%   KLD:   0.888377
+Median  KLD:   0.024927
+10.0%   KLD:   0.000580
+ 5.0%   KLD:   0.000121
+ 1.0%   KLD:   0.000009
+Minimum KLD:  -0.000063
+====== Token probability statistics ======
+Mean    Δp: -0.076 ± 0.017 %
+Maximum Δp: 97.871%
+99.9%   Δp: 57.205%
+99.0%   Δp: 21.178%
+95.0%   Δp:  8.128%
+90.0%   Δp:  4.301%
+75.0%   Δp:  0.634%
+Median  Δp: -0.001%
+25.0%   Δp: -0.896%
+10.0%   Δp: -4.761%
+ 5.0%   Δp: -8.767%
+ 1.0%   Δp: -20.512%
+ 0.1%   Δp: -41.932%
+Minimum Δp: -99.017%
+RMS Δp    :  6.634 ± 0.049 %
+Same top p: 89.014 ± 0.082 %

scores/DeepSeek-R1-Distill-Llama-8B-q4_k_s.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.156039 ±   0.120378
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  98.86%
+Mean ln(PPL(Q)/PPL(base))     :   0.010426 ±   0.001279
+Mean PPL(Q)/PPL(base)         :   1.010480 ±   0.001292
+Mean PPL(Q)-PPL(base)         :   0.146822 ±   0.018099
+====== KL divergence statistics ======
+Mean    KLD:   0.073625 ±   0.000505
+Maximum KLD:   9.293770
+99.9%   KLD:   2.486929
+99.0%   KLD:   0.821050
+99.0%   KLD:   0.821050
+Median  KLD:   0.028050
+10.0%   KLD:   0.000652
+ 5.0%   KLD:   0.000138
+ 1.0%   KLD:   0.000010
+Minimum KLD:  -0.000033
+====== Token probability statistics ======
+Mean    Δp: -0.182 ± 0.018 %
+Maximum Δp: 97.527%
+99.9%   Δp: 53.244%
+99.0%   Δp: 20.616%
+95.0%   Δp:  8.379%
+90.0%   Δp:  4.475%
+75.0%   Δp:  0.663%
+Median  Δp: -0.001%
+25.0%   Δp: -0.955%
+10.0%   Δp: -5.172%
+ 5.0%   Δp: -9.361%
+ 1.0%   Δp: -22.373%
+ 0.1%   Δp: -47.265%
+Minimum Δp: -98.736%
+RMS Δp    :  6.819 ± 0.047 %
+Same top p: 88.499 ± 0.084 %

scores/DeepSeek-R1-Distill-Llama-8B-q5_k_m.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.094598 ±   0.119327
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  99.25%
+Mean ln(PPL(Q)/PPL(base))     :   0.006076 ±   0.001033
+Mean PPL(Q)/PPL(base)         :   1.006095 ±   0.001039
+Mean PPL(Q)-PPL(base)         :   0.085381 ±   0.014539
+====== KL divergence statistics ======
+Mean    KLD:   0.045327 ±   0.000475
+Maximum KLD:   7.581351
+99.9%   KLD:   2.318281
+99.0%   KLD:   0.782267
+99.0%   KLD:   0.782267
+Median  KLD:   0.008818
+10.0%   KLD:   0.000216
+ 5.0%   KLD:   0.000044
+ 1.0%   KLD:   0.000003
+Minimum KLD:  -0.000050
+====== Token probability statistics ======
+Mean    Δp: -0.184 ± 0.014 %
+Maximum Δp: 98.658%
+99.9%   Δp: 37.143%
+99.0%   Δp: 13.901%
+95.0%   Δp:  5.155%
+90.0%   Δp:  2.665%
+75.0%   Δp:  0.413%
+Median  Δp: -0.000%
+25.0%   Δp: -0.512%
+10.0%   Δp: -2.979%
+ 5.0%   Δp: -5.673%
+ 1.0%   Δp: -17.165%
+ 0.1%   Δp: -55.297%
+Minimum Δp: -98.261%
+RMS Δp    :  5.344 ± 0.055 %
+Same top p: 92.340 ± 0.070 %

scores/DeepSeek-R1-Distill-Llama-8B-q5_k_s.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.060444 ±   0.119091
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  99.49%
+Mean ln(PPL(Q)/PPL(base))     :   0.003650 ±   0.000853
+Mean PPL(Q)/PPL(base)         :   1.003657 ±   0.000856
+Mean PPL(Q)-PPL(base)         :   0.051228 ±   0.011989
+====== KL divergence statistics ======
+Mean    KLD:   0.030597 ±   0.000278
+Maximum KLD:   6.643202
+99.9%   KLD:   1.283375
+99.0%   KLD:   0.440988
+99.0%   KLD:   0.440988
+Median  KLD:   0.008143
+10.0%   KLD:   0.000194
+ 5.0%   KLD:   0.000041
+ 1.0%   KLD:   0.000003
+Minimum KLD:  -0.000057
+====== Token probability statistics ======
+Mean    Δp: -0.114 ± 0.012 %
+Maximum Δp: 87.529%
+99.9%   Δp: 32.065%
+99.0%   Δp: 12.407%
+95.0%   Δp:  4.823%
+90.0%   Δp:  2.536%
+75.0%   Δp:  0.383%
+Median  Δp: -0.000%
+25.0%   Δp: -0.498%
+10.0%   Δp: -2.851%
+ 5.0%   Δp: -5.251%
+ 1.0%   Δp: -13.971%
+ 0.1%   Δp: -37.086%
+Minimum Δp: -94.993%
+RMS Δp    :  4.385 ± 0.043 %
+Same top p: 93.015 ± 0.067 %

scores/DeepSeek-R1-Distill-Llama-8B-q6_k.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  13.846273 ±   0.117603
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  99.39%
+Mean ln(PPL(Q)/PPL(base))     :  -0.011699 ±   0.000939
+Mean PPL(Q)/PPL(base)         :   0.988369 ±   0.000928
+Mean PPL(Q)-PPL(base)         :  -0.162943 ±   0.013097
+====== KL divergence statistics ======
+Mean    KLD:   0.044284 ±   0.000722
+Maximum KLD:  12.169687
+99.9%   KLD:   3.787726
+99.0%   KLD:   1.212246
+99.0%   KLD:   1.212246
+Median  KLD:   0.004281
+10.0%   KLD:   0.000100
+ 5.0%   KLD:   0.000020
+ 1.0%   KLD:   0.000001
+Minimum KLD:  -0.000077
+====== Token probability statistics ======
+Mean    Δp:  0.326 ± 0.013 %
+Maximum Δp: 98.618%
+99.9%   Δp: 65.197%
+99.0%   Δp: 15.137%
+95.0%   Δp:  4.119%
+90.0%   Δp:  2.167%
+75.0%   Δp:  0.376%
+Median  Δp:  0.000%
+25.0%   Δp: -0.274%
+10.0%   Δp: -1.794%
+ 5.0%   Δp: -3.369%
+ 1.0%   Δp: -8.767%
+ 0.1%   Δp: -26.074%
+Minimum Δp: -85.045%
+RMS Δp    :  4.831 ± 0.068 %
+Same top p: 94.289 ± 0.061 %

scores/DeepSeek-R1-Distill-Llama-8B-q8_0.log ADDED Viewed

	@@ -0,0 +1,37 @@

+====== Perplexity statistics ======
+Mean PPL(Q)                   :  14.034924 ±   0.119030
+Mean PPL(base)                :  14.009216 ±   0.118474
+Cor(ln(PPL(Q)), ln(PPL(base))):  99.93%
+Mean ln(PPL(Q)/PPL(base))     :   0.001833 ±   0.000321
+Mean PPL(Q)/PPL(base)         :   1.001835 ±   0.000322
+Mean PPL(Q)-PPL(base)         :   0.025708 ±   0.004525
+====== KL divergence statistics ======
+Mean    KLD:   0.001945 ±   0.000033
+Maximum KLD:   2.361588
+99.9%   KLD:   0.088093
+99.0%   KLD:   0.026191
+99.0%   KLD:   0.026191
+Median  KLD:   0.000515
+10.0%   KLD:   0.000015
+ 5.0%   KLD:   0.000003
+ 1.0%   KLD:  -0.000000
+Minimum KLD:  -0.000085
+====== Token probability statistics ======
+Mean    Δp: -0.066 ± 0.003 %
+Maximum Δp: 35.566%
+99.9%   Δp:  8.162%
+99.0%   Δp:  3.022%
+95.0%   Δp:  1.092%
+90.0%   Δp:  0.545%
+75.0%   Δp:  0.066%
+Median  Δp: -0.001%
+25.0%   Δp: -0.166%
+10.0%   Δp: -0.787%
+ 5.0%   Δp: -1.385%
+ 1.0%   Δp: -3.441%
+ 0.1%   Δp: -8.874%
+Minimum Δp: -78.643%
+RMS Δp    :  1.131 ± 0.027 %
+Same top p: 98.203 ± 0.035 %