Nohobby
/

Q2.5-Qwetiapin-32B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Nohobby commited on Jan 24

Commit

7b5e93f

·

verified ·

1 Parent(s): 3044868

Update README.md

Files changed (1) hide show

README.md +75 -12

README.md CHANGED Viewed

@@ -1,28 +1,92 @@
 ---
-base_model: []
 library_name: transformers
 tags:
 - mergekit
 - merge
 ---
-# prikol
-This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 ## Merge Details
-### Merge Method
-This model was merged using the [SCE](https://arxiv.org/abs/2408.07990) merge method using Step2 as a base.
-### Models Merged
-The following models were included in the merge:
-* Step1
-### Configuration
-The following YAML configuration was used to produce this model:
 ```yaml
 models:
@@ -34,5 +98,4 @@ parameters:
   select_topk:
     - value: [0.3, 0.35, 0.4, 0.35, 0.2]
 dtype: bfloat16
-```

 ---
+base_model:
+- allura-org/Qwen2.5-32b-RP-Ink
+- deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
+- Aryanne/QwentileSwap
+- Daemontatox/Cogito-Ultima
 library_name: transformers
 tags:
 - mergekit
 - merge
 ---
+# Qwetiapin
+> There's no 'I' in 'brain damage'
+![]()
+### Overview
+I'll write something here later
+### Quants
+-
 ## Merge Details
+### Merging Steps
+### Step1
+```yaml
+dtype: bfloat16
+tokenizer_source: base
+merge_method: della_linear
+parameters:
+  density: 0.5
+  epsilon: 0.4
+  lambda: 1.1
+base_model: allura-org/Qwen2.5-32b-RP-Ink
+models:
+  - model: deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
+    parameters:
+      weight:
+        - filter: v_proj
+          value: [0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0]
+        - filter: o_proj
+          value: [1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1]
+        - filter: up_proj
+          value: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+        - filter: gate_proj
+          value: [0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0]
+        - filter: down_proj
+          value: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
+        - value: 0
+  - model: allura-org/Qwen2.5-32b-RP-Ink
+    parameters:
+      weight:
+        - filter: v_proj
+          value: [1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1]
+        - filter: o_proj
+          value: [0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0]
+        - filter: up_proj
+          value: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
+        - filter: gate_proj
+          value: [1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1]
+        - filter: down_proj
+          value: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
+        - value: 1
+```
+### Step2
+```yaml
+models:
+  - model: Aryanne/QwentileSwap
+    parameters:
+      weight: [1.0, 0.9, 0.8, 0.9, 1.0]
+  - model: Daemontatox/Cogito-Ultima
+    parameters:
+      weight: [0, 0.1, 0.2, 0.1, 0]
+merge_method: nuslerp
+parameters:
+  nuslerp_row_wise: true
+dtype: bfloat16
+tokenizer_source: base
+```
+### Step3
 ```yaml
 models:
   select_topk:
     - value: [0.3, 0.35, 0.4, 0.35, 0.2]
 dtype: bfloat16
+```