qwen:0.5b-text-v1.5-q3_K

qwen

Qwen 1.5 is a series of large language models by Alibaba Cloud spanning from 0.5B to 110B parameters

0.5b 1.8b 4b 7b 14b 32b 72b 110b

4.5M Pulls Updated 11 months ago

379 Tags

qwen:0.5b-text-v1.5-q3_K_L ... /

model

40ea46bf5a3a · 364MB

Metadata

general.architecture

qwen2

qwen2
general.file_type

Q3_K_L

Q3_K_L
qwen2.attention.head_count

16

16
qwen2.attention.head_count_kv

16

16
qwen2.attention.layer_norm_rms_epsilon

1e-06

1e-06
qwen2.block_count

24

24
qwen2.context_length

32768

32768
qwen2.embedding_length

1024

1024
qwen2.feed_forward_length

2816

2816
qwen2.use_parallel_residual

true

true
tokenizer.ggml.bos_token_id

151643

151643
tokenizer.ggml.eos_token_id

151643

151643
tokenizer.ggml.merges

[Ġ Ġ, ĠĠ ĠĠ, i n, Ġ t, ĠĠĠĠ ĠĠĠĠ, ...]

[Ġ Ġ, ĠĠ ĠĠ, i n, Ġ t, ĠĠĠĠ ĠĠĠĠ, ...]
tokenizer.ggml.model

gpt2

gpt2
tokenizer.ggml.padding_token_id

151643

151643
tokenizer.ggml.token_type

[1, 1, 1, 1, 1, ...]

[1, 1, 1, 1, 1, ...]
tokenizer.ggml.tokens

[!, ", #, $, %, ...]

[!, ", #, $, %, ...]

Tensor

Name

Type

Shape
token_embd.weight

Q3_K

Q3_K

[1024, 151936]

blk.0

blk.0.attn_k.bias

F32

F32

[1024]
blk.0.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.0.attn_norm.weight

F32

F32

[1024]
blk.0.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.0.attn_q.bias

F32

F32

[1024]
blk.0.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.0.attn_v.bias

F32

F32

[1024]
blk.0.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.0.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.0.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.0.ffn_norm.weight

F32

F32

[1024]
blk.0.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.1

blk.1.attn_k.bias

F32

F32

[1024]
blk.1.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.1.attn_norm.weight

F32

F32

[1024]
blk.1.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.1.attn_q.bias

F32

F32

[1024]
blk.1.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.1.attn_v.bias

F32

F32

[1024]
blk.1.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.1.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.1.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.1.ffn_norm.weight

F32

F32

[1024]
blk.1.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.2

blk.2.attn_k.bias

F32

F32

[1024]
blk.2.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.2.attn_norm.weight

F32

F32

[1024]
blk.2.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.2.attn_q.bias

F32

F32

[1024]
blk.2.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.2.attn_v.bias

F32

F32

[1024]
blk.2.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.2.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.2.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.2.ffn_norm.weight

F32

F32

[1024]
blk.2.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.3

blk.3.attn_k.bias

F32

F32

[1024]
blk.3.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.3.attn_norm.weight

F32

F32

[1024]
blk.3.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.3.attn_q.bias

F32

F32

[1024]
blk.3.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.3.attn_v.bias

F32

F32

[1024]
blk.3.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.3.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.3.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.3.ffn_norm.weight

F32

F32

[1024]
blk.3.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.4

blk.4.attn_k.bias

F32

F32

[1024]
blk.4.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.4.attn_norm.weight

F32

F32

[1024]
blk.4.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.4.attn_q.bias

F32

F32

[1024]
blk.4.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.4.attn_v.bias

F32

F32

[1024]
blk.4.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.4.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.4.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.4.ffn_norm.weight

F32

F32

[1024]
blk.4.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.5

blk.5.attn_k.bias

F32

F32

[1024]
blk.5.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.5.attn_norm.weight

F32

F32

[1024]
blk.5.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.5.attn_q.bias

F32

F32

[1024]
blk.5.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.5.attn_v.bias

F32

F32

[1024]
blk.5.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.5.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.5.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.5.ffn_norm.weight

F32

F32

[1024]
blk.5.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.6

blk.6.attn_k.bias

F32

F32

[1024]
blk.6.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.6.attn_norm.weight

F32

F32

[1024]
blk.6.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.6.attn_q.bias

F32

F32

[1024]
blk.6.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.6.attn_v.bias

F32

F32

[1024]
blk.6.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.6.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.6.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.6.ffn_norm.weight

F32

F32

[1024]
blk.6.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.7

blk.7.attn_k.bias

F32

F32

[1024]
blk.7.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.7.attn_norm.weight

F32

F32

[1024]
blk.7.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.7.attn_q.bias

F32

F32

[1024]
blk.7.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.7.attn_v.bias

F32

F32

[1024]
blk.7.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.7.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.7.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.7.ffn_norm.weight

F32

F32

[1024]
blk.7.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.8

blk.8.attn_k.bias

F32

F32

[1024]
blk.8.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.8.attn_norm.weight

F32

F32

[1024]
blk.8.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.8.attn_q.bias

F32

F32

[1024]
blk.8.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.8.attn_v.bias

F32

F32

[1024]
blk.8.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.8.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.8.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.8.ffn_norm.weight

F32

F32

[1024]
blk.8.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.9

blk.9.attn_k.bias

F32

F32

[1024]
blk.9.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.9.attn_norm.weight

F32

F32

[1024]
blk.9.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.9.attn_q.bias

F32

F32

[1024]
blk.9.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.9.attn_v.bias

F32

F32

[1024]
blk.9.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.9.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.9.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.9.ffn_norm.weight

F32

F32

[1024]
blk.9.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.10

blk.10.attn_k.bias

F32

F32

[1024]
blk.10.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.10.attn_norm.weight

F32

F32

[1024]
blk.10.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.10.attn_q.bias

F32

F32

[1024]
blk.10.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.10.attn_v.bias

F32

F32

[1024]
blk.10.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.10.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.10.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.10.ffn_norm.weight

F32

F32

[1024]
blk.10.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.11

blk.11.attn_k.bias

F32

F32

[1024]
blk.11.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.11.attn_norm.weight

F32

F32

[1024]
blk.11.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.11.attn_q.bias

F32

F32

[1024]
blk.11.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.11.attn_v.bias

F32

F32

[1024]
blk.11.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.11.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.11.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.11.ffn_norm.weight

F32

F32

[1024]
blk.11.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.12

blk.12.attn_k.bias

F32

F32

[1024]
blk.12.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.12.attn_norm.weight

F32

F32

[1024]
blk.12.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.12.attn_q.bias

F32

F32

[1024]
blk.12.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.12.attn_v.bias

F32

F32

[1024]
blk.12.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.12.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.12.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.12.ffn_norm.weight

F32

F32

[1024]
blk.12.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.13

blk.13.attn_k.bias

F32

F32

[1024]
blk.13.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.13.attn_norm.weight

F32

F32

[1024]
blk.13.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.13.attn_q.bias

F32

F32

[1024]
blk.13.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.13.attn_v.bias

F32

F32

[1024]
blk.13.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.13.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.13.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.13.ffn_norm.weight

F32

F32

[1024]
blk.13.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.14

blk.14.attn_k.bias

F32

F32

[1024]
blk.14.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.14.attn_norm.weight

F32

F32

[1024]
blk.14.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.14.attn_q.bias

F32

F32

[1024]
blk.14.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.14.attn_v.bias

F32

F32

[1024]
blk.14.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.14.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.14.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.14.ffn_norm.weight

F32

F32

[1024]
blk.14.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.15

blk.15.attn_k.bias

F32

F32

[1024]
blk.15.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.15.attn_norm.weight

F32

F32

[1024]
blk.15.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.15.attn_q.bias

F32

F32

[1024]
blk.15.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.15.attn_v.bias

F32

F32

[1024]
blk.15.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.15.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.15.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.15.ffn_norm.weight

F32

F32

[1024]
blk.15.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.16

blk.16.attn_k.bias

F32

F32

[1024]
blk.16.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.16.attn_norm.weight

F32

F32

[1024]
blk.16.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.16.attn_q.bias

F32

F32

[1024]
blk.16.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.16.attn_v.bias

F32

F32

[1024]
blk.16.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.16.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.16.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.16.ffn_norm.weight

F32

F32

[1024]
blk.16.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.17

blk.17.attn_k.bias

F32

F32

[1024]
blk.17.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.17.attn_norm.weight

F32

F32

[1024]
blk.17.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.17.attn_q.bias

F32

F32

[1024]
blk.17.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.17.attn_v.bias

F32

F32

[1024]
blk.17.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.17.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.17.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.17.ffn_norm.weight

F32

F32

[1024]
blk.17.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.18

blk.18.attn_k.bias

F32

F32

[1024]
blk.18.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.18.attn_norm.weight

F32

F32

[1024]
blk.18.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.18.attn_q.bias

F32

F32

[1024]
blk.18.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.18.attn_v.bias

F32

F32

[1024]
blk.18.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.18.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.18.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.18.ffn_norm.weight

F32

F32

[1024]
blk.18.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.19

blk.19.attn_k.bias

F32

F32

[1024]
blk.19.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.19.attn_norm.weight

F32

F32

[1024]
blk.19.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.19.attn_q.bias

F32

F32

[1024]
blk.19.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.19.attn_v.bias

F32

F32

[1024]
blk.19.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.19.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.19.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.19.ffn_norm.weight

F32

F32

[1024]
blk.19.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.20

blk.20.attn_k.bias

F32

F32

[1024]
blk.20.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.20.attn_norm.weight

F32

F32

[1024]
blk.20.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.20.attn_q.bias

F32

F32

[1024]
blk.20.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.20.attn_v.bias

F32

F32

[1024]
blk.20.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.20.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.20.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.20.ffn_norm.weight

F32

F32

[1024]
blk.20.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.21

blk.21.attn_k.bias

F32

F32

[1024]
blk.21.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.21.attn_norm.weight

F32

F32

[1024]
blk.21.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.21.attn_q.bias

F32

F32

[1024]
blk.21.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.21.attn_v.bias

F32

F32

[1024]
blk.21.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.21.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.21.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.21.ffn_norm.weight

F32

F32

[1024]
blk.21.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.22

blk.22.attn_k.bias

F32

F32

[1024]
blk.22.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.22.attn_norm.weight

F32

F32

[1024]
blk.22.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.22.attn_q.bias

F32

F32

[1024]
blk.22.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.22.attn_v.bias

F32

F32

[1024]
blk.22.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.22.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.22.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.22.ffn_norm.weight

F32

F32

[1024]
blk.22.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

blk.23

blk.23.attn_k.bias

F32

F32

[1024]
blk.23.attn_k.weight

Q3_K

Q3_K

[1024, 1024]
blk.23.attn_norm.weight

F32

F32

[1024]
blk.23.attn_output.weight

Q5_K

Q5_K

[1024, 1024]
blk.23.attn_q.bias

F32

F32

[1024]
blk.23.attn_q.weight

Q3_K

Q3_K

[1024, 1024]
blk.23.attn_v.bias

F32

F32

[1024]
blk.23.attn_v.weight

Q5_K

Q5_K

[1024, 1024]
blk.23.ffn_down.weight

Q5_K

Q5_K

[2816, 1024]
blk.23.ffn_gate.weight

Q3_K

Q3_K

[1024, 2816]
blk.23.ffn_norm.weight

F32

F32

[1024]
blk.23.ffn_up.weight

Q3_K

Q3_K

[1024, 2816]

output.weight

Q6_K

Q6_K

[1024, 151936]
output_norm.weight

F32

F32

[1024]