WritingBench


10	llama-4-scout-17b-16e-instruct	Mistral AI	81.09


1	gemini-2.5-pro-preview-03-25	Google	81.09
2	qwen3-235b-a22b-thinking	Alibaba	80.48
3	claude-3-7-sonnet-thinking	Anthropic	78.83
4	claude-3-7-sonnet	Anthropic	78.48
5	deepseek-r1	DeepSeek	77.04
6	gpt-4.1	OpenAI	76.60
7	chatgpt-4o-2025-03-27	OpenAI	75.46
8	grok-3	xAI	75.27
9	o3-mini	OpenAI	74.95
10	deepseek-v3-2025-03-24	DeepSeek	74.53
11	gpt-4.5-preview	OpenAI	71.99
12	gemini-2.0-flash	Google	71.88
13	qwen-max	Alibaba	71.82
14	o1-preview	OpenAI	68.57
15	qwen-2.5-72b-instruct	Alibaba	63.63
16	gemini-1.5-pro	Google	61.94
17	mistral-large-instruct	Mistral AI	60.26
18	gpt-4o-mini	OpenAI	60.04
19	claude-3-5-sonnet	Anthropic	59.70
20	qwen-2.5-7b-instruct	Alibaba	56.02
21	llama-4-scout-17b-16e-instruct	Meta	55.82
22	qwen3-0.6b-thinking	Alibaba	55.62
23	llama-4-maverick-17b-128e	Meta	55.14
24	claude-3-5-haiku	Anthropic	54.52
25	qwen3-0.6b-nothinking	Alibaba	50.94
26	llama-3.3-70b-instruct	Meta	50.43
27	llama-3.1-8b-instruct	Meta	44.17
28	llama-3.2-3b-instruct	Meta	42.38
29	llama-3.2-1b-instruct	Meta	33.69


10	llama-4-scout-17b-16e-instruct	81.09	81.04	79.47	80.90	82.96	81.91	80.77


1	gemini-2.5-pro-preview-03-25	81.09	81.04	79.47	80.90	82.96	81.91	80.77
2	qwen3-235b-a22b-thinking	80.48	79.86	78.72	79.73	82.48	81.06	81.97
3	claude-3-7-sonnet-thinking	78.83	78.66	77.68	77.61	80.10	79.12	80.78
4	claude-3-7-sonnet	78.48	78.24	77.93	76.51	79.37	79.26	80.88
5	deepseek-r1	77.04	75.87	73.58	76.74	78.50	78.50	81.34
6	gpt-4.1	76.60	76.48	75.21	76.13	77.73	77.23	77.59
7	chatgpt-4o-2025-03-27	75.46	74.40	73.42	74.38	77.91	75.86	78.08
8	grok-3	75.27	74.72	74.08	76.19	75.23	77.17	74.91
9	o3-mini	74.95	75.08	75.10	73.97	75.42	77.51	73.19
10	deepseek-v3-2025-03-24	74.53	73.75	72.42	73.62	76.14	74.61	78.09
11	gpt-4.5-preview	71.99	71.82	69.96	71.14	72.03	73.86	75.22
12	gemini-2.0-flash	71.88	72.77	70.23	70.93	71.70	73.64	73.66
13	qwen-max	71.82	71.40	69.43	70.32	73.09	73.98	74.98
14	o1-preview	68.57	68.54	67.01	66.57	69.53	70.31	71.41
15	qwen-2.5-72b-instruct	63.63	65.69	61.13	63.29	61.56	66.74	65.81
16	gemini-1.5-pro	61.94	61.54	57.85	59.92	64.28	65.24	66.09
17	mistral-large-instruct	60.26	62.00	59.03	59.12	56.84	63.41	63.92
18	gpt-4o-mini	60.04	59.98	56.77	57.47	61.18	63.28	65.05
19	claude-3-5-sonnet	59.70	59.05	57.68	56.32	59.36	62.00	67.70
20	qwen-2.5-7b-instruct	56.02	58.87	55.39	55.15	50.96	60.34	58.20
21	llama-4-scout-17b-16e-instruct	55.82	56.30	54.30	54.23	54.20	58.16	60.50
22	qwen3-0.6b-thinking	55.62	58.86	56.39	55.85	50.16	59.08	54.55
23	llama-4-maverick-17b-128e	55.14	54.65	52.41	53.65	54.73	57.48	61.14
24	claude-3-5-haiku	54.52	55.77	53.20	51.50	51.90	56.14	62.09
25	qwen3-0.6b-nothinking	50.94	55.31	52.32	50.74	45.08	52.70	50.17
26	llama-3.3-70b-instruct	50.43	50.67	49.25	47.90	48.52	52.92	56.56
27	llama-3.1-8b-instruct	44.17	45.51	44.35	40.76	40.50	47.46	49.84
28	llama-3.2-3b-instruct	42.38	44.50	42.03	39.52	38.46	45.28	47.80
29	llama-3.2-1b-instruct	33.69	38.56	34.18	30.14	29.54	34.83	37.03

1

gemini-2.5-pro-preview-03-25

81.09

82.00

81.82

81.09

86.00

80.80

72.50

83.00

78.00

84.60

84.00

85.17

78.44

84.00

72.73

83.75

82.00

77.75

77.00

78.75

86.40

79.64

82.60

86.15

83.60

77.17

80.00

83.82

77.71

79.83

82.83

81.57

76.75

75.00

74.50

78.24

73.40

76.00

83.33

83.78

86.55

77.25

81.54

85.33

82.86

79.60

80.00

81.83

80.67

84.20

80.00

79.56

78.57

85.67

79.50

80.46

72.29

75.09

78.67

83.50

79.11

87.09

86.80

78.67

84.00

83.33

85.14

84.18

86.50

85.33

84.00

86.00

82.50

77.40

82.67

81.82

84.89

77.64

88.50

84.44

76.15

82.00

83.14

85.71

81.50

79.00

74.86

79.25

81.33

84.57

76.00

79.00

80.46

79.38

77.76

83.86

84.73

80.25

79.09

86.77

79.07

2

qwen3-235b-a22b-thinking

80.48

83.33

83.82

83.45

81.67

83.40

80.33

78.83

80.75

77.60

80.25

77.67

78.22

79.83

79.64

79.50

75.40

74.75

77.50

83.75

81.20

81.27

78.80

78.62

82.00

79.17

78.18

80.55

79.71

81.67

79.17

79.43

78.75

74.00

80.25

78.12

76.30

68.73

80.89

82.00

79.82

84.50

83.23

74.00

79.14

80.53

77.60

79.50

81.83

82.40

80.67

78.44

79.43

80.67

80.83

78.92

78.00

72.73

92.33

87.00

83.33

86.55

85.60

84.00

80.36

81.07

88.00

84.55

83.50

84.33

87.00

85.25

79.50

75.60

84.50

78.36

76.44

74.36

85.75

73.56

80.62

83.33

85.43

82.57

80.50

84.50

77.14

78.75

82.00

79.71

84.00

81.33

82.15

83.08

78.47

86.14

82.55

78.25

83.09

82.15

80.80

3

claude-3-7-sonnet-thinking

78.83

80.67

79.82

81.27

76.50

81.80

73.17

79.67

73.75

80.60

81.50

79.67

78.00

81.00

74.73

80.25

78.60

78.00

80.50

78.25

80.00

79.45

82.40

79.85

80.40

78.50

79.45

79.27

71.14

80.67

83.67

77.57

75.00

76.67

78.00

74.94

72.60

70.00

78.00

82.00

79.82

80.25

81.08

81.33

78.86

76.27

77.07

76.00

73.17

79.80

76.67

79.33

76.57

80.67

76.17

75.69

74.29

72.91

80.33

83.50

73.78

85.82

85.20

75.33

79.64

83.20

78.86

83.09

73.50

84.83

80.33

81.00

84.50

76.60

78.50

78.55

73.33

74.73

83.25

80.67

80.00

80.67

80.86

81.00

75.50

78.00

73.71

80.50

73.67

78.14

78.86

79.00

80.15

83.23

75.88

83.14

81.09

80.50

76.55

86.62

82.13

4

claude-3-7-sonnet

78.48

83.33

80.55

83.27

74.67

81.60

68.00

82.00

73.00

83.40

83.75

79.50

74.67

80.50

71.64

78.50

79.40

76.50

78.50

78.25

81.60

78.91

80.20

81.85

81.60

77.67

79.64

78.91

76.29

77.83

82.50

78.57

77.00

78.67

78.00

77.65

70.60

71.82

77.11

82.44

77.82

79.00

78.77

78.00

73.71

77.20

75.73

73.83

75.00

79.60

70.00

76.44

74.29

77.00

79.69

72.86

70.55

80.00

82.00

76.89

83.64

83.20

72.00

72.55

81.87

79.14

84.00

77.50

84.33

79.17

80.50

83.67

73.80

77.33

79.27

74.00

76.73

84.50

82.00

79.08

78.22

82.29

82.00

76.00

76.75

72.00

78.00

77.33

79.57

80.57

77.00

79.38

82.46

75.06

83.86

82.00

81.75

78.55

87.38

81.07

5

deepseek-r1

77.04

84.67

80.00

82.00

77.33

79.00

78.67

74.83

76.00

72.00

74.50

73.67

71.78

76.50

76.73

74.50

70.80

69.25

79.50

80.50

80.80

79.27

73.80

75.23

78.40

75.33

72.91

70.55

72.86

74.50

74.33

73.43

70.50

69.00

73.25

72.71

71.80

61.09

77.11

81.33

74.91

85.75

82.92

79.11

73.71

79.20

77.20

74.17

78.00

79.67

74.00

76.29

67.00

77.50

75.38

76.29

64.18

89.67

84.50

83.33

85.27

80.80

87.33

79.82

76.40

83.71

83.27

81.50

79.17

80.67

74.50

76.00

72.60

78.67

70.55

73.33

68.36

82.00

80.89

79.23

81.78

80.00

73.25

81.50

75.14

74.50

77.67

75.57

84.29

82.00

82.77

80.15

81.18

85.57

80.18

77.00

81.27

80.46

79.73

6

gpt-4.1

76.60

78.00

79.27

77.82

73.67

77.00

72.00

78.83

75.50

78.00

79.25

80.83

76.89

79.33

68.00

79.75

74.80

72.50

79.50

75.00

84.40

77.27

77.60

75.69

76.60

76.33

77.45

76.57

72.83

78.17

70.14

73.50

78.33

76.50

74.12

72.20

68.55

76.22

78.89

78.00

77.25

77.23

79.78

78.00

74.93

75.07

76.33

75.83

81.40

76.67

78.89

71.71

79.67

74.67

75.23

72.86

67.09

74.00

80.00

81.11

80.91

78.40

82.00

74.73

78.80

79.43

78.73

79.00

78.33

77.67

79.00

78.50

74.40

78.17

73.64

76.67

75.64

80.75

79.56

78.46

79.78

78.57

81.43

75.75

75.25

68.29

75.25

71.67

76.00

78.00

76.33

77.08

76.62

71.53

79.29

80.00

79.25

76.00

83.54

77.87

7

chatgpt-4o-2025-03-27

75.46

77.33

76.73

76.36

74.33

75.00

69.83

77.33

78.25

74.20

74.75

72.50

76.44

74.50

69.45

74.50

75.20

71.25

74.00

75.00

83.20

75.45

74.40

76.62

76.60

73.67

75.45

74.00

75.71

75.00

75.67

71.71

71.25

73.00

71.50

71.65

70.00

63.82

76.67

78.67

74.36

76.50

77.38

78.00

77.71

74.67

74.53

75.83

76.00

72.80

73.67

72.00

74.57

68.00

75.33

74.62

68.00

64.73

77.00

81.00

83.11

82.18

81.20

82.67

77.82

77.33

79.71

79.27

82.50

79.67

78.67

77.25

81.67

70.80

74.50

73.27

72.67

75.45

80.50

78.67

78.77

82.44

77.71

75.71

75.00

74.50

71.43

73.25

66.33

72.71

77.71

79.33

78.31

76.77

76.00

80.14

82.00

73.75

78.18

79.85

76.93

8

grok-3

75.27

55.33

72.36

72.18

77.33

77.20

72.50

76.83

78.00

70.20

77.75

77.17

72.89

78.67

71.09

77.25

78.00

72.00

77.50

75.50

74.00

76.60

79.69

78.20

73.67

74.18

74.73

75.43

71.33

77.17

73.00

72.75

71.67

72.75

74.47

70.20

68.73

79.33

80.44

81.27

68.00

78.15

79.78

77.14

75.73

77.07

77.00

79.67

76.20

76.67

74.89

74.00

76.33

74.83

74.31

69.71

69.82

76.00

64.50

70.00

82.36

68.80

80.67

72.18

79.87

83.71

72.91

80.00

72.83

77.83

80.25

81.33

69.00

75.33

63.45

76.00

75.45

74.25

81.33

81.54

77.78

68.86

80.29

74.00

76.50

75.14

76.75

79.00

75.43

69.71

79.33

71.23

74.46

72.24

80.00

76.73

71.50

74.73

76.31

76.80

9

o3-mini

74.95

76.67

76.18

71.64

77.33

77.40

70.00

77.67

71.75

78.60

79.75

78.50

76.67

73.50

68.73

77.50

74.80

71.50

73.00

73.75

81.20

75.82

75.60

80.00

78.60

74.67

78.55

78.73

74.00

76.67

78.33

74.86

74.25

74.67

71.75

72.82

68.50

71.82

76.44

77.33

80.36

73.25

72.77

75.56

75.71

73.60

72.13

72.17

79.00

75.33

76.89

71.43

68.33

74.00

73.54

68.29

70.36

76.67

74.50

72.89

77.64

74.40

50.00

76.91

78.53

79.43

75.09

70.00

77.50

73.67

77.25

80.50

66.60

74.00

78.73

79.56

72.00

84.00

81.11

79.54

76.67

76.86

83.29

76.00

69.75

68.57

76.25

73.67

76.86

72.57

74.67

71.69

71.38

67.53

72.71

77.64

74.25

74.91

78.92

72.53

10

deepseek-v3-2025-03-24

74.53

80.67

76.18

76.91

75.50

79.00

75.67

72.50

76.00

68.60

71.75

72.67

71.78

73.83

75.45

74.25

68.20

67.25

79.00

75.75

80.40

76.18

74.40

71.69

73.00

72.33

72.36

72.55

71.71

70.83

73.50

73.00

67.25

65.67

75.50

74.24

72.00

62.18

76.67

77.56

73.82

65.00

79.08

79.56

74.57

74.27

77.20

76.83

78.00

76.20

71.00

71.78

72.00

65.67

73.00

70.62

68.00

61.82

82.67

82.50

85.11

81.09

82.80

88.00

75.09

76.53

79.14

80.91

81.50

76.83

77.17

78.75

76.50

72.00

75.17

64.91

70.89

59.82

79.00

75.56

77.08

79.33

73.71

74.14

71.25

75.00

74.00

71.25

73.67

71.43

79.14

80.67

81.85

78.00

75.88

79.86

75.09

76.75

76.00

77.85

78.93

11

gpt-4.5-preview

71.99

80.00

75.82

75.64

74.00

75.00

70.00

71.83

75.25

71.00

68.50

72.89

71.67

70.18

70.50

68.00

64.25

74.00

75.50

79.60

75.09

69.80

73.23

73.00

72.67

67.27

70.18

70.57

70.67

69.17

68.71

68.50

68.00

67.75

68.94

67.60

58.91

74.00

76.89

73.82

78.25

72.62

76.22

74.86

72.13

67.83

72.33

66.80

73.00

71.78

70.86

63.67

71.17

70.46

67.43

57.45

72.00

78.50

72.00

79.82

75.20

75.33

76.00

74.67

74.86

77.45

75.00

68.50

74.33

72.50

76.50

63.20

70.17

67.27

61.56

63.27

76.75

75.33

77.85

78.44

76.57

74.43

75.25

70.25

70.57

69.50

72.00

68.86

77.43

76.33

75.54

74.15

72.82

77.14

76.91

73.25

74.73

76.62

74.27

12

gemini-2.0-flash

71.88

78.67

76.00

72.73

79.17

70.80

67.00

75.33

72.50

76.60

69.00

76.33

69.56

73.67

63.64

74.75

74.40

68.50

74.00

71.50

75.20

69.27

75.20

80.62

75.80

70.50

72.18

73.64

68.86

71.67

68.00

72.14

66.50

66.67

62.75

66.00

64.10

66.18

75.11

75.56

77.82

66.25

72.62

72.67

71.43

73.07

72.13

75.67

68.50

72.40

73.33

63.11

68.29

69.67

69.83

72.00

63.14

60.36

72.00

74.50

74.67

76.91

76.40

76.67

72.00

75.73

72.86

74.73

68.00

73.50

67.83

75.00

70.00

69.40

66.50

67.64

68.89

67.09

82.25

80.67

75.85

73.33

70.29

76.14

76.00

71.00

66.29

71.25

65.67

70.14

75.43

72.33

74.00

73.08

74.47

72.57

75.09

75.50

70.55

75.54

72.27

13

qwen-max

71.82

79.33

76.36

74.18

73.33

70.20

72.33

72.00

73.75

68.40

74.25

72.17

72.67

70.83

68.18

68.25

68.20

62.50

76.50

72.50

75.60

73.45

72.00

71.38

69.60

69.67

73.27

68.36

71.43

66.83

71.33

70.57

65.75

67.33

66.75

67.65

66.90

61.09

76.67

74.89

74.55

75.00

73.38

70.67

74.00

70.00

70.93

69.83

71.83

70.20

69.33

71.14

69.33

68.50

66.46

66.00

56.73

74.33

77.00

78.67

75.09

78.40

78.67

74.36

73.33

74.86

75.09

74.00

72.67

71.17

75.75

71.33

70.40

67.67

71.45

69.11

71.27

77.00

76.44

76.46

76.89

74.29

73.71

76.00

73.75

69.43

68.00

75.00

70.86

77.14

77.67

76.62

75.38

73.18

77.71

76.18

72.50

73.45

73.08

73.87

14

o1-preview

68.57

52.67

71.27

73.09

63.67

67.20

70.33

65.17

69.25

68.20

74.00

75.00

67.56

70.00

68.18

68.25

63.20

66.75

72.00

71.50

76.40

72.00

74.40

68.77

68.60

68.17

70.91

71.45

70.29

64.33

67.83

64.57

66.00

67.67

64.00

56.12

63.00

62.55

68.89

72.67

65.27

68.00

70.77

70.89

77.43

66.00

68.00

69.33

60.17

69.60

65.67

62.44

61.43

74.00

64.67

63.08

63.43

55.82

74.33

76.50

77.33

71.82

73.20

74.67

71.82

74.80

70.57

66.00

68.00

70.17

60.50

72.25

71.33

64.40

64.50

65.45

68.00

67.27

77.75

70.00

75.08

72.67

71.71

75.14

68.75

67.00

66.86

66.50

55.67

67.71

77.14

76.00

74.77

70.77

67.29

69.14

70.73

71.25

72.00

75.85

67.60

15

qwen-2.5-72b-instruct

63.63

67.33

69.09

66.55

65.00

69.20

63.83

67.83

63.75

64.20

69.00

67.00

64.89

65.00

63.64

66.25

67.40

56.00

66.00

68.25

67.20

62.91

63.40

65.85

60.80

61.17

61.27

61.45

62.00

60.67

61.17

62.43

63.00

58.33

56.50

57.76

57.20

56.00

67.56

66.67

64.00

65.50

68.00

65.11

64.29

64.40

61.07

65.00

61.50

61.40

58.00

66.00

59.67

61.33

61.08

56.86

60.18

69.33

72.00

64.67

64.55

65.60

60.67

64.55

64.53

58.29

60.18

60.00

63.17

60.50

60.00

58.83

62.20

57.17

53.64

60.00

60.36

72.50

69.56

70.31

70.44

64.57

66.71

70.00

62.00

67.43

64.25

66.67

59.00

70.86

68.00

71.08

67.54

63.29

64.71

65.27

67.75

61.45

66.77

62.13

16

gemini-1.5-pro

61.94

59.33

67.64

66.18

67.17

66.20

63.83

58.17

66.75

57.20

60.25

62.33

61.56

61.50

59.82

60.25

57.40

44.25

63.50

67.00

71.60

60.73

64.80

60.92

60.40

60.33

57.27

58.73

58.57

56.67

57.29

53.25

53.00

51.50

56.12

53.50

48.73

61.78

66.22

60.91

63.75

58.92

64.00

62.86

59.87

59.47

63.33

63.67

61.00

51.67

53.56

60.57

63.00

58.83

59.23

56.86

48.91

76.33

68.50

70.67

69.82

68.00

74.67

67.64

65.33

63.14

66.18

68.00

60.83

66.17

65.50

62.00

62.80

61.17

59.27

56.00

53.45

73.00

66.44

67.23

66.22

65.43

65.57

62.00

66.00

68.29

62.00

62.33

60.14

70.86

71.33

72.31

64.62

68.00

67.86

66.91

59.50

64.00

63.23

60.80

17

mistral-large-instruct

60.26

70.67

68.73

65.82

64.17

61.40

63.17

59.67

57.25

63.40

61.25

66.00

58.89

60.17

62.73

59.50

61.40

49.75

64.50

63.75

60.80

60.73

61.40

61.85

60.20

58.83

60.36

62.00

61.71

58.83

59.00

58.43

58.50

57.33

59.00

56.71

54.70

52.55

62.67

61.33

61.45

60.25

59.54

59.78

61.43

57.87

59.87

60.50

60.67

57.40

55.67

58.89

60.00

59.33

59.17

58.92

53.43

53.09

68.67

66.00

62.00

56.91

60.80

60.00

56.55

59.33

60.29

59.45

56.50

59.00

57.00

51.50

54.00

53.80

53.33

54.36

53.56

48.55

67.25

69.11

66.46

60.44

65.43

62.14

68.25

62.50

65.71

58.25

59.67

58.00

70.00

68.67

70.15

69.54

65.65

57.86

63.27

62.75

62.18

60.15

58.27

18

gpt-4o-mini

60.04

72.67

67.27

64.73

63.50

59.80

61.67

61.00

57.25

61.20

56.50

57.83

60.44

61.33

56.36

56.00

56.60

48.00

61.50

63.25

58.40

62.55

60.00

60.31

58.60

59.67

58.36

59.43

54.83

53.29

56.75

53.00

53.75

54.94

54.10

47.64

62.22

60.44

60.55

62.25

58.00

58.44

59.14

59.47

60.40

57.83

57.00

56.60

55.67

57.33

53.43

46.67

57.67

53.38

56.86

50.91

67.67

66.50

66.00

65.82

64.00

62.91

61.47

61.14

64.00

62.50

62.33

59.17

66.25

61.33

57.20

55.67

58.18

57.11

52.73

66.75

66.44

63.38

63.11

66.29

62.29

65.25

62.25

66.00

60.50

66.00

57.29

71.71

68.67

69.08

65.38

64.71

63.43

65.45

63.25

62.55

62.15

63.60

19

claude-3-5-sonnet

59.70

75.33

67.64

66.18

60.67

59.60

64.17

60.33

53.75

60.40

53.00

60.17

56.67

49.50

62.18

53.25

55.40

49.75

64.50

71.00

62.80

64.00

63.20

62.46

60.00

62.33

58.36

54.18

56.00

55.83

53.67

57.86

52.25

53.00

52.75

53.18

56.20

48.73

59.33

62.67

62.18

64.25

54.00

60.44

60.57

56.67

54.53

55.67

59.33

52.60

58.00

52.89

63.14

52.00

56.33

49.08

56.29

44.91

73.67

72.50

75.56

66.91

61.60

67.33

67.09

56.67

54.86

66.55

59.00

52.17

58.67

63.25

54.17

57.20

52.67

57.27

41.78

51.64

65.00

62.22

63.54

63.56

63.43

62.71

57.00

62.50

68.57

59.00

56.67

59.57

70.57

72.33

74.77

71.08

68.59

69.71

62.18

64.00

65.82

65.38

62.00

20

qwen-2.5-7b-instruct

56.02

63.33

63.82

66.73

62.33

62.00

60.83

59.50

55.50

54.80

57.25

58.50

58.22

55.83

58.36

54.00

57.60

49.75

65.00

59.50

58.80

61.64

63.40

56.15

54.60

56.83

57.64

54.18

54.57

53.83

56.17

52.57

54.50

53.33

54.75

51.76

52.30

49.45

61.78

58.00

56.00

55.50

56.92

50.00

52.57

56.53

55.07

51.67

57.33

57.60

54.33

56.89

56.57

57.67

53.50

53.38

53.14

49.45

68.33

59.50

65.11

44.73

58.00

55.33

56.00

52.13

50.57

48.55

50.00

53.50

49.00

41.50

42.17

52.00

51.67

46.36

46.89

47.09

64.50

63.78

58.62

60.67

61.14

61.00

65.25

59.50

60.86

60.00

58.67

54.43

62.86

64.33

67.08

60.00

56.12

54.71

59.27

60.25

57.82

50.62

54.93

21

llama-4-scout-17b-16e-instruct

55.82

67.33

61.09

62.36

60.50

55.60

58.50

53.67

58.75

56.80

55.00

52.67

55.56

52.33

61.09

53.25

51.20

45.75

65.00

63.75

63.20

58.00

57.60

61.54

57.40

54.00

53.45

57.64

52.00

53.00

49.17

54.86

50.25

51.33

47.00

50.94

52.70

45.09

58.00

55.33

57.45

57.75

53.23

55.56

58.00

57.73

56.40

53.00

54.33

49.80

54.00

53.33

58.57

48.67

52.17

53.08

49.14

47.64

62.67

63.50

53.11

57.27

60.00

57.33

60.73

56.93

54.29

57.82

60.00

53.17

52.00

56.25

52.33

51.60

48.00

52.00

46.89

45.82

58.75

62.22

60.92

56.67

54.29

60.71

57.50

62.75

62.86

57.00

54.67

50.57

67.43

64.33

68.77

61.38

61.41

56.00

56.91

61.75

59.82

54.46

58.67

22

qwen3-0.6b-thinking

55.62

67.33

63.27

63.64

67.00

63.40

58.33

59.17

61.00

54.00

59.50

52.67

53.56

55.00

61.09

56.50

55.80

53.00

66.00

62.75

56.40

62.36

58.20

52.62

62.40

56.00

60.18

58.73

54.00

59.17

55.83

55.00

60.00

53.67

57.75

52.71

51.00

48.18

60.22

54.22

49.27

61.75

64.00

49.78

47.71

60.93

56.93

55.33

55.67

53.20

55.33

57.33

50.00

47.67

58.33

60.15

51.43

53.45

61.00

58.50

60.89

52.73

54.00

60.67

49.82

52.80

55.71

49.64

51.50

48.33

54.50

42.50

41.17

52.40

49.50

45.45

42.44

40.91

63.75

57.78

61.69

61.78

66.57

54.71

56.25

58.25

59.71

58.75

53.00

58.29

59.71

59.67

56.00

53.88

57.86

52.36

52.00

58.00

46.92

52.27

23

llama-4-maverick-17b-128e

55.14

74.67

58.36

62.55

59.00

53.80

55.83

53.83

57.50

52.60

51.75

52.83

52.44

52.17

55.82

50.50

50.00

45.00

65.00

63.25

59.60

58.00

53.00

59.69

53.80

53.33

50.00

52.36

53.14

50.17

45.17

52.29

49.75

48.33

48.00

50.00

51.30

45.27

59.33

56.89

54.36

62.75

49.23

54.67

58.57

54.13

55.73

55.33

53.67

51.40

48.67

50.22

61.71

56.00

51.50

47.85

50.00

47.64

65.00

58.50

62.67

57.64

58.80

74.00

58.55

55.07

53.14

59.64

57.50

51.50

55.17

52.75

55.33

52.00

54.67

48.36

44.22

43.45

61.00

56.89

62.92

58.44

53.14

56.71

59.00

59.50

62.29

54.75

58.67

49.71

67.71

63.33

67.69

60.46

61.76

58.00

57.64

62.00

58.91

59.54

59.47

24

claude-3-5-haiku

54.52

70.67

64.55

63.45

62.33

53.60

63.00

53.17

52.00

54.60

48.75

49.67

56.44

52.50

59.45

50.00

51.00

45.75

64.00

68.25

58.80

59.09

56.60

56.77

55.00

57.00

51.64

50.18

49.43

52.83

49.50

55.86

49.50

49.33

47.50

49.18

50.10

45.64

58.67

53.11

54.91

57.25

49.23

55.11

53.14

50.80

51.73

51.50

52.17

49.00

52.33

48.00

51.43

61.00

47.17

48.31

51.14

43.64

66.00

63.00

69.33

55.27

52.00

62.00

53.64

50.13

53.71

56.00

57.50

50.67

55.00

49.50

45.17

52.80

45.50

45.27

40.44

42.36

57.00

57.78

58.92

60.00

49.43

53.86

55.50

62.00

61.71

50.75

53.00

53.86

70.86

70.67

69.38

64.62

66.47

57.00

59.09

56.50

57.64

59.69

56.40

25

qwen3-0.6b-nothinking

50.94

62.67

58.55

62.67

61.00

51.33

57.67

57.50

53.80

55.25

48.67

49.33

53.50

55.82

54.25

55.00

47.75

65.50

60.75

56.00

58.00

53.80

49.23

54.60

52.17

56.55

54.91

51.71

52.33

52.67

50.57

56.75

54.00

53.50

47.88

45.40

44.36

59.11

51.11

46.91

50.75

50.77

44.89

42.29

54.13

51.20

53.17

52.33

50.40

47.33

52.89

45.43

43.67

54.67

53.23

47.14

50.55

45.00

57.00

51.33

44.36

49.20

50.67

43.09

47.60

48.00

44.00

46.00

48.50

46.67

40.25

39.17

48.20

45.33

42.36

42.44

36.73

54.75

50.44

53.23

52.44

61.71

50.29

56.00

49.50

48.29

56.75

51.00

51.14

55.14

51.67

52.62

53.69

52.35

48.86

48.55

50.50

52.18

43.23

46.40

26

llama-3.3-70b-instruct

50.43

54.00

56.18

57.67

46.80

55.00

46.17

53.75

53.00

44.75

47.00

52.22

46.83

55.64

48.25

46.80

38.75

64.00

62.00

48.00

54.36

53.80

52.31

47.20

52.17

46.73

48.36

52.86

49.33

44.00

49.29

45.00

48.00

43.50

43.18

50.10

43.45

50.67

48.67

54.55

52.50

45.54

49.56

48.57

47.60

51.87

41.17

48.67

44.20

54.00

46.00

54.86

52.00

44.33

44.15

50.29

39.27

64.33

54.00

46.22

51.45

52.40

49.33

52.00

48.93

50.00

51.09

53.00

47.33

46.33

50.00

50.83

48.80

40.33

45.27

42.44

42.73

52.00

56.44

56.15

54.00

51.14

49.29

52.50

54.75

58.00

51.50

54.00

49.00

64.57

63.67

62.92

57.08

60.71

50.00

53.64

56.75

55.09

49.38

54.80

27

llama-3.1-8b-instruct

44.17

52.67

50.18

51.82

53.67

43.80

52.00

43.50

41.75

41.60

42.50

43.33

48.00

42.00

48.18

39.75

41.80

35.00

61.00

53.25

44.40

48.73

50.80

46.15

43.60

45.67

43.64

45.27

49.71

45.17

38.50

44.57

42.25

44.00

40.00

37.29

44.10

36.55

47.56

44.00

42.36

36.75

43.38

37.78

42.29

39.07

41.33

42.00

40.17

40.20

40.33

41.78

36.57

49.67

38.33

39.69

43.14

33.09

51.33

42.50

46.00

38.18

44.00

44.67

44.36

43.07

40.57

39.64

46.50

42.33

37.00

39.50

40.00

45.40

34.50

35.64

36.67

33.45

47.50

49.56

46.46

47.78

42.29

44.86

54.25

49.00

52.57

49.25

44.33

45.00

57.14

59.33

55.85

51.08

56.12

43.29

43.27

53.00

48.00

42.46

46.27

28

llama-3.2-3b-instruct

42.38

44.00

50.55

47.64

50.83

41.40

51.00

41.67

47.25

44.60

39.75

40.00

50.22

42.33

47.09

40.25

38.80

34.25

52.50

49.00

39.60

46.00

47.40

40.46

40.40

42.00

42.18

43.09

46.00

43.33

38.83

40.00

40.75

41.00

37.75

36.82

44.00

38.73

45.56

37.11

40.00

34.75

39.85

40.22

40.57

39.73

41.47

42.83

37.67

36.00

45.67

40.44

32.29

41.33

35.83

40.15

46.57

34.91

40.33

40.00

43.78

39.82

39.20

38.00

44.55

40.67

40.86

34.55

45.00

40.33

37.33

37.25

36.50

39.20

34.17

34.00

35.78

34.73

41.00

52.44

46.00

46.29

40.00

49.00

45.75

52.86

43.50

44.67

41.86

56.57

60.00

52.46

52.31

56.24

41.00

42.18

50.25

43.82

34.62

44.80

29

llama-3.2-1b-instruct

33.69

40.00

46.18

42.18

45.50

34.00

43.83

36.33

37.75

42.80

33.25

30.17

41.11

34.83

44.55

38.25

33.40

28.00

44.50

37.50

38.00

42.18

37.00

26.92

30.00

39.00

38.55

34.00

40.86

38.00

32.67

32.57

32.00

39.33

26.75

28.59

33.30

28.36

28.44

31.33

32.18

23.75

31.54

32.00

25.14

34.80

25.47

34.83

26.17

26.00

32.67

34.44

25.43

28.67

26.33

31.08

42.00

30.55

25.33

34.50

32.22

32.00

31.20

22.67

36.73

33.33

27.43

23.09

21.50

30.50

32.83

22.00

26.50

31.20

31.17

26.55

28.89

29.27

29.25

35.33

31.54

33.33

41.71

31.71

43.75

33.25

34.86

36.25

34.00

36.71

43.43

49.00

40.62

41.69

45.65

30.14

32.55

39.50

32.00

26.31

33.73

🌟 WritingBench: A Comprehensive Benchmark for Generative Writing