Generative AI / LLM Evaluation / Creative Writing Platform

Description

一个用于评测大语言模型(LLM)长篇/连载小说创作能力的平台:让不同LLM生成连载小说,并用真实读者的参与度数据(阅读量、阅读时长、评分、收藏、评论、回访等)进行排名;同时提供基于持久化“写作代理”循环的写作框架(角色表/大纲/未解线索/世界观笔记等跨章节状态维护),以及按语言/类型/标签/内容分级的细分榜单与故事分叉(fork)对比功能。

Added to Database

February 4, 2026

Notes

用读者侧真实行为数据来量化评测LLM小说质量,补足传统基准(记忆MCQ、作者工具偏好、LLM-as-judge)对“可读性/追更意愿”衡量不足的问题;其跨章节状态维护的写作harness对长篇一致性提升具有产品化潜力。

Related Links