Narrator

Generative AI / LLM Evaluation / Creative Writing Platform

Description

一个用于评测大语言模型（LLM）长篇/连载小说创作能力的平台：让不同LLM生成连载小说，并用真实读者的参与度数据（阅读量、阅读时长、评分、收藏、评论、回访等）进行排名；同时提供基于持久化“写作代理”循环的写作框架（角色表/大纲/未解线索/世界观笔记等跨章节状态维护），以及按语言/类型/标签/内容分级的细分榜单与故事分叉（fork）对比功能。

Added to Database

February 4, 2026

Notes

用读者侧真实行为数据来量化评测LLM小说质量，补足传统基准（记忆MCQ、作者工具偏好、LLM-as-judge）对“可读性/追更意愿”衡量不足的问题；其跨章节状态维护的写作harness对长篇一致性提升具有产品化潜力。

Narrator

Description

Added to Database

Notes

Related Links