田渊栋等原班人马作:AI生成长篇故事,数千字长文也能连贯、有趣
zhezhongyun 2025-08-01 22:12 32 浏览
机器之心报道
编辑:小舟、陈萍
以后,写故事这脑力活可以交给 AI 了。
前段时间,模仿人类写作过程的语言模型 Re^3 发布,该模型不需要微调大模型,而是通过设计 prompt 来生成一致性强的故事。
现在,该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型,表示 DOC 比 Re^3 生成的故事更加连贯、有趣。
DOC 框架意指详细大纲控制(Detailed Outline Control),用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成:详细大纲组件(Detailed Outliner)、详细控制器(Detailed Controller)。
论文地址:https://arxiv.org/pdf/2212.10077.pdf
Detailed Outliner 负责创建详细的、分层结构的大纲,将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐,确保生成结果遵循详细的大纲。
该研究对模型自动生成故事的功能进行了人工评估,DOC 在多个指标上获得了大幅增益:情节连贯性(22.5%)、大纲相关性(28.2%)和趣味性(20.7%),大大优于 Re^3 模型。此外,DOC 在交互式生成环境中更易于控制。
DOC
与 Re^3 类似,DOC 通过将写作过程分解为计划、起草、重写和编辑步骤,生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤,即便如此,但对最终故事的质量没有影响。
不同于 Re^3 存在的缺点,如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等,DOC 旨在通过两项创新来解决这些缺点:通过 Detailed Outliner 实施更详细的规划,通过 Detailed Controller 在起草过程中相应地进行更详细的控制。
DOC 的高层概述。
Detailed Outliner
Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。
Detailed Controller
Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器,以根据给定的摘要指导段落生成。
在起草过程中,Detailed Controller 的灵活性体现在:
- 事件。将事件描述(图 2,橙色文本)逐字输入控制器。
- 设置。如果设置发生变化,该研究通过构建输入摘要来说明角色移动到新设置,与事件描述相比使用较低的控制强度。
- 角色。如果出现了一个没有出现在前一个大纲条目中的角色,该研究还是通过构建一个输入摘要来说明这一点,再次使用较低的控制强度。
实验与评估
该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落,而不是完整的故事。评估指标包括三个:连贯性、相关性以及趣味性。
结果如表 1 所示,DOC 生成的段落情节更加连贯且与大纲相关。
表 3 显示了 DOC 根据表 2 中的详细大纲(经大量删节)编写的一个故事(经大量删节):虽然有些问题仍然存在,但故事还保持整体连贯,遵循大纲内容。
人机交互故事生成:如表 4 所示,在四个人机交互指标上,人类更喜欢 DOC 而不是 RE^3 生成的故事:至少四分之三的人表示 DOC 在每个评估指标上都更优秀。
消融实验
为了评估 DOC 的两个主要组成部分,该研究对 DOC 进行了如下两种修改:
- DOC-NOOUTLINE,仅根据粗略大纲而不是完整的详细大纲生成故事,使用固定强度的 Detailed Controller。
- DOC-NOCONTROL,除了 Detailed Controller 关闭外,其他设置与 DOC 相同。
消融实验的结果如下表 5 所示:
该研究发现,与 Re^3 相比,趣味性的提高主要是由于 DOC 有更详细的大纲;而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现:进一步增加控制强度会产生更多重复的输出,这些输出越来越狭隘地拟合给定的大纲,而失去了创造力。
如下表 6 所示,该研究又进一步实验证明:Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。
了解更多研究,请参考原论文。
相关推荐
- Python入门学习记录之一:变量_python怎么用变量
-
写这个,主要是对自己学习python知识的一个总结,也是加深自己的印象。变量(英文:variable),也叫标识符。在python中,变量的命名规则有以下三点:>变量名只能包含字母、数字和下划线...
- python变量命名规则——来自小白的总结
-
python是一个动态编译类编程语言,所以程序在运行前不需要如C语言的先行编译动作,因此也只有在程序运行过程中才能发现程序的问题。基于此,python的变量就有一定的命名规范。python作为当前热门...
- Python入门学习教程:第 2 章 变量与数据类型
-
2.1什么是变量?在编程中,变量就像一个存放数据的容器,它可以存储各种信息,并且这些信息可以被读取和修改。想象一下,变量就如同我们生活中的盒子,你可以把东西放进去,也可以随时拿出来看看,甚至可以换成...
- 绘制学术论文中的“三线表”具体指导
-
在科研过程中,大家用到最多的可能就是“三线表”。“三线表”,一般主要由三条横线构成,当然在变量名栏里也可以拆分单元格,出现更多的线。更重要的是,“三线表”也是一种数据记录规范,以“三线表”形式记录的数...
- Python基础语法知识--变量和数据类型
-
学习Python中的变量和数据类型至关重要,因为它们构成了Python编程的基石。以下是帮助您了解Python中的变量和数据类型的分步指南:1.变量:变量在Python中用于存储数据值。它们充...
- 一文搞懂 Python 中的所有标点符号
-
反引号`无任何作用。传说Python3中它被移除是因为和单引号字符'太相似。波浪号~(按位取反符号)~被称为取反或补码运算符。它放在我们想要取反的对象前面。如果放在一个整数n...
- Python变量类型和运算符_python中变量的含义
-
别再被小名词坑哭了:Python新手常犯的那些隐蔽错误,我用同事的真实bug拆给你看我记得有一次和同事张姐一起追查一个看似随机崩溃的脚本,最后发现罪魁祸首竟然是她把变量命名成了list。说实话...
- 从零开始:深入剖析 Spring Boot3 中配置文件的加载顺序
-
在当今的互联网软件开发领域,SpringBoot无疑是最为热门和广泛应用的框架之一。它以其强大的功能、便捷的开发体验,极大地提升了开发效率,成为众多开发者构建Web应用程序的首选。而在Spr...
- Python中下划线 ‘_’ 的用法,你知道几种
-
Python中下划线()是一个有特殊含义和用途的符号,它可以用来表示以下几种情况:1在解释器中,下划线(_)表示上一个表达式的值,可以用来进行快速计算或测试。例如:>>>2+...
- 解锁Shell编程:变量_shell $变量
-
引言:开启Shell编程大门Shell作为用户与Linux内核之间的桥梁,为我们提供了强大的命令行交互方式。它不仅能执行简单的文件操作、进程管理,还能通过编写脚本实现复杂的自动化任务。无论是...
- 一文学会Python的变量命名规则!_python的变量命名有哪些要求
-
目录1.变量的命名原则3.内置函数尽量不要做变量4.删除变量和垃圾回收机制5.结语1.变量的命名原则①由英文字母、_(下划线)、或中文开头②变量名称只能由英文字母、数字、下画线或中文字所组成。③英文字...
- 更可靠的Rust-语法篇-区分语句/表达式,略览if/loop/while/for
-
src/main.rs://函数定义fnadd(a:i32,b:i32)->i32{a+b//末尾表达式}fnmain(){leta:i3...
- C++第五课:变量的命名规则_c++中变量的命名规则
-
变量的命名不是想怎么起就怎么起的,而是有一套固定的规则的。具体规则:1.名字要合法:变量名必须是由字母、数字或下划线组成。例如:a,a1,a_1。2.开头不能是数字。例如:可以a1,但不能起1a。3....
- Rust编程-核心篇-不安全编程_rust安全性
-
Unsafe的必要性Rust的所有权系统和类型系统为我们提供了强大的安全保障,但在某些情况下,我们需要突破这些限制来:与C代码交互实现底层系统编程优化性能关键代码实现某些编译器无法验证的安全操作Rus...
- 探秘 Python 内存管理:背后的神奇机制
-
在编程的世界里,内存管理就如同幕后的精密操控者,确保程序的高效运行。Python作为一种广泛使用的编程语言,其内存管理机制既巧妙又复杂,为开发者们提供了便利的同时,也展现了强大的底层控制能力。一、P...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 教程 (33)
- HTML 简介 (35)
- HTML 实例/测验 (32)
- HTML 测验 (32)
- JavaScript 和 HTML DOM 参考手册 (32)
- HTML 拓展阅读 (30)
- HTML文本框样式 (31)
- HTML滚动条样式 (34)
- HTML5 浏览器支持 (33)
- HTML5 新元素 (33)
- HTML5 WebSocket (30)
- HTML5 代码规范 (32)
- HTML5 标签 (717)
- HTML5 标签 (已废弃) (75)
- HTML5电子书 (32)
- HTML5开发工具 (34)
- HTML5小游戏源码 (34)
- HTML5模板下载 (30)
- HTTP 状态消息 (33)
- HTTP 方法:GET 对比 POST (33)
- 键盘快捷键 (35)
- 标签 (226)
- opacity 属性 (32)
- transition 属性 (33)
- 1-1. 变量声明 (31)
