近期,吉林大学人工智能学院发布了一项基于强化学习训练的 VLM 智能体最新研究《ScreenExplorer: Training a Vision-Language Model for Diverse Exploration in Open GUI World》。它让视觉语言模型(VLM)真正学会了「自我探索 GUI 环境」。
大家好,我是肆〇柒。长篇小说生成一直是大型语言模型(LLM)颇具挑战性的任务。话语连贯性(discourse coherence)与叙事复杂性(narrative complexity)是长篇小说生成,具有挑战性的难点。我扒拉论文的时候发现由清华提出的一篇论文《WRITER: A Multi-Agent Framework for Long Story Generation》,以其创新性的架构设计