商汤开源SenseNova U1图文交错增强版模型,支持多页连续创作

发布时间:2026-06-12 18:22

  商汤科技今日宣布开源商汤日日新 SenseNova U1 系列新成员 ——

  官方表示,该模型面向图文交错创作与生成场景进行了专项强化,更好地支持绘本、故事书、多页 PPT、图文教程等连续内容创作,解决传统多模态模型“多轮生成后角色形象飘移、画风断裂、图文脱节”等痛点。

  模型显著提升了长周期创作中的叙事连贯性、角色一致性与画风统一性。故事线在整个生成过程中被严格遵循,人物形象从第一页到最后一页均保持高度一致;

  经过专项训练,模型大幅改善了图像内容与文字描述之间的语义对齐能力。生成的画面能更准确地呈现文本所描述的复杂场景、动态动作与物体间的空间关系;

  针对人物结构、文字渲染、页面排版等高频高难区域进行了定向优化,显著降低了生成物中的

排行

精选