Dynamic Typography——逆天!字体重绘生成SVG矢量动画模型开源啦(已开源)

香港科技大学与特勒维夫大学强强联手,推出了一个堪称动画界 “魔法棒” 的文本生成动画项目。现在,只要轻松输入文本和提示词,就能秒变 SVG 格式的矢量动画,动画创作从此进入 “傻瓜式” 时代!
以往,制作动画那可真是个技术活,从脚本构思到分镜设计,再到一帧一帧地绘制,没有三头六臂和数年功底,根本玩不转。可现在,这个新项目直接颠覆了传统流程,输入几个词,动画就自动生成,这是要让传统动画师 “下岗” 的节奏?
它的神奇之处究竟在哪?原来,在输入提示词后,模型就像拥有了一双 “火眼金睛”,能迅速找到需要变形的字母和图像。紧接着,它会把字母进行神奇的图形化处理,精准生成边缘控制点。这就好比给字母穿上了一件 “可塑衣”,每一个控制点都是改变它形状的 “魔法按钮”。


随后,模型会像一位不知疲倦的动画大师,逐帧生成相应的动画,而且还能巧妙地匹配字母形状。每一个动画帧都像是被精心雕琢的艺术品,流畅自然又不失创意。
这个开源模型的出现,对动画行业来说,无疑是一颗重磅炸弹。它降低了动画创作的门槛,让那些没有专业技能的普通人也能轻松过一把 “动画导演” 瘾。同时,对于专业动画师而言,这也是一个强大的助力工具,能大大提高创作效率,将更多精力放在创意构思上。
或许在不久的将来,我们会看到一大批由这个模型激发灵感而诞生的创意动画作品。它将彻底打破动画创作的壁垒,开启一个全民动画创作的新时代!


Dynamic Typography 即动态排版,是一种创新的自动化文本动画技术。以下是相关介绍:
- 核心技术:由香港科技大学和特拉维夫大学的研究人员开发,核心是通过视频扩散先验技术,根据用户文本提示对字母进行语义变形并赋予生动运动。其端到端优化框架利用向量图形表示和神经位移场,将字母转换为基础形状并应用每帧运动,使用 SVG 格式,具有分辨率无关性等优点。
- 生成过程:用户输入文本提示,系统接受字母并初始化为三次贝塞尔曲线控制点集合,通过字体库转换为封闭曲线。基础场将原始字母变形为基础形状,运动场预测控制点位移以注入运动,利用得分蒸馏采样技术从预训练模型中提取运动先验,通过优化确保动画与文本提示匹配,同时采用多种技术保持字母可读性和结构完整性,最终输出多帧视频展示字母动态转变。
- 显著优势:与多个基线模型相比,它具有对各种文本到视频模型的泛化能力,在保持可读性和语义对齐方面表现出色。通过定量和定性评估,生成的动画能忠实解释用户提示,且在保持文本可读性上效果突出,为文本动画领域带来新可能,让非专业人士也能创作专业级动态文本动画。
ynamic Typography 的项目官网:https://gitcode.com/gh_mirrors/an/animate-your-word