Dynamic Typography——逆天！字体重绘生成SVG矢量动画模型开源啦（已开源）

香港科技大学与特勒维夫大学强强联手，推出了一个堪称动画界 “魔法棒” 的文本生成动画项目。现在，只要轻松输入文本和提示词，就能秒变 SVG 格式的矢量动画，动画创作从此进入 “傻瓜式” 时代！

以往，制作动画那可真是个技术活，从脚本构思到分镜设计，再到一帧一帧地绘制，没有三头六臂和数年功底，根本玩不转。可现在，这个新项目直接颠覆了传统流程，输入几个词，动画就自动生成，这是要让传统动画师 “下岗” 的节奏？

它的神奇之处究竟在哪？原来，在输入提示词后，模型就像拥有了一双 “火眼金睛”，能迅速找到需要变形的字母和图像。紧接着，它会把字母进行神奇的图形化处理，精准生成边缘控制点。这就好比给字母穿上了一件 “可塑衣”，每一个控制点都是改变它形状的 “魔法按钮”。

随后，模型会像一位不知疲倦的动画大师，逐帧生成相应的动画，而且还能巧妙地匹配字母形状。每一个动画帧都像是被精心雕琢的艺术品，流畅自然又不失创意。

这个开源模型的出现，对动画行业来说，无疑是一颗重磅炸弹。它降低了动画创作的门槛，让那些没有专业技能的普通人也能轻松过一把 “动画导演” 瘾。同时，对于专业动画师而言，这也是一个强大的助力工具，能大大提高创作效率，将更多精力放在创意构思上。

或许在不久的将来，我们会看到一大批由这个模型激发灵感而诞生的创意动画作品。它将彻底打破动画创作的壁垒，开启一个全民动画创作的新时代！

Dynamic Typography 即动态排版，是一种创新的自动化文本动画技术。以下是相关介绍：

核心技术：由香港科技大学和特拉维夫大学的研究人员开发，核心是通过视频扩散先验技术，根据用户文本提示对字母进行语义变形并赋予生动运动。其端到端优化框架利用向量图形表示和神经位移场，将字母转换为基础形状并应用每帧运动，使用 SVG 格式，具有分辨率无关性等优点。
生成过程：用户输入文本提示，系统接受字母并初始化为三次贝塞尔曲线控制点集合，通过字体库转换为封闭曲线。基础场将原始字母变形为基础形状，运动场预测控制点位移以注入运动，利用得分蒸馏采样技术从预训练模型中提取运动先验，通过优化确保动画与文本提示匹配，同时采用多种技术保持字母可读性和结构完整性，最终输出多帧视频展示字母动态转变。
显著优势：与多个基线模型相比，它具有对各种文本到视频模型的泛化能力，在保持可读性和语义对齐方面表现出色。通过定量和定性评估，生成的动画能忠实解释用户提示，且在保持文本可读性上效果突出，为文本动画领域带来新可能，让非专业人士也能创作专业级动态文本动画。