介绍

什么是 Happy Horse 1.0?

Happy Horse 1.0 是一个 150 亿参数的开源 AI 视频生成模型,基于统一 Transformer 架构。它能通过文本或图片提示,在单次前向传播中同时生成电影级 1080p 视频和同步音频——包括对话、环境音和拟音效果。

核心能力

  • 文本转视频:通过自然语言提示生成电影级视频场景,精确控制构图、运动和主体一致性。
  • 图片转视频:将静态图片动画化为动态视频,保留原始构图、主体特征和视觉风格。
  • 音视频联合生成:在生成视频的同时同步产出对话、环境音和拟音效果,无需单独的音频流水线。
  • 多语言口型同步:原生支持 6 种语言口型同步:中文(普通话和粤语)、英文、日文、韩文、德文和法文。

模型架构

Happy Horse 1.0 采用 40 层自注意力 Transformer,两端各有 4 层模态专用层,中间 32 层为共享层。视频、音频和文本全部在统一的 token 序列中流转,消除了跨注意力开销,实现联合生成。

模型使用 8 步蒸馏推理流水线,无需分类器引导,生成速度远快于传统扩散模型。

快速开始

  1. 访问首页,使用浏览器端视频生成器——无需 GPU 或本地环境配置。
  2. 选择模型(Happy Horse 1.0 或 Seedream 2.0)和输入模式(文本转视频或图片转视频)。
  3. 输入提示词,点击生成,创建你的第一个视频。

积分系统

视频生成消耗积分:

模式每次生成消耗
文本转视频6 积分
图片转视频8 积分

价格页面购买积分包或订阅月度计划。

支持

如有问题或反馈,请联系 support@ai-happy-horse.io