LTX2.3 是 Lightricks 推出的开源音视频生成模型支持文生视频、图生视频、音频驱动生成视频原生音画同步、支持 4K / 竖屏消费级显卡可本地部署一键整合包开箱即用。一、LTX2.3 是什么LTX‑2.3 是 Lightricks 发布的开源视频生成基础模型基于 Diffusion TransformerDiT架构参数量约 220 亿。核心能力✅文生视频text‑to‑video文字描述生成视频✅图生视频image‑to‑video图片生成连续动态视频✅音频驱动audio‑to‑video输入音频生成同步画面✅原生音画同步一次推理生成视频 音频无需后期配音✅4K 分辨率 竖屏9:16适配短视频平台二、软件核心特点多模态输入输出文、图、音三种输入模式覆盖短视频、内容创作、批量生成场景灵活适配需求。原生音视频同步区别于多数模型 “先画面后配音”LTX2.3 同步生成音画无需后期对齐一步到位。竖屏原生支持9:16 竖屏直接输出无需裁剪适配抖音、快手等平台。细节与提示词优化相比前代细节更清晰、提示词理解更准、纹理表现提升生成效果更稳定。时长与帧率灵活单次最长生成 20 秒视频支持 24/25/48/50 帧适配不同画质需求。三、本地部署硬件要求推荐配置显卡RTX 4090最佳RTX 3060/4060 可跑降分辨率显存≥12GB1080p 稳定8GB 需用量化模型内存≥32GB复杂生成更稳系统Windows 10/11、Linux模型版本选择官方提供原始 / FP8 量化 / 精简版低显存优先选量化版平衡速度与画质。四、与主流开源模型对比表格特征LTX‑2.3Wan 2.2其他开源模型核心架构DiT扩散 Transformer扩散架构多样参数量约 220 亿较少依模型而定音视频同步原生支持同生成需后处理多数不支持竖屏原生支持✅❌❌多输入支持文 / 图 / 音文生 / 图生多数仅文 / 图最高分辨率4K低于 4K部分可扩展本地部署✅✅多数支持总结LTX2.3 胜在音画同步、竖屏适配、多模态短视频创作首选Wan 2.2 清晰度略优。五、一键整合包安装教程新手友好第一步下载整合包LTX2.3 安装地址: https://pan.baidu.com/s/1j7Fci5qkl04s9p6KqDC0rQ?pwd8888 提取码: 8888后续会有陆续更新音频以及相应扩展插件丰富生成的各类场景视频有兴趣的可以保存订阅第二步解压避坑解压到纯英文路径示例D:\AI\LTX2.3中文路径易报错。第三步环境准备安装 NVIDIA 显卡驱动 CUDA适配 PyTorch安装 Python 3.10第四步启动运行进入目录安装依赖pip install -r requirements.txt启动界面python run_server.py浏览器打开http://127.0.0.1:7860选择生成模式文 / 图 / 音第五步生成参数调整分辨率1080p12G 显存/720p8G 显存帧率24 帧通用时长≤20 秒模式fast快速/pro高清六、使用注意事项低显存降分辨率、用量化模型、分段生成提示词精准描述细节提升生成稳定性复杂场景人物 / 复杂构图易细节偏差多试几次总结LTX2.3 是消费级显卡可跑的全能开源视频模型文生 / 图生 / 音频驱动全覆盖音画同步 竖屏原生支持一键整合包免配置短视频、自媒体、AI 创作必备。