CANN/DeepSeek-V3.2-Exp配置说明

张

张建站

2026/5/9 15:54:32

10分钟阅读

YAML Parameter Description【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-inferThe configuration instructions in the YAML file can be found below.Basic Config model_name: deepseek_v3.2_exp # The model name. String type model_path: /data/models/DeepSeek-V3.2-Exp-bf16/ # The model path. String type exe_mode: ge_graph # The execution mode. Only support [ge_graph, eager, acl_graph] world_size: 128 # The world size. Int type Model Config pa_block_size: 128 # PA Block Size value. Support [128, 256] enable_weight_nz: True # Whether use nz-weight format for better performance. Support [False, True] with_ckpt: True # Whether load ckpt. Support [False, True] enable_multi_streams: True # Whether enable multistream for better performance. Support [False, True] enable_profiler: True # Whether enable profiling. Support [False, True] enable_cache_compile: False # Whether enable cache compile for better performance. Support [False, True] prefill_mini_batch_size: 0 # Mini_batch_size for prefill stage. perfect_eplb: False # Whether enable, test uniform scenario of MoE experts. Support [False, True] enable_auto_split_weight: True # Whether enable auto-split weight. Support [False, True] next_n: 1 # Steps using multi-token prediction. Support [0, 1, 2, 3] enable_offload: False # Whether enable offload. Support [False, True] Data Config dataset: default # Support [default InfiniteBench LongBench] input_max_len: 8192 # The input max length max_new_tokens: 100 # Max new tokens batch_size: 128 # Global batch size Parallel Config cp_size: 128 # Context Parallel Number. When using CP, cp_size should be the same as world_size; otherwise, set cp_size to 1. Only active at prefill stage attn_tp_size: 1 # Attention TP Number oproj_tp_size: 8 # Oproj TP Number. Only support when attn_tp_size 1 dense_tp_size: 1 # Dense MLP TP Number moe_tp_size: 1 # MoE TP Number embed_tp_size: 16 # Embed TP Number lmhead_tp_size: 16 # LMHead TP Number【免费下载链接】cann-recipes-infer本项目针对LLM与多模态模型推理业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

保姆级教程：用ArcGIS Pro的克里金插值和栅格计算器，搞定水源涵养量评估

从零到精通：ArcGIS Pro水源涵养量评估全流程实战指南当你第一次在学术论文中看到"水源涵养量评估"这个专业术语时，是否感到无从下手？作为生态规划的基础性工作，准确评估水源涵养能力不仅关系到学术研究的严谨性&#x…...

2026/5/9 15:51:34 阅读更多 →

CANN TorchAir FX Pass实践

TorchAir自定义FX Pass 【免费下载链接】cann-learning-hub CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。项目地址: https://gitcode.com/cann/cann-learning-hub 在昇腾NP…...

2026/5/9 15:50:30 阅读更多 →

AI Commander：命令行工具如何革新AI内容创作与自动化流程

1. 项目概述：一个面向AI内容创作的命令行工具箱最近在折腾AI相关的自动化流程，发现很多重复性的工作，比如批量处理提示词、转换文件格式、调用不同模型API，都需要自己写脚本，既麻烦又难以维护。后来在GitHub上发现了一…...

2026/5/9 15:49:31 阅读更多 →

环境配置与基础教程：2026自动化标注黑科技：使用 Segment Anything (SAM) 零样本辅助标注 YOLO 分割与检测数据集

编者按在计算机视觉项目中，数据标注一直是最让人头疼的环节。根据社区普遍反馈（源自多个CSDN项目经验和公开技术报告），传统人工标注一张包含精细多边形掩码的图像需要3到10分钟，而一个完整的实例分割数据集往往需要上千张图片。如果你曾经带领团队连续加班数周只为了完成…...

2026/5/8 18:17:36 阅读更多 →

如何3步完成TikTok评论数据采集：开源工具的高效实战指南

如何3步完成TikTok评论数据采集：开源工具的高效实战指南【免费下载链接】TikTokCommentScraper 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokCommentScraper TikTokCommentScraper是一个专为抖音内容创作者、市场分析师和社区运营者设计的开源数据…...

2026/5/8 11:05:15 阅读更多 →