Info
本页来自 msprof-analyze 仓库根目录的 README.md,
构建时直接从 origin/master 导出。
MindStudio Profiler Analyze
📢 最新消息¶
- [2025.12.30]:新增
module_statistic分析能力:提供的针对PyTorch模型自动解析模型层级结构的分析能力,帮助精准定位性能瓶颈。
📌 简介¶
MindStudio Profiler Analyze(msprof-analyze)是面向 AI 训练与推理场景的性能分析工具,基于采集得到的 profiling 数据进行统计、比对和诊断,帮助定位计算、通信、调度及集群场景下的性能瓶颈。
📖 功能介绍¶
| 功能点 | 功能简介 | 资料链接 | 源码目录 |
|---|---|---|---|
| 专家建议 | 基于性能数据自动识别计算、调度、通信等潜在问题,并输出优化建议。 | 点击查看 | 点击查看 |
| 性能比对 | 支持 GPU/NPU、NPU/NPU 等多种场景的性能差异分析。 | 点击查看 | 点击查看 |
| 集群分析 | 汇总集群通信数据,输出结果支持在 MindStudio Insight 中可视化查看。 | 点击查看 | 点击查看 |
| 扩展分析 | 基于 DB 类型性能数据,提供可自定义的 Recipe 分析规则,目前已涵盖拆解对比、Host 下发、计算、通信等 20 余种多维度分析能力,便于灵活扩展。 | 点击查看 | 点击查看 |
🛠️ 工具安装¶
推荐直接通过 pip 安装:
如需 whl 包下载、源码编译,请参见 《安装指南》。
🚀 快速入门¶
msprof-analyze 常用分析命令如下:
# 集群通信汇总
msprof-analyze cluster -m all -d ./cluster_data
# 专家建议
msprof-analyze advisor all -d ./prof_data -o ./advisor_output
# 性能比对
msprof-analyze compare -d ./ascend_pt -bp ./gpu_trace.json -o ./compare_output
以 ResNet50 模型训练任务为例,《快速入门》贯穿从采集性能数据、执行 Advisor 分析到查看分析结果的完整流程,帮助您快速体验工具的核心功能。
🔍 目录结构¶
关键目录如下,详细信息参见 《目录结构说明》。
msprof-analyze
├── config # 配置文件目录
├── docs # 文档目录
├── msprof_analyze # 主代码包目录
│ ├── advisor # 专家建议模块
│ ├── cli # 命令行入口
│ ├── cluster_analyse # 集群分析模块
│ ├── compare_tools # 性能比对模块
│ ├── prof_common # 公共能力模块
│ └── prof_exports # 导出模块
├── requirements # 依赖管理目录
├── test # 测试目录
└── README.md # 项目说明文档
📝 相关说明¶
💬 建议与交流¶
欢迎大家为社区做贡献。如果有任何疑问或建议,请提交 Issues,我们会尽快回复。感谢您的支持。
🤝 致谢¶
本工具由华为公司的下列部门联合贡献:
- 昇腾计算 MindStudio 开发部
- 华为云昇腾云服务
- 昇腾计算生态使能部
- 2012 网络实验室
感谢来自社区的每一个 PR,欢迎贡献 msprof-analyze。
关于MindStudio团队¶
华为 MindStudio 全流程开发工具链团队致力于提供端到端的昇腾 AI 应用开发解决方案,使能开发者高效完成训练开发、推理开发和算子开发。欢迎通过 昇腾社区 了解更多相关产品与资料。