在基于英特尔处理器的群集上分析、优化并部署高性能应用程序。“英特尔跟踪分析器和跟踪采集器”通过快速查找 MPI 通讯的性能瓶颈,提供了解与优化 MPI 群集性能的关键信息。7.0 版现在包含跟踪文件比较与计数器数据显示功能。 功能 使用“英特尔跟踪分析器和跟踪采集器 7.0”的 MPI 性能分析功能以及以下丰富的功能,可以提高并行应用程序的运行速度、确定热点与瓶颈的位置并提高工作效率: 界面与显示 统计信息跟踪 可伸缩性 指令插入与跟踪 兼容性 界面与显示 “时间线视图”与“并行显示”画面 显示并行应用程序的并发行为 计算特定时间间隔、进程或函数的统计信息 显示应用程序沿时间轴的活动、事件源代码位置以及消息传递情况 提供特定的并行执行阶段中函数组与通讯情况的时间线画面、调用图以及性能档案。 先进的 GUI 使用快速界面管理显示画面与统计信息 使用对象单击并放大功能提供更详细的信息、上下文相关子菜单以及成对显示的画面 提供重新计算后的统计信息的自动更新 显示画面缩放功能 浏览各个抽象级别的跟踪数据:群集、节点、进程、线程以及函数 详细与聚集视图 检查应用程序运行时行为的各个层面,可以按函数或进程进行分组 轻松确定花费在 MPI 通讯上的时间 轻松查看程序的两次运行之间的性能差异 容易使用 提供用户友好的应用程序编程接口 (API),以控制或记录用户事件 添加通用的计数器数据记录与分析功能 统计信息跟踪 通讯统计信息 显示并行应用程序的并发行为 显示任意时间间隔的统计信息 跟踪算法更改带来的性能提高 执行统计信息 提供子例程执行统计信息或调用树特征信息 评测库 记录基于事件的分布式跟踪数据 统计信息可读性 记录函数调用、已发送的消息以及集合操作的信息 评测库 记录基于事件的分布式跟踪数据 可伸缩性 开销极低 提供结构化跟踪文件 (STF) 格式,以实现可伸缩性 生成跟踪文件的速度更快 允许随机访问跟踪信息的一部分,适合分析大量的跟踪数据 线程安全性 跟踪多线程 MPI 应用程序,以实现对非 MPI 应用程序进行基于事件的跟踪 故障保护模式 即便在提前退出程序时,也能写入跟踪文件 过滤与内存处理 将跟踪数据缓存到内存中,以减少时间开销和内存消耗 指令插入与跟踪 低入侵度的指令插入 支持使用 C、C++ 或 Fortran 的 MPI 应用程序 函数库支持使用 C、C++、Fortran 或 Java* 的分布式非 MPI 应用程序 自动记录 C、C++、Fortran 或 Java 多线程进程中的并行线程的性能数据 二进制指令插入(对于 IA-32 与“英特尔64”) 给现有的二进制可执行文件创建并添加插入的指令,以便自动监视函数的入口/出口,对用户代码与应用程序运行时进行详细的分析 使用指令插入功能跟踪 C++ 与 Java 类的层次关系 英特尔MPI 库 支持跟踪内部 MPI 状态