/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
Intel Parallel Studio XE 2020是一款全新软件开发套件,通过内置的性能分析器、优化矢量化、线程原型设计、内存和线程的一些调试的工具来构建用户需要的相关功能。它主要是帮助用户将本地代码开发在C ++、C和Fortran上的各跨平台上。
Intel Parallel Studio XE是一套非常优秀的软件开发工具,由著名计算机工业巨头英特尔所开发。软件通过使用最新的技术,如矢量化、多线程、多节点并行化和内存优化,可以帮助用户在Windows、MacOS、Linux等C++、C和Fortran平台上更快速地进行本地代码开发,从而简化代码的构建和更新。通过C、C++、Fortran和Python软件开发人员,可以更快地创建代码,提高应用程序的性能,从而在当前和将来的英特尔平台上进行扩展,并更快地生成代码,从而简化并行代码的创建。而且最近该软件还升级到了最新的版本Intel Parallel Studio XE 2020,该版本中添加并且优化了许多新功能,比如现在能够在最新的英特尔®至强®和英特尔®酷睿™处理器上,使用英特尔®高级向量扩展512指令来编写可扩展和改进并行性能的应用程序。同时能够通过OpenMP*对代码进行矢量化和线程化,以利用包括英特尔AVX-512在内的最新支持SIMD的硬件。总体来说现在的版本更具有持久性,可开发多达512 GB DIMM的大型内存,能够更加灵活的满足您的需求。有需要的朋友快来本站下载吧!
1、通过剖析和分析提高MPI通信
Intel Trace Analyzer and Collector是一款MPI分析器,通过可视化应用程序的行为理解MPI应用程序正确性和行为。通过它,可以改善MPI通信的性能和可靠性。
2、高性能,低延迟MPI通信
MPI Library采用最新的MPI3.0标准,可实现高性能、低延迟的MPI通信。
3、辅助添加线程和矢量
Advisor是一款C、C++和Fortran应用程序的矢量优化和线程原型工具,发现最大的并行性能潜力和识别关键的同步问题。
4、提供可靠的应用
Inspector是一款易于使用的C、C++和Fortran应用程序的内存和线程调试器,帮助您在造成影响之前发现错误。
5、消除代码瓶颈
优化了先进的性能和线程分析器。调整C、C++、Fortran、Assembly和Java*应用程序。
6、优化工具帮您快速构建代码
使用C++ Compiler和Fortran Compiler(Windows*、Linux*和OS X*版本)提升应用程序性能。内置OpenMP*和Cilk Plus parallel models combined with performance libraries,简化了快速、并行代码的执行。
7、提升应用程序性能
随着处理器的发展,实现处理器的全部性能潜力在矢量化(使用AVX或SIMD指令)和线程软件中变得越来越重要。在某些情况下,矢量化和链式化处理的代码比那些没有这样处理的代码快175X,比只矢量化/链式化处理的代码快7X。随着处理器的更新换代,这种差距也越来越大。
这套全面的开发工具使用矢量化,多线程,多节点并行化和内存优化等最新技术,使代码的构建和现代化变得更加简单。它使C,C ++,Fortran和Python*软件开发人员能够:
1、创建更快的代码
提升可在当前和未来英特尔平台上扩展的应用程序性能。
2、更快地构建代码
软件简化创建并行代码的过程。
3、获得优先支持
直接与英特尔工程师联系,以获得技术问题的机密答案。
Intel Parallel Studio XE 2020灵活满足您的需求:
1、在英特尔VTune放大器中体验全新,更直观的用户界面和增强的车顶线分析。使用Platform Profiler预览运行更长时间的高级性能分析。
2、使用英特尔Advisor中Flow Graph Analyzer组件中的快速可视原型设计环境可视化并行性。使用它以交互方式构建,验证和可视化并行算法。
3、使用Distributionfor Python*加速数据分析和科学计算,现已集成到ParallelStudio XE中。
4、通过conda*,pip*,DockerHub*,APT GET和YUM访问最新的英特尔性能库和英特尔分发版。
现代化代码以提高性能,可扩展性和可移植性
使用英特尔高级矢量扩展512(英特尔AVX-512)指令,在最新的英特尔至强和英特尔酷睿处理器上编写可扩展并行性能的应用程序
借助下一代英特尔MPI库获得更大的可扩展性并减少延迟
向量化和线程化代码(使用OpenMP *)以利用最新的支持SIMD的硬件,包括英特尔AVX-512
通过使用适用于Python *的英特尔发行版和英特尔数据分析加速库(IntelDAAL)启用新的高性能Python *优化来加速机器学习
紧跟最新的标准和集成开发环境(IDE):
完整的C ++ 14和扩展的C ++ 2017
完整的Fortran 2008和部分Fortran 2018
Python 2.7和3.6
完整的OpenMP 4.5和初始OpenMP 5.0草案
Microsoft Visual Studio * 2017集成
灵活满足您的需求
在英特尔VTune放大器中体验更直观的新用户界面和增强的车顶线分析。在Platform Profiler的预览中运行更长的高级性能分析。
使用英特尔Advisor的Flow Graph Analyzer组件中的快速可视化原型环境可视化并行性。使用它可以交互式地构建,验证和可视化并行算法。
利用现已集成到英特尔Parallel Studio XE中的英特尔Python **加速数据分析和科学计算。
通过conda *,pip *,DockerHub *,APT GET和YUM访问最新的英特尔性能库和面向Python的英特尔发行版。
开始使用
请按照以下步骤开始使用Intel Inspector。
启动英特尔检查器
要启动:
英特尔Parallel Studio XE /英特尔Inspector独立GUI:运行 inspxe-gui命令或从“ Microsoft Windows * 所有应用程序”屏幕中,选择“ 英特尔Parallel Studio XE [版本] > 英特尔Inspector [版本]”。
英特尔System Studio /英特尔Inspector独立GUI:选择 工具 > 英特尔Inspector > 从IDE 启动英特尔Inspector。
Visual Studio * IDE的Intel Inspector插件:在Visual Studio * IDE中打开您的解决方案。
要启动命令行界面,请执行以下操作:运行 inspxe-cl命令。(要获得帮助,请在命令行后附加 -help。)
选择/创建项目
Intel Inspector基于项目范例,要求您创建或打开项目才能启用分析功能。
将分析项目视为:
编译的应用程序
可配置属性的集合,包括抑制规则和搜索目录
分析结果的容器
配置项目
数据集的大小和工作量直接影响应用程序的执行时间和分析速度。
为了获得最佳结果,请选择具有代表性的小型数据集,这些数据集创建的线程每个线程的工作量最少至中等。
您的目标:在尽可能短的运行时间中,执行尽可能多的路径和最大数量的任务(并行活动),同时将每个任务中的冗余计算量减少到最小,以保证良好的代码覆盖率。
运行几秒钟的数据集是理想的。创建其他数据集以确保检查所有代码。
配置分析
Intel Inspector提供了一系列预设内存和线程分析类型(以及自定义分析类型),可帮助您控制分析范围和成本。范围越窄,系统的负载越轻。范围越广,系统的负载越大。
小费:
迭代使用分析类型。首先从狭窄的范围开始,以验证您的应用程序是否正确设置并设定对分析持续时间的期望。仅当您需要更多答案并且可以忍受增加的成本时,才扩大范围。
运行分析
当您运行分析时,Intel Inspector:
执行您的应用程序。
确定可能需要处理的问题。
收集结果中的那些问题。
将符号信息转换为文件名和行号。
应用抑制规则。
执行重复消除。
形成问题集。
根据您的分析配置选项,可能会启动交互式调试会话。
选择问题
在分析过程中,Intel Inspector会按检测到的顺序显示问题。分析完成后,Intel Inspector:
将检测到的问题分组到问题集中(但仍可以查看单个问题和问题发生的位置)。
优先考虑问题集。
提供筛选以帮助您专注于需要注意的问题集。
系统硬件要求
硬件
包括但不限于:
英特尔至强处理器
英特尔酷睿处理器家族
编程语言
C
C ++
Fortran
蟒蛇
仅英特尔数据分析加速库和英特尔VTune放大器支持Java *
仅IntelAdvisor和Intel VTune Amplifier支持C#
Google Go *仅受Intel VTune Amplifier支持
开发工具与环境
与Microsoft,GCC,Intel等遵循既定语言标准的编译器兼容
Microsoft Visual Studio(Windows *)
Eclipse *(Linux)
Xcode *(macOS *)
操作系统
视窗
的Linux
苹果系统
发行说明