UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

的页面

可重配置加速

开发并部署云级平台

云数据中心正在发生变化。 今天的 CPU 一直无法满足当前计算密集型应用(如机器学习、数据分析和视频处理等)的需求。加上网络与存储方面日益明显的瓶颈,云服务供应商转而采用加速器来提高其云数据中心的整体吞吐量和效率。

微软和百度等大型云端服务供应商已宣布在其超大规模数据中心部署 FPGA 技术,推动其服务业务在竞争极为激烈的市场不断发展。FPGA 能与高度灵敏的云计算环境形成全面互补,因为它们不仅可编程性,而且还能针对任何新应用或新算法进行硬件优化。 

随着时间的推移,FPGA 可重配置及可再编程的固有能力或许是其在快速发展领域中的最大优势。FPGA 可利用动态重配置,在不到一秒的时间内针对不同设计快速变化,从而可针对新的工作负载进行硬件优化。 因此,Xilinx FPGA 能提供复杂多变超大规模应用所需的灵活性、应用广度和功能速度,这是 CPU 和定制 ASIC 无法实现的。 

Xilinx 在数据中心领域的发展势头

客户 — 七大超大规模云服务公司有 3 家部署了 Xilinx FPGA,其中包括百度,百度已于 10 月宣布在数据池中设计了 Xilinx UltraScale™ FPGA,以加速机器学习推理。 

合作伙伴高通IBM 宣布与 Xilinx 开展数据中心加速战略合作。 与 IBM 的合作已形成存储及网络加速框架 CAPI SNAP,其可帮助开发人员更便捷地使用 Xilinx FPGA 加速 NoSQL 等应用。

标准领导地位 — Xilinx 一直引领着智能高速缓存一致性互联(CCIX) 开发的产业计划。  Xilinx 于 2016 年 3 月与 AMD、ARM、华为、IBM、Mellanox 和高通联合成立了 CCIX,5 个月来该计划的成员数量已是成立之初的 3 倍。 

面向数据中心的软件定义工具与产品 —  面向 FPGA 加速的 SDAccel™ 开发环境于 2014 年发布。2016 年 11 月, Xilinx 披露采用高带宽存储器和 CCIX 技术的新型 16nm Virtex UltraScale+ FPGA 细节。

最新 Xilinx 可重配置加速协议栈不仅可帮助全球最大的云服务供应商开发和部署云级加速平台,而且还可为机器学习、数据分析和视频转码等复杂云计算应用提供无与伦比的高灵活性。这款基于 FPGA 的加速协议栈针对云原生应用设计,包含库、框架集成、开发板与资源以及 OpenStack 支持,所提供的计算效率比 CPU 高 40 倍、比当前市场任何其它 FPGA 高 6 倍。

从 Xilinx 研发团队获得有关在超大规模数据中心实现 FPGA 加速的最新信息

查看 Xilinx 技术论文 中的白皮书 “利用 Xilinx 器件的 INT8 优化开展深度学习” (中文)。

了解有关在亚马逊云端实现 FPGA 加速的信息。

立即采用 基于云的测试驱动器启动设计。

欢迎注册,以便在 Xilinx 提供加速新闻及更新信息时获得通知

acceleration-libraries

协议栈中的库

DNN —— Xilinx 的深度神经网络 (DNN) 库是构建深度学习推理应用的高度优化库。 经过精心设计,能够以 16 位及 8 位的整数数据类型实现最高的计算效率。

GEMM — Xilinx 的通用矩阵乘法 (GEMM) 库基于 3 级基本线性代数子程序 (BLAS),不仅可实现 16 位和 8 位整数数据类型的优化性能,而且还支持任何规模的任何矩阵。

HEVC 解码器和编码器 — HEVC/H.265 是 MPEG 和 ITU 标准机构推出的最新视频压缩标准。它是 H.264 的后续标准,可带来多达 50% 的带宽降低。Xilinx 提供两款编码器 — 支持大多数视频数据中心工作负载的高质量、高灵活实时编码器,以及非摄像机生成内容的替代解决方案。解码器支持针对这两款编码器的所有应用。

数据移动器 (SQL) — SQL 数据移动器库便于使用 Xilinx FPGA 加速数据分析工作负载。数据移动器库可通过 PCIe 从数据库列表将数据块发送至 FPGA 加速卡的片上存储器,从而可协调针对 SQL 数据库的标准连接。该库经过优化,能通过 FPGA 器件最大限度地利用主机 CPU 和加速器功能之间的 PCIe 带宽

计算内核 (SQL) — 在 FPGA 硬件上加速大量内核 SQL 函数(例如小数类型、数据类型、扫描、比较、过滤等)的库。计算功能经过优化,可利用 FPGA 大规模硬件并行的优势。

开发板 类型
供应商
Xilinx® Kintex® UltraScale™ FPGA 加速开发套件 开发人员评估 Xilinx
Bittware PCIe 板
生产
Bittware
Alpha Data ADM-PCIE-KU3 生产 Alpha Data
Alpha Data ADM-PCIE-7V3 生产 Alpha Data
COTS PEA-C8K0-060
生产
COTS
COTS PEA-C8K0-040 生产 COTS
Semptian NSA-120 加速卡 生产 Semptian
存储加速卡 (NVMeoF) 生产 Fidus

Amazon

Xilinx UltraScale+™ FPGA 现已在亚马逊弹性云计算(亚马逊 EC2)F1 实例中提供。F1 实例经过精心设计,旨在为各种重要数据中心工作负载实现加速,其中包括基因组学、金融分析、视频处理、大数据、安全以及机器学习接口。

F1 实例可轻松编程并与您所需的一切随附提供,从而可开发、仿真、调试并编译您的硬件加速代码,包括 FPGA 开发 AMI 及硬件开发套件 (HDK)。一旦完成 FPGA 设计,您就可以将其寄存为一个 Amazon FPGA 映像 (AFI),并通过简单操作将其部署至您的 F1 实例。您不仅可重复使用 AFI 多次,而且还可根据您的需要在多个 F1 实例中使用。首先,F1 实例中的 FPGA 可重复编程,因此,您可获得无需重复设计任何硬件,便可升级并优化硬件加速的高灵活性。 

亚马逊 EC2 F1 实例目前提供两种不同的尺寸,包括多达 8 个 Virtex® UltraScale+ VU9P FPGA,综合峰值计算能力每秒超过 170 TOP (INT8)。

运行定制 FPGA
在 AWS 云中

除亚马逊 EC2 F1 实例外,AWS 还提供一款 FPGA 开发亚马逊机器镜像 (AMI),这是一项预先构建的云资源,包括脚本以及 Xilinx 的 Vivado® 开发工具。 如果您更倾向于您的开发系统为内部系统,可购买或升级 Vivado 设计套件,与亚马逊云端的 F1 实例联合使用,立即购买或升级

SDAccel™ 开发环境现已可供预览,预计将很快推出正式版。如欲了解更多详情,敬请访问 AWS。

如果您对我们的学术合作伙伴计划的一部分 F1 实例感兴趣,请点击这里访问 Xilinx 大学计划 (XUP) 云页面。

运行在 F1 实例上的应用与服务

倾听合作伙伴的心声,了解如何使用 F1 实例加速各种服务与应用,如视频转码、数据分析、机器学习以及开发人员生产力等。

更多资源

Nimbix

Xilinx 与大数据及机器学习的异构加速器云端解决方案领先供应商 Nimbix 公司合作,共同创建可通过 C/ C++ 和 OpenCL 利用 FPGA 计算密度的新一代应用。

Nimbix 的产品能大幅减少充分利用高性能、高功效 FPGA 所遇到的障碍,从而可加速各行各业的高端计算工作流程。 开发人员现在可在云端运行这些工具,然后在最新 Xilinx 加速硬件上进行测试和部署,既不需要前期投资,也不需要购买设备。

如欲启动云端应用加速平台设计,敬请访问:http://www.nimbix.net/xilinx

Nimbix Cloud 上的 Xilinx 应用加速 

面向 OpenCL™、 C 和 C++ 的 SDAccel™ 开发环境利用 FPGA 将数据中心单位功耗性能提升高达 25 倍。作为 SDx™ 系列的成员,SDAccel 是首个面向 OpenCL、 C 和 C++进行架构优化的编译器,并结合了#库、开发板,可在FPGA上实现类似 CPU/GPU 的开发运行体验 。了解更多信息,敬请访问 SDAccel 专区

sdaccel-cpu

技术文档

资源

加速资源  说明
FPGA 初创公司为融合超大规模推断筹资 本文主要讨论基于 FPGA 的架构,该架构主要面向初创型公司 DeePhi Tech 提供的高效可扩展机器学习推断。
ESE:在 FPGA 上提供稀疏 LSTM 的高效语音识别引擎 FPGA2017 最佳论文奖得主以一款 FPGA 加速的高效语音识别引擎实现了突破性成果,该引擎与 CPU 相比,可实现 43x 的性能,40 倍的单位功耗性能;与 GPU 相比,可实现 3 倍的性能和 11 倍的单位功耗性能。
在电源系统上使用 FPGA 加速的低功耗机器学习 本次讨论会将概要介绍 FPGA 加速如何为图像识别等机器学习工作负载改善电源系统。
在深度流水线 FPGA 群集上实现高能效 CNN 本白皮书将介绍深度流水线多 FPGA 架构,其可扩展设计空间,实现最佳性能及能源效率。
从模型到 FPGA 的软硬件协同设计实现高效神经网络加速 本次讲演主要讨论  FPGA 的使用以及神经网络加速的趋势。
百度采用 FPGA 方案显著加速 SQL 本文讨论百度采用 FPGA 应对大数据挑战的方案。
SDA:通用大数据分析系统的软件定义加速器 本次讲演讨论百度通用大数据分析系统的软件定义加速器。
SDA:大型 DNN 系统的软件定义加速器 本文包括作者所做会议报告的一系列幻灯片,这些报告涉及具体特性、系统设计与架构、处理功能以及百度一系列软件定义加速器产品 (SDA) 的目标市场,主要面向大型深度神经网络 (DNN) 系统。
用户论坛
讨论与 OpenCL™、C、C++ SDAccel™ 开发环境有关的主题的社区