何为真正的 FaaS ?阿里舜天平台做了四大创新

  • 时间:
  • 浏览:2
  • 来源:大发彩神6合_大发神彩6合官方

FaaS 舜天平台的 F3 实例,其板卡采用了单卡双芯片(XILINX 公司的 VU9P 芯片)的高密设计,而绝大多数号称提供 FaaS 的云服务提供商均采用了更为稳妥的单卡单芯片方案。单片 VU9P 的典型功耗为75W,两片有些有些100W,供电和散热成为设计时还要重点考虑的因素,那先 问題处置不好的话,将极大的影响 F3 的稳定性。一起导致 PCB 达到了26层,信号完整(比如 PCIe、MAC 等高速接口)也是巨大的挑战之一。克服那先 挑战后来 ,FaaS 舜天平台的 F3 实现了算力密度业界第一,从而实现了最多还还要节省100%的物理机采购成本,这进一步提升了 FPGA 的性价比竞争力。

算法(通常亲戚大伙 称呼那先 算法叫 IP)是 FPGA 的灵魂,那末了算法,FPGA 还还要说那先 都一定会;有了算法,FPGA 几乎还还要做任何事情,FPGA 的高灵活性是由算法来使能的。业界有有些有些第三方的 ISV 和独立开发者,充分利用 FPGA 的高并行和时间流水形态学 ,开发了有些有些高效的 IP,那先 IP 还还要高效地完成某一十个 或十几个 特定的功能。更多的后来 ,客户的需求还要要多个 IP 的配合不能满足。导致 并那末任何标准组织来制定 IP 的对外接口,各家 ISV /独立开发者所开发的 IP 的接口多种多样。要将亲戚大伙 拼到一起形成处置方案,往往需为宜几瓶的时间和精力开发二者中间的适配层,后来 就选泽选泽离开了通过组合 IP 从而快速形成处置方案的优势。只有所有的 IP 都遵循统一的接口标准,才不能做到 IP 像乐高积木一样任意组合、快速形成处置方案。

二、 传统的 FPGA 应用与 FaaS 的区别

4、 安全性创新

这三方面的价值一起也是 FaaS 的难度所在。

2、 算力池化

目前,阿里云 FaaS 舜天平台一起支持 Intel 和 XILINX 两家主流 FPGA 厂商的器件,阿里云也是全球 FaaS 产品线最齐全的公共云服务商。对于只想利用 FPGA 算力加速的客户来说,不想知道有些有些会知道底层提供加速的 FPGA 属于哪家厂商。一方面,两家厂商的器件和开发环境各有千秋;个人面,相当一主次使用 FaaS 进行设计、验证的第三方 ISV 和独立开发者来说,其设计面向的是线下应用,本来还要针对某个厂家的某款器件,这就使得一起支持 Intel 和 XILINX 两家厂商的器件变为必需。阿里云目前是 FaaS 产品线最为齐全的云服务提供商。

3、 软件设计创新

传统的使用 FPGA 的土方法(也即所谓的“线下”模式)一般是:FPGA 和有些器件(包括主控的 CPU)一样,都焊在“母板”上,主控 CPU 通过与 FPGA 直连导致 CPLD 桥接的土方法,对该 FPGA 进行配置和控制,FPGA 的存储空间直接映射到 CPU 的主内存空间。而云上模式下,FPGA 所在的板卡(通常叫做 FPGA 加速卡)是所在宿主机“母板”上的一十个 PCIe 设备,云服务的客户使用虚拟机和 PCIe 报文对该加速卡(也有些有些 FPGA)进行配置和控制。导致 此时 FPGA 跟“母板” CPU 之间不存在任何“直连”关系,只有通过 PCIe 报文对 FPGA 进行操作,传统上对 FPGA 的复位、加载、情形和性能监控等常规功能,在虚拟机(云上)环境下不再那末“常规”。简单的用的话总结有些有些:线下根本一定会问題的问題,到了线上(云上)导致 一定会问題。不处置好那先 问題,就没土方法让 FPGA 简单易用,也就谈不上算力“普惠化”,更谈不上“云服务”了。

首先,使用 FPGA 实现简化的算法的门槛是非常高的(比如用 FPGA 实现 H.265 编码);其次,高效使用 FPGA 实现简化的算法的门槛是非常非常高的(还拿 H.265编码举例,设计得不好的话,很大容量的一颗 FPGA 是我不好只有支持一路 10100p/100 帧的 H.265 视频,好的设计是我不好就能支持4路);最后,把 FPGA 的加速能力通过“云”来输出给客户的门槛是非常非常非常高的。有些有些,FaaS 的核心之一是让 FPGA 的算力“x86化”,即云上购买和使用 FPGA 的算力和云上购买和使用 CPU 的算力一样简单;核心之二,是让 FPGA 的算力“服务化”,即不还要客户做二次开发和适配,通过简单的类 URL 调用即可使用。

相对而言,FPGA 器件厂商和云服务提供商应该投入更多的资金和资源来扶持独立开发者和 ISV。一起,云服务提供商要与 ISV 密切合作协议协议,在目前不能都看的 FPGA 具备明显优势的垂直领域,越快落地应用并产生价值,形成示范和标杆效应,以吸引更多的独立开发者和 ISV 加入到建设 FaaS 生态的大军中来。

二是,建立完善的FPGA IP 云市场,在 IP Vendor 和 FPGA 异构计算云服务客户之间牵线搭桥:IP Vendor 通过阿里云 FaaS IP 市场获得收入,从而发展壮大,设计适用于更多垂直市场的 IP;而客户则通过在 IP 云市场灵活选泽 IP,快速形成处置方案,从而获得更高性价比的算力。如上所说,无生态不 FaaS,生态对于 FaaS 的成功可谓至关重要,FPGA 器件厂商、FPGA 云服务提供商和广大的 FPGA IP 独立开发者和 ISV 是你这个生态的一条支柱。缺少了任何一方,生态的建设一定会举步维艰的。

三、 FaaS的难度在哪里

近几年,DC 和云计算领域风起云涌,发展地如火如荼。中外厂家纷纷发布 “DC First”、“All in Cloud”、“Cloud or Dead” 等战略,不管此前公司的主业为什么在么在,杀入 DC 和云计算领域的厂家如过江之鲫。本来,和任何 ICT 领域一样,在经过充分的搏杀和竞争后来 ,整个市场将基本稳定下来,由 TOP2-3的厂家把持,有些 players 加到一起分点残羹冷炙。Gartner 于4月24日发布报告,阿里云以19.6%的市场份额,雄踞整个亚太第一,AWS 和微软分居第二和第三。全球范围内,仍然维持了AWS、微软和阿里云分别为冠、亚、季军的格局。

采用定制虚拟化技术达到 IP 加速与部署环境的强隔离,IP 的用户与 IP 的网表文件完整隔离,网表文件的传输、部署、加速流程全程对用户一定会可见;一起加速计算能力又还还要透明的向使用该IP的客户开放。通过你这个创新,完整杜绝了 FPGA IP 在云上输出的后来 被盗用、盗版的导致 ,提供了非常高的安全保护机制。一起 IP 的拥有方还还要通过阿里云的 KMS 加密服务对IP进行加密保护,每次对 IP 加载前都还要向KMS 服务获取秘钥进行解密,后来 一来针对 IP 的使用下载有据可查;本来使得 IP 发布方的 IP 在数据中心内部内部结构一定会安全的,导致 那末了 IP 提供方的 KMS 秘钥,即便是阿里云也无法对加密的网表进行解密操作。

传统上,导致 FPGA 是焊接在所在母板的,本来,母板所在的宿主机的 CPU 对该片(导致 几片)FPGA 是拥有100%的“所有权”和“使用权”的。即便有些有些后来 ,FPGA 存在空闲情形,它有些有些导致 被别的宿主机(尽管导致 宿主机之间存在网络连接,不管是 WAN 还是 LAN,甚至是网线直连)所使用。本来,在云上使用环境中,每个宿主机所“携带”的 FPGA 一定会某个计算集群的一份子,每个宿主机(和运行在其上的虚拟机)既还还要使用个人本板/本机上的 FPGA 、也还还要使用有些宿主机的 FPGA 。传统使用土方法下,没土方法满足例如“提供 1.25 片 FPGA 导致 3.5 片 FPGA 给某个用户使用”后来 的需求,但在云上环境中,满足后来 的需求是云服务的基本功能。

一是,针对 FPGA 具有明显加速优势的特定垂直市场,做到真正以“服务”来输出 FPGA 的高性价比算力。CPU 和 GPU 的生态导致 非常的完善,在全球有几十甚至上百万的开发者。这就使得客户只需购买 ECS(Elastic Compute Service弹性计算服务)/EGS(Elastic Graphic Service弹性图形服务)后来 的 IaaS 基础设施,还还要很容易、快捷地在其上建立 PaaS/SaaS 服务。

1、 云化

四、 阿里云舜天平台:做真正的FaaS

第三,阿里云 FaaS 舜天平台还致力于建立云上的 FPGA 开发环境与平台,降低FPGA 设计、开发、验证的门槛,客户、ISV 和独立开发者均可聚焦于设计四种 ,而不想考虑 EDA 工具、开发环境、验证环境等对最终业务价值增值太多但又还为宜几瓶时间和精力的事情。

作者 | 阿里云资深技术专家隐达

FPGA 云厂商要做的是介于 FPGA 的驱动层以及客户的软件 SDK 层之间的适配层,你这个适配层尽导致 屏蔽底层的软硬件细节,通过 API 给客户的软件 SDK 提供必要的控制接口,使得客户不能以“类 URL 调用”后来 的简单土方法来调用 FPGA 的算力。简而言之,导致 只有做到简单易用,那末尽管 FPGA 相对 CPU、GPU 还还要提供极高的性价比,也会在 CPU 和 GPU 的强大生态身旁败下阵来。客户的诉求很简单:希望动动鼠标就能得到结果(客户根本不 care 底层的算力是 CPU、GPU 还是 FPGA 输出的),而一定会要看几百页手册,要三十个 乃至更多开发人员适配上一十个 月不能使用。

FaaS 的价值还还要从三方面来看:

这当然是四种 理想情形。事实上,FPGA 器件经常出现导致 有 100 多年的历史,大大小小的设计各种 IP 的 ISV 一定会有些有些,本来极少有 ISV 不能长大、不能规模化。在 FPGA 的传统擅长领域那末经常出现,在 FaaS 渐成风潮的今天,暂时也那末经常出现。开发 IP 最大的问題在于平衡“通用性”和“专用性”,包括 IP 算法四种 和 IO 接口。一般来说:通用性越好,导致 性能往往就要差有些;性能调测的非常强劲的 IP,通用性往往欠缺好,使用还要做各种各样的适配和牺牲;支持的 IO 接口太多,导致 IP 四种 的成本也就越高,本来只支持四种 IO 接口的话,成本是降下来了,本来严重限制了 IP 的应用范围。

导读:数据中心和云计算的超高增速,AI、视频、基因测序等应用对于算力的无尽渴求和摩尔定律发展事实上导致 停滞的现实,均给异构加速带来了巨大的应用潜力和商机。但 Faas 处置方案仍有较高的门槛,今天,亲戚大伙 一起了解 Faas 的难度在哪里?以及在阿里,亲戚大伙 怎么都可否做到真正的 Faas?

完整的 FPGA 监控系统,用户还还要实时获取 FPGA 的各种运行情形,包括功耗、温度、IP使用率等;

用户可选 1/2/4片 FPGA 互联拓扑,用户可根据个人 workload 大小灵活选泽和配置为宜的实例,实现最高性价比;同卡 FPGA 之间有高达 1000Gbps 的高速互联通道,应用若需两片 FPGA 之间实现实时、大批量数据搬运,不存在速率瓶颈;

自适应网络接口:两路100G光口,使得不同 NC 之间的 FPGA 相互通信不存在任何速率瓶颈;

热升级:在不中断客户业务的前提下,对主次用户逻辑进行在线重配置,以实现新的功能和 Feature;

支持软硬件联合仿真。那先 创新设计为用户提供了灵活、丰富的实例规格选泽;大大简化了 FPGA 的高性价比算力输出的简化度,一起极大的提升了 FaaS服务的易用性。

FaaS 舜天平台提供两大套件: HDK 和 SDK,提供更加高效、统一的开发及部署平台。

导致 单纯从 FPGA 的设计和使用层厚看,即使有门槛的存在,设计一颗 glue logic的 FPGA 导致 跑有些简单算法,实现有些简单控制,难度是相当有限的。本来,只有说具备了那先 能力后来 ,就还还要对外宣称还还要提供 FaaS 的能力了。

HDK:Shell + Role的组合土方法,保证了Shell 的最轻量化和稳定性,又兼顾了便捷性和灵活性;

SDK:一主次是 HDK 对应的主机端驱动(Drivers)与软件库(Libraries),另一主次是 FPGA 管理工具 faascmd 套件。驱动与软件库和 HDK 的 Shell 以及 Role 相对应,和 HDK 一起,为用户提供统一及灵活的软件支持。faascmd 工具套件则为用户提供云上 FPGA 管理服务,包括 BIT/DCP 文件安全校验、FPGA 镜像生成、下载及管理、FPGA 加速卡情形查询反馈等功能。

本来对于 FPGA 来说,导致 生态的不完善和分散,绝大主次云上 FPGA 用户不具备自行购买 EFS(Elastic FPGA Service)后来 在其上搭建 PaaS/SaaS 的能力。这就导致 ,导致 云服务厂商仅仅提供 FPGA 的 IaaS,客户是根本不想买单的;即使是提供带 IP 的IaaS+,客户仍然要做二次开发与适配,这就大大降低了 FaaS 的吸引力。本来,要使得 FPGA as a Service 成为四种 可行的商业模式,就还要对外提供基于 FPGA IaaS/IaaS+的 SaaS 服务,只有后来 ,才不能与 CPU/GPU 进行竞争,从而发挥 FPGA的高性价比、低延时、高灵活可编程性等优势。

阿里云FaaS一定会几瓶的软件创新:

3、 算法 IP 积木化

1、 支持业界主流 FPGA 器件厂商

2、 硬件设计创新

传统上,FPGA 是一项“重资产”应用:要购买 FPGA 器件、要开发板卡、要购买 EDA 工具和 FPGA 调测仪器(如逻辑分析仪),所有那先 加起来,形成了 FPGA 应用的高门槛。单说 EDA 工具你这个项,对于中小 ISV 和独立开发者来说,EDA 工具(含 FPGA 器件厂家提供的配套开发软件,如 Intel 的 Quartus 和 XILINX 的Vivado)的 license 授权费用不菲,亲戚大伙 太难负担得起,而要使用非正版软件,又不得不面临很大的风险:包括软件侵权风险和设计中埋下隐患的风险。FaaS 舜天平台很好的处置了那先 问題,大大降低了 FPGA 开发、使用的成本和门槛,为建设健康的 FaaS 生态打下了坚实的基础。

阿里云 FaaS 舜天平台自诞生之初,就把 FPGA 算力普惠化作为个人的使命,通过云化输出 FPGA 算力,为客户提供更高性价比的计算处置方案,是舜天平台的价值所在。舜天平台不但很好地处置了上述的一十个 难点,一起还致力于三方面的工作,使得FaaS真正的名副觉得 。

阿里云 FPGA as a Service(以下简称FaaS)舜天平台正是 FPGA 异构加速领域的领导者和开拓者,也是 FPGA 异构加速领域良好生态的倡导者和建设者。依托阿里云百万企业付费客户以及阿里云强大的飞天操作系统,FaaS 舜天平台对内而言,导致 成为阿里集团 FPGA 加速业务的基础设施;对外而言,则将大幅降低 FPGA 的开发和使用门槛,致力于为客户提供最高性价比的算力和打造健康的 FPGA 加速生态。

FPGA 导致 其强大的灵活性,自诞生以来,在数以千计的垂直市场中都获得了几瓶的应用。本来,你这个应用都谈不上“云”,也谈不上“service”。亲戚大伙 知道,传统 IT 基础设施是那末弹性的,本来很容易经常出现要么业务高峰时无法支撑乃至整个 IT 系统崩溃;要么陷入业务低谷时,几瓶 IT 资源闲置,造成成本高企。本来,“云”和“非云”的一十个 最大区别就在于有无 支持资源的“弹性”伸缩:还要时按需获取,不还要时随时释放。而要做到“弹性”,那末一定要通过虚拟化来支持。导致 做只有“弹性”和“虚拟化”,就称不上 FaaS,究其本质和传统上对 FPGA 的使用那末任何区别。

一、 前言

到了 FaaS 云时代,导致 在特定垂直领域,FPGA 相对 CPU 导致 GPU 的性价比往往非常出众,有些有些 IP 的性能往往一定会考虑的第一主次,本来,云上只有输出算力,无法输出 IO,本来有些有些存在支持的 IO 的种类问題。FPGA 算力云化的最大障碍在于 IP 距离“服务”还有相当的距离,要充架构设计 挥 IP 的性能,客户往往要做二次开发以及几瓶的软件适配,这恰恰和云化降低 FPGA 的使用门槛、使 FPGA 的算力普惠化的大目标相抵触。

针对上述价值,FaaS做了几瓶针对性的创新设计。