隨著數(shù)字化的深入,科研教育進入了信息化時代。在科研項目的推廣過程中,往往會面臨大量的運算場景,如模擬、數(shù)據(jù)建模、渲染等復(fù)雜的數(shù)據(jù)密集型計算任務(wù)。此時,如果使用單一的通用物理計算,計算數(shù)據(jù)量龐大,計算能力性能有限,計算效率大幅度降低,計算完全無法實行。HPC高性能計算組的出現(xiàn),通過整合多個單元的計算能力,打破了計算能力性能的局限性,成為科研攻勢不可或缺的工具。
2020年,業(yè)內(nèi)首次發(fā)表了具有自由彈性、超計算能力的啟慧科研云,啟慧科研云超計算能力的背后是自主開發(fā)的第一代高性能計算產(chǎn)品UHPC。與傳統(tǒng)的HPC超計算數(shù)據(jù)中心相比,基于云的UHPC具有大量資源、彈性擴展、靈活配置、數(shù)據(jù)安全等優(yōu)點。為了滿足更復(fù)雜場景的科學(xué)研究攻勢,最近發(fā)表了為科學(xué)研究量身定制的下一代超計算產(chǎn)品,UHPC正式更名為lsquo云極rsquo的高性能計算為EPC(以下簡稱UCloudePC)。
云極旨在為用戶提供基于公有云技術(shù)的超高性能算力體驗。相比上代產(chǎn)品只提供單一快杰云主機機型,UCloud EPC新增快杰裸金屬云主機、快杰Lite云主機兩款超算機型:
gt; 快杰裸金屬云主機基于NVIDIA最新系列 BlueField DPU打造,通過DPU集成的多核ARM CPU,快速將快杰云主機的基礎(chǔ)架構(gòu)軟件從x86遷移到DPU中,在減少宿主服務(wù)器CPU系統(tǒng)資源占用率的同時,有效提升CPU性能穩(wěn)定性,讓快杰裸金屬云主機在具備快杰云主機彈性靈活高性能諸多特性的同時,做到了物理機級別的資源隔離。速杰裸金屬云主機目前可提供最高規(guī)格為CPU、96核心、內(nèi)存576GB的實例。
gt;快捷Lite云主機采用Ampere的Altra處理器,基于ARMv8.2指令集,使用著名的Phoronix測試套件PTS測試HPCG(HighperformanceConjugradients,高度約克梯度)成績?yōu)?0.77GFLOP/s,比同規(guī)格的快捷云主機(x86架構(gòu))性能提高40%。快杰Lite云主機在生物信息學(xué)、空氣動力學(xué)模擬、氣象預(yù)測模擬等超計算應(yīng)用場景中,優(yōu)勢更加突出。
對于業(yè)內(nèi)HPC在科研場景中遇到的一些問題,UCloudEPC還進行了兩項優(yōu)化:
對于普通云盤性能弱、RSSD云盤存儲費用高的問題,UCloudEPC增加了高效云盤和網(wǎng)絡(luò)文件存儲的支持其中,新上線的網(wǎng)絡(luò)文件存儲支持標(biāo)準(zhǔn)原始的SMB-3.1文件訪問協(xié)議,同時支持Linux系統(tǒng)和Windows系統(tǒng)。網(wǎng)絡(luò)文件存儲內(nèi)網(wǎng)接入帶寬為25Gbps的RDMA高速網(wǎng)絡(luò);客戶端訪問網(wǎng)絡(luò)文件存儲實際帶寬可達400MB/s。
針對科研計算數(shù)據(jù)上傳下載過程中的網(wǎng)絡(luò)傳輸優(yōu)化,UCloud EPC新增對教育網(wǎng)專線的接入與盤柜直通租賃服務(wù),以及針對百度云盤和釘釘網(wǎng)盤兩款主流網(wǎng)盤客戶端的定向加速。用戶只需通過專屬域名(instance_name.edu.ucloud.cn)即可實現(xiàn)就近接入教育網(wǎng)絡(luò)專線,并高速訪問UCloud EPC云主機。用戶還可以根據(jù)自己的數(shù)據(jù)規(guī)模(1TB以內(nèi)的數(shù)據(jù)建議使用云主機專用域名、百度云盤或釘網(wǎng)盤1TB以上的數(shù)據(jù)建議使用盤租賃),通過多種方法和途徑,將數(shù)據(jù)快速上傳到UCloudEPC進行科學(xué)計算。計算完成后,也可以通過上述渠道快速轉(zhuǎn)移計算結(jié)果,大大提高數(shù)據(jù)云下云的效率,加快科研過程。
以當(dāng)?shù)貦C房、硬件配置、內(nèi)外隔離為特征的科學(xué)研究機構(gòu)的傳統(tǒng)IT結(jié)構(gòu),已經(jīng)不能滿足科學(xué)研究場景的彈性擴張、域協(xié)、靈活配置的需求。以云計算為基礎(chǔ)的UCloudePC,通過性能強、效率合作、靈活配置的高性能計算方案,打破科研計算能力的瓶頸,釋放科研發(fā)展的活力。具體而言,相比科研機構(gòu)傳統(tǒng)IT及普通HPC,UCloud EPC具有以下三大優(yōu)勢
一、性能強大、提升效率
UCloud EPC 搭載業(yè)內(nèi)最新一代CPU、GPU芯片,以高性能快杰云主機、快杰裸金屬為基座,可秒級快速啟動HPC集群。EPC與大數(shù)據(jù)、AI等產(chǎn)品相結(jié)合,提高科研算力和算法創(chuàng)新。
二、高效合作、數(shù)據(jù)安全
科研機構(gòu)的傳統(tǒng)IT結(jié)構(gòu),通常使用科研機構(gòu)和高中內(nèi)部機房,校園網(wǎng)與外部網(wǎng)隔離,無法與外部科研團隊和機構(gòu)高效合作。UCloudEPC基于優(yōu)秀的公共云平臺,在能夠?qū)崿F(xiàn)跨地區(qū)合作、多團隊合作的同時,公共云安全對策的嚴(yán)格保護也避免了過去當(dāng)?shù)貦C械室容易受到攻擊和硬件損傷等數(shù)據(jù)安全問題。
三、靈活配置、降低成本
使用UCloudePC,科研機構(gòu)不需要一次購買大量硬件,可以根據(jù)計算能力的使用需求靈活配置,根據(jù)實際使用量支付費用UCloudEPC與優(yōu)秀的云原生、數(shù)據(jù)分析、AI產(chǎn)品相結(jié)合,可以提高研究開發(fā)效率,降低運輸成本。
UCloud EPC助力高??蒲袘?yīng)用創(chuàng)新
目前,UCloud EPC已為多個科研教育項目的落地以及傳統(tǒng)IT架構(gòu)HPC上云提供服務(wù):
哈爾濱某高??蒲薪逃椖?/strong>
哈爾濱某高校科研團隊在遇到本地計算資源不足、計算性能不高等瓶頸后,主動聯(lián)系優(yōu)刻得尋求超算性能方案。利用高性能的UCloudEPC快速裸金屬云主機,靈活的UCloudEPC快速云主機,同樣的CFD算例,轉(zhuǎn)移到云上后,速度達到當(dāng)?shù)馗咝阅苷镜?倍,本來至少10天以上的計算任務(wù)UCloudEPC推進科研項目,加快科研成果。
上海某大學(xué)科研教育項目
上海某大學(xué)科研團隊開展大規(guī)模流體固體耦合計算進行科研攻關(guān)時,對耦合計算要求高性能CPU、大內(nèi)存和大容量存儲提出了更高的要求,但當(dāng)?shù)胤?wù)器資源緊張、配置固化、不易擴展,嚴(yán)重約束了科研工作的開展。知道UCloudEPC快捷版云主機配備了最新一代的高性能芯片,具有內(nèi)存指定、內(nèi)存支持熱擴張等靈活性,科研團隊決定迅速上云,最終該科研項目本來就需要20天以上的耦合計算
江蘇某大學(xué)科研項目
江蘇某大學(xué)材料研究團隊在科研攻關(guān)過程中,需要進行大體系的計算。當(dāng)?shù)丶嘿Y源不足,限制了計算速度的校區(qū)轉(zhuǎn)移,物理機柜在轉(zhuǎn)移過程中不能使用。計算慢,但科學(xué)研究速度不慢的櫥柜停了,但科學(xué)研究的工作不停。UCloudEPC強大的計算能力性能和靈活易于配置的特點有效解決了兩個問題,客戶經(jīng)過短期試運行材料學(xué)計算軟件,證明了性能優(yōu)于當(dāng)?shù)赜嬎阗Y源。很快開展了長周期、大負荷的高性能計算。
上海某高中生命科研項目
冷凍鏡成為生命科研的重器和工具,上海某高中走在冷凍鏡領(lǐng)域的前沿。冷凍電鏡離不開高性能計算,大量電鏡數(shù)據(jù)需要利用Relion等應(yīng)用軟件進行分析和處理。高性能CPUGPU異構(gòu)計算能力顯著提高了Relion的運行速度。此外,針對TB級計算數(shù)據(jù)的遷移,優(yōu)刻得為用戶提供了方便快捷的線下遷移服務(wù),做到了TB級數(shù)據(jù)一站式上云、異構(gòu)計算工作快速展開。UCloud EPC一站式服務(wù),助推前沿科技研究。
華中某高校耦合計算項目
多物理場景耦合計算成為機械工程、航空宇宙等領(lǐng)域的核心手段。但在耦合計算過程中,對計算能力性能有很高的要求。華中某高校課題組在耦合計算時遇到了當(dāng)?shù)刭Y源不足的問題。借助UCloudEPC的超計算性能,突破了原有的計算瓶頸,實現(xiàn)了工程應(yīng)用水平的耦合計算,在短時間內(nèi)成功提供了高質(zhì)量的科研成果。UCloudEPC為該高中科研團隊消除了計算能力障礙,構(gòu)筑了性能超計算平臺。
藍威技術(shù)傳統(tǒng)HPC云項目:
藍威技術(shù)是工程模擬領(lǐng)域的創(chuàng)新企業(yè),致力于為客戶提供SaaS化開箱即用的工程HPC服務(wù)。UCloudEPC靈活配置(資源隨時供應(yīng),靈活調(diào)整)、高性能(云主機性能優(yōu)于原物理機器的30%)、彈性(大業(yè)務(wù)到來時隨時啟動新集團,最終用戶無需排隊)、順利連接(跨域網(wǎng)比之前傳統(tǒng)架構(gòu)的部署模式,性能提升30%,成本降低30%,助力藍威技術(shù)實現(xiàn)降本增效。
科研是科技創(chuàng)新的基礎(chǔ),而高性能計算則是科研的基石。未來隨著產(chǎn)業(yè)數(shù)字化、智能化深入發(fā)展,基于云計算技術(shù)的UCloud EPC,將助力更多科研機構(gòu)打破性能算力的瓶頸,賦能科技敏捷創(chuàng)新,推動科技產(chǎn)業(yè)加速發(fā)展。
用戶難題痛點FAQ
Q:
1)用戶自有超算中心不支持某類計算任務(wù)怎么辦?
2)用戶自購服務(wù)器資源老舊算力不足怎么辦?
實際案例:
某高中用戶超計算CFD計算任務(wù)需要在Windows平臺上執(zhí)行計算任務(wù),但校級超計算中心不提供Windows計算平臺,使用自己購買的服務(wù)器(基于IntelCascadeLake白金版8276L
EPC如何解決:
快速裸金屬云主機支持Windows平臺,同樣的網(wǎng)格數(shù)計算量比用戶自購服務(wù)器的計算時間縮短了一倍。2天的計算成本僅為800元。
亮點:
快杰裸金屬云主機以AMD EPYC(霄龍)第二代處理器為底座,最高時鐘頻率可達 3.4GHz
Q:用戶計算完成后,數(shù)據(jù)回傳速度太慢怎么辦?
實際案例:
某能源科技用戶在優(yōu)刻得云平臺上完成高性能計算后,使用EIP(5Mb/s帶寬計費模式)把計算結(jié)果回傳至釘釘網(wǎng)盤,因為受限于EIP帶寬限制,傳輸速率為600Kb/s。大大影響數(shù)據(jù)下云效率。
EPC如何解決:
為滿足科研教育用戶數(shù)據(jù)管理習(xí)慣,支持百度云盤和釘釘網(wǎng)盤客戶端做定向加速,提升用戶數(shù)據(jù)上云下云效率。為教育網(wǎng)絡(luò)內(nèi)的高中用戶訪問教育網(wǎng)絡(luò)線路,使高中用戶容易訪問公共云,為云主機設(shè)置專用域名:instance_name.edu.ucloud.cn。
亮點:
百度云磁盤:購買百度VIP會員后,實測上傳速度可達160Mb/s
釘子磁盤:下載速度可達160Mb/s
實際案例:
某基因用戶在優(yōu)秀的云平臺上進行高性能計算,使用10TB的RSSD云盤,每月需要6000元的存儲費用。
EPC如何解決:
高效云盤和網(wǎng)絡(luò)文件存儲的單價為0.35元/月/GB,成本下降40%。
亮點:
網(wǎng)絡(luò)文件存儲支持標(biāo)準(zhǔn)原生的SMB 3.1 版本,該版本已針對小型隨機讀/寫I/O進行了優(yōu)化。另外,默認打開大型最大傳輸單元(MTU),大大提高大型連續(xù)傳輸性能??蛻舳嗽L問網(wǎng)絡(luò)文件存儲實測帶寬可達400MB/s。100GB數(shù)據(jù)只需4分鐘即可完成傳輸。
Q: 用戶計算完成后,計算結(jié)果為海量數(shù)據(jù)(TB級數(shù)據(jù)),數(shù)據(jù)無法下云怎么辦?
實際案例:
某高校用戶在優(yōu)刻得云平臺上完成高性能計算后,需要把5TB的計算結(jié)果數(shù)據(jù)下云,使用EIP(5Mb/s帶寬計費模式)下載至客戶本地需要97天。
EPC如何解決:
盤柜租賃,數(shù)據(jù)送到家。
亮點:
以5TB數(shù)據(jù)為例,一周內(nèi)可完成數(shù)據(jù)遷出優(yōu)刻得數(shù)據(jù)中心,數(shù)據(jù)運輸和數(shù)據(jù)同步到用戶電腦的全流程。