火箭快遞,使命必達(dá)。
美日韓包郵,江浙滬秒到。
LANDSPACE藍(lán)箭航天在2019年聯(lián)合淘寶正式啟動(dòng)“寶箭”計(jì)劃,共同研發(fā)“寶箭”號(hào)運(yùn)載火箭,實(shí)現(xiàn)網(wǎng)購(gòu)快遞急速送達(dá)的目標(biāo)。
這可能是我們朋友圈離火箭最近的一次。
大家都還在:“急,在線等”。
2023年7月12日,藍(lán)箭航天跨出了創(chuàng)造歷史的一步。
朱雀二號(hào)遙二運(yùn)載火箭在酒泉衛(wèi)星發(fā)射中心發(fā)射成功,成為全球首枚成功入軌的液氧甲烷火箭。
藍(lán)箭航天CEO張昌武在成功第二天發(fā)布的全員內(nèi)部信里說(shuō):“我們始終堅(jiān)守常識(shí),堅(jiān)決通過自主研發(fā)液體動(dòng)力系統(tǒng),立足于自主創(chuàng)新、自主可控的動(dòng)力核心來(lái)構(gòu)建朱雀系列運(yùn)載火箭,使得我們至今仍是中國(guó)第一(且唯一)家依靠獨(dú)立研制的動(dòng)力系統(tǒng)取得火箭飛行成功的商業(yè)火箭公司,也是唯一建成了設(shè)計(jì)、制造、測(cè)試、發(fā)射完整鏈條能力并經(jīng)飛行驗(yàn)證的商業(yè)火箭企業(yè)。”
總有人在替我們仰望星空。
一、民營(yíng)商業(yè)航天的“破局者”,主打一個(gè)自主研發(fā)
“藍(lán)箭的核心競(jìng)爭(zhēng)力就是我們沒有訣竅,我們就是在按照愚公移山的精神在做火箭,在遵從火箭規(guī)律的前提下做火箭。我們堅(jiān)持核心的技術(shù)自己研制,核心的設(shè)施自己保障。”
——藍(lán)箭航天CEO 張昌武
作為國(guó)內(nèi)首家取得全部準(zhǔn)入資質(zhì)的民營(yíng)運(yùn)載火箭企業(yè),藍(lán)箭航天主打自主創(chuàng)新、自主可控,在沒有可以借鑒參考的企業(yè)前提下,選擇了“地獄開局”模式——錨定液氧甲烷技術(shù)路線、自研發(fā)動(dòng)機(jī)系統(tǒng)、自建核心設(shè)施,成為超前技術(shù)的開拓者。
張昌武明確表示,公司成本支出比例中,研發(fā)制造要居于首位。在絕大多數(shù)民營(yíng)航天企業(yè)采購(gòu)第三方服務(wù)的氛圍下,他覺得,只有自主研發(fā)和制造,才會(huì)有出路。從最前沿的發(fā)動(dòng)機(jī)理念的構(gòu)想,到最新技術(shù)的設(shè)計(jì)圖紙,到制造出真實(shí)的發(fā)動(dòng)機(jī)和其他火箭部件,再到不斷試驗(yàn)更改設(shè)計(jì)中的錯(cuò)誤,再到制造出試驗(yàn)版本的火箭,整個(gè)流程均由藍(lán)箭航天主導(dǎo)。
因此,藍(lán)箭所選的技術(shù)路線是投資規(guī)模最大、技術(shù)難度最深、開發(fā)周期最長(zhǎng)的,對(duì)人的挑戰(zhàn)也是最高的。一旦能夠走下來(lái),所形成的行業(yè)壁壘非常高,所形成的市場(chǎng)競(jìng)爭(zhēng)力也非常強(qiáng)。
二、大量仿真 VS 三次機(jī)會(huì)
“航天最挑戰(zhàn)人性的地方,就是航天這個(gè)東西,沒有中間狀態(tài),只有0和1,而且大家只會(huì)記住1。”
——火箭研發(fā)總經(jīng)理 戴政
整個(gè)火箭的造價(jià),純硬件成本目前都在1億元以上,遑論其他。
這次成功入軌的朱雀二號(hào),藍(lán)箭就只給了TA三次失敗的機(jī)會(huì)。
如何才能真正“把問題留在地面,把成功帶上太空”,這是個(gè)至關(guān)重要的問題。
“液氧甲烷的難,并不是說(shuō)它有理論上不可行的地方,它更多的是體現(xiàn)在工程應(yīng)用層面的難……在這個(gè)過程中,我們做大量的仿真,做大量的試驗(yàn),去摸索規(guī)律,逐漸建立對(duì)甲烷物理特性的認(rèn)識(shí),才能解決好這個(gè)問題。”火箭研發(fā)總經(jīng)理戴政揭示了答案——大量的仿真,大量的試驗(yàn)。
不是所有的東西都可以通過觀察、推演和試驗(yàn)獲得的,比如宇宙演化、核彈爆炸,比如火箭入軌,或者實(shí)現(xiàn)不了,或者成本過高。
所以需要仿真,降低成本,提前試錯(cuò),縮短試驗(yàn)進(jìn)程。
仿真,是基于一定的數(shù)理模型基礎(chǔ),對(duì)現(xiàn)實(shí)的空間和時(shí)間進(jìn)行分割,一次次反復(fù)計(jì)算求解,才能建立認(rèn)知,摸索規(guī)律,從而解決大大小小的問題。
通過仿真,我們可以做很多事情:
比如,在以前發(fā)的這篇文《楊洋組織的“太空營(yíng)救”中, 那2小時(shí)到底發(fā)生了什么?》里,通過仿真驗(yàn)證,西北衛(wèi)星測(cè)控中心確認(rèn)了衛(wèi)星失聯(lián)的原因,準(zhǔn)確及時(shí)采取應(yīng)對(duì)措施,恢復(fù)整個(gè)衛(wèi)星通信系統(tǒng)。
再比如,“寶箭”快遞,要在什么高度以什么速度什么角度才能正確投遞到你家天臺(tái)?
在藍(lán)箭的世界里,大量仿真,大量試驗(yàn),才能一擊必勝。
一、一千個(gè)人,一千種使用方式
主打自主研發(fā)的藍(lán)箭航天,發(fā)展速度非常快,使用速石研發(fā)平臺(tái)的用戶數(shù)從0到數(shù)百人,穩(wěn)定增長(zhǎng),資源用量也隨著業(yè)務(wù)周期長(zhǎng)期穩(wěn)定上升。
這個(gè)過程中有兩個(gè)問題:
1. 研發(fā)團(tuán)隊(duì)人員來(lái)自天南海北,背景復(fù)雜,經(jīng)驗(yàn)不一,使用習(xí)慣也各不相同,需要有一個(gè)千人千面的平臺(tái);
2. 除了使用習(xí)慣外,就跟Alpha Cen一樣,研發(fā)人員需要持續(xù)探索新的技術(shù)路線,做一些前沿研究和嘗試。所以藍(lán)箭需要給研發(fā)工程師們留出空間,給他們充分的自由度,讓他們放開手去試錯(cuò),去最大可能尋求更優(yōu)解。
首先,每個(gè)用戶都是單獨(dú)的賬號(hào),互不干擾。
而針對(duì)不同的用戶背景和特性,我們提供了以下三種使用模式:
任務(wù)模式:通過Web瀏覽器向?qū)揭绘I提交仿真任務(wù),適用于確定的仿真求解流程。
集群模式:通過Web瀏覽器登錄集群遠(yuǎn)程桌面,打開應(yīng)用開啟仿真任務(wù),充分發(fā)揮按需配置、資源多樣化大規(guī)模并行調(diào)度能力。
工作站模式:Windows系統(tǒng),與傳統(tǒng)的本地單機(jī)仿真處理習(xí)慣一致。
既能千人千面,也能給每個(gè)工程師最大的自由度,滿足他們的使用習(xí)慣。
三種模式的實(shí)際應(yīng)用,可以戳這篇:怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
二、多團(tuán)隊(duì)研發(fā)協(xié)同與統(tǒng)一管理
根據(jù)業(yè)務(wù)線的劃分,藍(lán)箭有數(shù)個(gè)研發(fā)團(tuán)隊(duì),且分布在北京、上海、西安三個(gè)地區(qū),不同地區(qū)的團(tuán)隊(duì)存在業(yè)務(wù)上的交叉,需要多團(tuán)隊(duì)研發(fā)協(xié)同與統(tǒng)一管理。
用戶層面,我們?yōu)椴煌瑘F(tuán)隊(duì)成員提供面向CAE應(yīng)用適配與優(yōu)化的研發(fā)環(huán)境,用戶之間可共享數(shù)據(jù)、應(yīng)用、計(jì)算、網(wǎng)絡(luò)、存儲(chǔ),有效利用資源,提高協(xié)作能力。
數(shù)據(jù)層面,一方面,我們打通了數(shù)據(jù)傳輸通道,提供數(shù)據(jù)管理能力,實(shí)現(xiàn)多團(tuán)隊(duì)仿真任務(wù)高效協(xié)同;另一方面,平臺(tái)對(duì)不同用戶之間也做到了數(shù)據(jù)隔離,管理員可針對(duì)業(yè)務(wù)需求靈活控制平臺(tái)的功能和權(quán)限分配,保障數(shù)據(jù)訪問安全。
資源層面,我們支持將同一個(gè)集群按使用團(tuán)隊(duì)或資源屬性分成不同的獨(dú)立分區(qū),比如浙桂。這樣既保證了不同組的研發(fā)們能在同一個(gè)集群中工作,保留各自操作習(xí)慣的同時(shí)還互不干擾;又可以讓他們更有效地使用資源,減少閑置資源,提升整體資源利用率。
我們支持多種用戶統(tǒng)一身份認(rèn)證體系協(xié)議的對(duì)接:OIDC、SAML、oAuth2。目前已經(jīng)接入了藍(lán)箭的身份認(rèn)證體系。
三、基于數(shù)據(jù)分析的精細(xì)化運(yùn)營(yíng)管理
1. 更全局
基于CAE任務(wù)層的監(jiān)控、告警、數(shù)據(jù)統(tǒng)計(jì)分析功能與服務(wù),我們能從全局角度監(jiān)控各個(gè)重要指標(biāo)變化,掌握整體任務(wù)及資源情況,為未來(lái)項(xiàng)目合理規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。
比如,通過關(guān)注不同團(tuán)隊(duì)用量占比與周期性波動(dòng)情況,兼顧團(tuán)隊(duì)與整體,助力各團(tuán)隊(duì)實(shí)現(xiàn)其業(yè)務(wù)目標(biāo)。
2. 更細(xì)顆粒
我們還支持以更精細(xì)的顆粒度,如以項(xiàng)目、產(chǎn)品、用戶、應(yīng)用為維度,監(jiān)控任務(wù)和資源情況,進(jìn)行運(yùn)營(yíng)數(shù)據(jù)分析與成本評(píng)估,為進(jìn)一步管理優(yōu)化提供支持。
比如,用戶級(jí)別的用量統(tǒng)計(jì)與分析,能更好地理解業(yè)務(wù)場(chǎng)景與個(gè)人需求,公司能更好地在全局管理的基礎(chǔ)下提供支持。
芯片設(shè)計(jì)界有個(gè)非常稀罕的崗位叫IT-CAD,人才難得。
我們真心覺得,CAE界也值得擁有。
翻譯一下,TA的主要職能是在研發(fā)與IT之間架起一座橋梁,我們姑且可以稱之為R&D-IT能力。可針對(duì)研發(fā)人員所使用的CAE應(yīng)用軟件提供底層硬件基礎(chǔ)上的整個(gè)研發(fā)環(huán)境架構(gòu)與構(gòu)建、CAE仿真流程跑通與優(yōu)化、故障響應(yīng)、技術(shù)支持和使用咨詢等服務(wù)。
想仔細(xì)了解我們是怎么助攻的,可以參考這篇:【案例】普冉半導(dǎo)體逐步布局自主可控,漸次提升研發(fā)效率
一、標(biāo)準(zhǔn)CAE仿真環(huán)境的規(guī)劃和搭建
TA需要做的第一件事,就是站在整個(gè)仿真研發(fā)體系和架構(gòu)視角進(jìn)行標(biāo)準(zhǔn)CAE仿真環(huán)境的規(guī)劃和搭建。
這個(gè)規(guī)劃,不是走一步看一步,也不是頭痛醫(yī)頭,腳痛醫(yī)腳。
這件事,我們可以幫TA全做了。
我們的產(chǎn)品在設(shè)計(jì)之初就是面向CAE應(yīng)用,服務(wù)整個(gè)企業(yè)的工業(yè)仿真研發(fā)業(yè)務(wù)場(chǎng)景的。這也決定了我們解決問題的出發(fā)點(diǎn)永遠(yuǎn)是:是否滿足研發(fā)業(yè)務(wù)需求,然后從上至下地解決問題。
三個(gè)特點(diǎn):
1. 我們提供的是一整套即開即用的CAE仿真研發(fā)平臺(tái),是完整的一體化產(chǎn)品;
2. 產(chǎn)品一站式交付,提供了非常好的用戶交互體驗(yàn),簡(jiǎn)單易上手;
3. 無(wú)論用戶人數(shù)、資源數(shù)量和類型如何變化,產(chǎn)品架構(gòu)對(duì)現(xiàn)在&未來(lái)均有著極強(qiáng)的兼容性與彈性,且支持多個(gè)研發(fā)中心協(xié)同。
二、仿真設(shè)計(jì)流程的跑通,應(yīng)用的適配和銜接
隨著CAE環(huán)境搭建的完成,TA需要做的第二件事,就是仿真設(shè)計(jì)流程的跑通,各種CAE應(yīng)用的適配和銜接。
這第二件事,我們能幫TA把手動(dòng)做的事全部自動(dòng)化,還能提供應(yīng)用層與資源層的最佳實(shí)踐經(jīng)驗(yàn)。
我們提供的這套上中下層聯(lián)動(dòng)的CAE仿真研發(fā)環(huán)境:
1)連接上層CAE應(yīng)用,對(duì)應(yīng)用本身的運(yùn)行提供支持和優(yōu)化;
2)連接底層資源,給用戶提供更靈活、更高效使用資源的能力;
3)結(jié)合CAE應(yīng)用和底層資源的聯(lián)動(dòng)和適配,給出最佳實(shí)踐經(jīng)驗(yàn)。
火箭設(shè)計(jì)是一項(xiàng)復(fù)雜、周期很長(zhǎng)、技術(shù)含量非常高的工作,其研發(fā)過程充滿了挑戰(zhàn)性。在設(shè)計(jì)、研發(fā)和制造過程中應(yīng)用的學(xué)科,涉及到結(jié)構(gòu)力學(xué)、流體力學(xué)、傳熱學(xué)、材料等,對(duì)CAE應(yīng)用覆蓋廣泛。
在實(shí)際研發(fā)場(chǎng)景中,普遍存在的問題有資源利用率不高、排隊(duì)現(xiàn)象嚴(yán)重、成本難以把控等等。這大多是因?yàn)?strong>選擇的資源不匹配場(chǎng)景,使用不規(guī)范。整個(gè)過程中沒有最佳實(shí)踐,缺乏專業(yè)指導(dǎo)。另外,隨著新的應(yīng)用場(chǎng)景上來(lái),需要去探索和嘗試的成本特別高,還會(huì)造成資源浪費(fèi)。
1. 結(jié)合業(yè)務(wù)的常見CAE應(yīng)用適配
不同的CAE應(yīng)用,對(duì)于底層資源層的適配要求是不一樣的。
我們基于藍(lán)箭的用戶通用場(chǎng)景,對(duì)不同機(jī)型效率和成本進(jìn)行比對(duì)后,幫助用戶完成了實(shí)例選型。
選型目的有兩個(gè):匹配業(yè)務(wù)與控制成本。
根據(jù)我們的經(jīng)驗(yàn),對(duì)于前后處理來(lái)說(shuō),一般需要選擇GPU能力比較強(qiáng)的機(jī)型。
對(duì)于求解計(jì)算:
隱式算法,相比顯式算法來(lái)說(shuō),精度相對(duì)高,但可擴(kuò)展性不是很好,即在多臺(tái)機(jī)器上的線性加速比并不好,適合于在多核大內(nèi)存機(jī)器上運(yùn)行,一般對(duì)內(nèi)存、IO要求較高。
顯式算法,精度比隱式算法低,但可擴(kuò)展性相對(duì)較好,即在多臺(tái)機(jī)器上的線性加速比相對(duì)較好,適合于多節(jié)點(diǎn)并行計(jì)算,對(duì)機(jī)器無(wú)特殊要求,一般對(duì)內(nèi)存、IO要求較低。
不同CAE業(yè)務(wù)場(chǎng)景的擴(kuò)展性排序大抵如下圖所示,從上往下逐步提高。
比如,隱式算法計(jì)算電磁學(xué),并行度沒那么高,適合單機(jī)、高配,IO、性能越高越好。
而計(jì)算流體力學(xué)、結(jié)構(gòu)力學(xué)這種業(yè)務(wù)場(chǎng)景,線性加速性能比較好,適合暴力堆機(jī)器,多機(jī)并行。
2. 針對(duì)某CAE應(yīng)用的最佳實(shí)踐參考
根據(jù)某CAE應(yīng)用的最佳實(shí)踐:
在同等核數(shù)下運(yùn)行該應(yīng)用,開關(guān)超線程的成本差距并不大,但關(guān)閉超線程可以節(jié)省約一半甚至更多的時(shí)間,性價(jià)比相當(dāng)高。
我們建議藍(lán)箭:
第一,針對(duì)該應(yīng)用統(tǒng)一關(guān)閉超線程跑;
第二,設(shè)置資源分區(qū),一個(gè)開超線程分區(qū),一個(gè)關(guān)超線程分區(qū),讓用戶分開使用。研發(fā)團(tuán)隊(duì)可以根據(jù)自身業(yè)務(wù)場(chǎng)景需求,選擇不同的分區(qū)。
我們?yōu)樗{(lán)箭提供的最佳CAE應(yīng)用實(shí)踐參考,極大地幫助了研發(fā)團(tuán)隊(duì)更好地利用資源,從而提升計(jì)算效率,節(jié)省計(jì)算成本。
三、DEBUG,處理研發(fā)與IT之間的交叉區(qū)域問題
這第三件事,最令人頭大,也最耗精力。
有時(shí)候,可能讓TA從睜眼到閉眼都被BUG環(huán)繞。
我們能做的:
1. 根據(jù)最佳實(shí)踐和經(jīng)驗(yàn)進(jìn)行預(yù)判,幫TA預(yù)防掉一些問題;
2. 產(chǎn)品級(jí)能力,通過把手動(dòng)過程IT自動(dòng)化,減少一些問題;
3. 我們幫TA定位并解決一些問題。
讓TA能把時(shí)間花在更重要的事情上。
為什么有這么多問題?
根本原因在于,研發(fā)與IT之間是有壁的,他們說(shuō)的是不同世界的語(yǔ)言。而且壁與壁之間還有一段不小的距離,不知道該歸誰(shuí)管,需要懂交叉學(xué)科的人才。
有些交叉領(lǐng)域問題,IT可能真不了解,研發(fā)可能不得不自學(xué)大量技能。
詳情可戳這篇:八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(cè)(上)
我們?cè)谶@方面表現(xiàn)非常優(yōu)秀,下圖可以看出來(lái):
我們能為交叉領(lǐng)域提供專業(yè)支持,包括技術(shù)支持、故障響應(yīng)、使用咨詢等,讓研發(fā)從此可以專注研發(fā)。
CSM(Customer Success Manager),客戶成功經(jīng)理,作為關(guān)鍵客戶服務(wù)接口,主要為藍(lán)箭提供了以下兩類服務(wù):
1. 定制全天候?qū)I(yè)服務(wù)
為客戶定制專業(yè)的服務(wù)計(jì)劃,包括整體運(yùn)維管理、資源統(tǒng)計(jì)分析、賬單分析、周期性服務(wù)事件匯總等。通過全天候主動(dòng)式服務(wù),快速響應(yīng)及閉環(huán)用戶遇到的問題,提升用戶使用體驗(yàn)。
2. 業(yè)務(wù)高峰期重保服務(wù)
CSM還提供業(yè)務(wù)高峰期重保服務(wù),協(xié)助用戶平穩(wěn)度過業(yè)務(wù)高峰,保障關(guān)鍵業(yè)務(wù)順利開展。
今天我們只看定制全天候?qū)I(yè)服務(wù)。
先看效果:
1. 提升用戶研發(fā)效率,保障整體業(yè)務(wù)穩(wěn)定性;
2. 整個(gè)研發(fā)平臺(tái)使用期間,單核時(shí)成本下降達(dá)73%。
單核時(shí)成本反映了每單位計(jì)算資源的費(fèi)用,從而直接反映了資源利用的效率。
注:此單核時(shí)費(fèi)用,包含計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、服務(wù)等整體費(fèi)用
根據(jù)CSM的工作與效果,我們大致把整個(gè)業(yè)務(wù)分為三個(gè)階段:
階段一:業(yè)務(wù)早期磨合期
平臺(tái)上線初期,業(yè)務(wù)場(chǎng)景不固定,用戶大量保留原本較粗放的使用習(xí)慣,資源按需使用計(jì)費(fèi)的情況較多。
這一階段,CSM積極開展用戶調(diào)研,并定期與用戶的業(yè)務(wù)團(tuán)隊(duì)leader進(jìn)行用量數(shù)據(jù)分析,結(jié)合實(shí)際業(yè)務(wù)開展的情況,輸出計(jì)算資源合理使用建議,實(shí)施按需OD轉(zhuǎn)包月RI策略,使得資源使用逐步精細(xì)化、合理化。
同時(shí),CSM針對(duì)CAE應(yīng)用進(jìn)行深度支持,建立起基礎(chǔ)監(jiān)控告警策略,開展研發(fā)平臺(tái)使用培訓(xùn),并快速響應(yīng)和處理用戶日常問題,充分保證業(yè)務(wù)運(yùn)行穩(wěn)定。
階段二:中期深入優(yōu)化期
隨著用戶業(yè)務(wù)的推進(jìn),GPU資源使用逐步增多,由于GPU資源成本較高,使得單核時(shí)成本出現(xiàn)顯著上升,由此,不合理的資源使用帶來(lái)的成本浪費(fèi)也被放大。
CSM根據(jù)監(jiān)控?cái)?shù)據(jù)發(fā)現(xiàn)了這一問題,指導(dǎo)用戶進(jìn)行合理的資源選型和業(yè)務(wù)分配,讓資源利用更加合理、高效。同時(shí),深入使用場(chǎng)景,協(xié)助用戶持續(xù)優(yōu)化告警策略,增設(shè)了核時(shí)波動(dòng)告警、實(shí)例空閑告警等,進(jìn)一步提升平臺(tái)穩(wěn)定性,并為持續(xù)性的成本優(yōu)化提供了數(shù)據(jù)支撐。
階段三:持續(xù)優(yōu)化的平穩(wěn)期
經(jīng)歷了前兩個(gè)階段的波動(dòng)之后,業(yè)務(wù)穩(wěn)定性和單核時(shí)成本均邁入了小步穩(wěn)定向好的態(tài)勢(shì)。
在這一階段,CSM持續(xù)提供主動(dòng)巡檢、定期數(shù)據(jù)分析、使用技巧賦能、安全加固規(guī)劃、產(chǎn)品需求追蹤落地等服務(wù)支撐,深耕細(xì)化,持續(xù)提升用戶體驗(yàn)。
CSM主要做了哪幾件事?
一、全方位系統(tǒng)監(jiān)控&飛書告警策略
CSM為藍(lán)箭搭建全方位系統(tǒng)監(jiān)控&告警策略體系:
初期,協(xié)助用戶創(chuàng)建基礎(chǔ)監(jiān)控體系,提前預(yù)防問題,降低系統(tǒng)風(fēng)險(xiǎn);
中后期,深入使用場(chǎng)景,協(xié)助用戶持續(xù)優(yōu)化告警策略,比如核時(shí)波動(dòng)告警、實(shí)例空閑告警等,進(jìn)一步提升平臺(tái)穩(wěn)定性,為持續(xù)性成本優(yōu)化提供數(shù)據(jù)支持。
平臺(tái)級(jí)告警處理:
一旦發(fā)現(xiàn)問題,CSM會(huì)結(jié)合用戶調(diào)研與數(shù)據(jù)分析情況,與用戶進(jìn)行及時(shí)溝通和風(fēng)險(xiǎn)預(yù)警提示,根據(jù)實(shí)際業(yè)務(wù)運(yùn)行情況針對(duì)性輸出建議,指導(dǎo)用戶進(jìn)行合理資源選型與業(yè)務(wù)分配,讓資源利用更加合理、高效。
用戶級(jí)告警處理:
1. 告警信息會(huì)被通知至飛書群;
2. 接收人收到飛書告警后,匹配資源所屬研發(fā)并定向通知至本人;
3. 資源所屬研發(fā)收到告警通知后,進(jìn)行后續(xù)操作。
二、周/月/年度數(shù)據(jù)分析,定期匯報(bào)與溝通
為了提供最高效、最全面的服務(wù),CSM向藍(lán)箭提供了周/月/年度數(shù)據(jù)分析報(bào)告,緊急問題隨時(shí)線上會(huì)議交流。
這種定期和主動(dòng)的溝通方式,一方面能使我們更好更及時(shí)地響應(yīng)、理解和滿足用戶的需求,另一方面,也為管理者提供一個(gè)及時(shí)、全面的視角,掌握平臺(tái)的整體運(yùn)營(yíng)情況、研發(fā)團(tuán)隊(duì)遇到的問題和需求的最新進(jìn)展。
三、主動(dòng)巡檢,7*24小時(shí)技術(shù)問題響應(yīng)
面對(duì)各類復(fù)雜問題,我們始終堅(jiān)持以用戶、業(yè)務(wù)為中心,以專業(yè)的團(tuán)隊(duì)及時(shí)響應(yīng)、處理問題,確保問題得到完整的閉環(huán)。
年度問題處理與閉環(huán)總計(jì):400+,覆蓋平臺(tái)搭建與維護(hù)、CAE應(yīng)用安裝與維護(hù)、網(wǎng)絡(luò)調(diào)試與維護(hù)等問題。
四、專項(xiàng)培訓(xùn)與FAQ總結(jié)
CSM還會(huì)組織專項(xiàng)培訓(xùn)和FAQ總結(jié)分享,助力形成內(nèi)部沉淀,提高工作效率,更加迅速和準(zhǔn)確地解決問題。
1. 持續(xù)培訓(xùn)
為幫助研發(fā)團(tuán)隊(duì)充分理解和快速掌握平臺(tái)的使用,CSM會(huì)針對(duì)使用過程中的一些疑問進(jìn)行集中專項(xiàng)培訓(xùn),尤其是在平臺(tái)上線與更新、新人入職期間加大培訓(xùn)力度,并以文檔、培訓(xùn)視頻方式形成內(nèi)部沉淀。
2. FAQ總結(jié)
為了提高研發(fā)人員解決問題的效率和自助能力,針對(duì)共性和普遍性存在的問題,CSM每月都會(huì)整理和更新常見問題集(FAQ),在藍(lán)箭內(nèi)部分享,減少重復(fù)問題帶來(lái)的溝通時(shí)間成本,提高用戶體驗(yàn)。
Take Away
1. 張昌武說(shuō):“我們某種程度上在中國(guó)商業(yè)航天領(lǐng)域里面是一個(gè)最早的發(fā)起者,也是在這過程中一個(gè)持續(xù)的參與者和推動(dòng)者。因?yàn)檫@個(gè)行業(yè)是沒有一個(gè)現(xiàn)成的樣板讓我們?nèi)ツ7拢屛覀內(nèi)コu的。我們只有自己去定義,這個(gè)行業(yè)該怎么去走。”
我們也感到非常榮幸,能有機(jī)會(huì)參與并推動(dòng)中國(guó)自主商業(yè)航天領(lǐng)域的發(fā)展。
2. 在產(chǎn)品調(diào)研中用戶反饋,我們的產(chǎn)品在短時(shí)間即可滿足絕大多數(shù)業(yè)務(wù)流程和功能,幫他們節(jié)省了很多時(shí)間和人力,快速實(shí)現(xiàn)整個(gè)研發(fā)環(huán)境的從零到一。而且很重要的一點(diǎn)是,原來(lái)的使用方式都是單機(jī)為主,現(xiàn)在實(shí)現(xiàn)了集群化和自動(dòng)化,大大提升了研發(fā)效率。
3. 國(guó)內(nèi)工業(yè)制造領(lǐng)域陸續(xù)進(jìn)入產(chǎn)業(yè)升級(jí)數(shù)字化轉(zhuǎn)型階段,尤其對(duì)于主打自主研發(fā)創(chuàng)新的公司,工業(yè)仿真軟件是智能制造設(shè)計(jì)研發(fā)環(huán)境不可或缺的工具,在產(chǎn)品迭代過程給予的技術(shù)支撐作用日益凸顯,各環(huán)節(jié)都需要與仿真技術(shù)進(jìn)行深度融合,加快迭代周期,節(jié)省時(shí)間和資源。我們的仿真研發(fā)平臺(tái)以及擁有的R&D-IT能力,對(duì)這類公司的快速起飛能起到非常好的推動(dòng)作用。
藍(lán)箭航天空間科技股份有限公司(藍(lán)箭航天)是國(guó)內(nèi)領(lǐng)先的航天運(yùn)輸系統(tǒng)創(chuàng)建及運(yùn)營(yíng)的商業(yè)公司,成立于2015年,國(guó)家高新技術(shù)企業(yè),國(guó)際宇航聯(lián)合會(huì)(IAF)會(huì)員。藍(lán)箭航天以國(guó)家戰(zhàn)略為指引,以市場(chǎng)需求為導(dǎo)向,致力于研制以液氧甲烷作為推進(jìn)劑的中大型運(yùn)載火箭系列產(chǎn)品,為全球市場(chǎng)提供高性價(jià)比、高可靠性的發(fā)射服務(wù)。秉承高度集成化、智能化的產(chǎn)品設(shè)計(jì)和研發(fā)理念,藍(lán)箭航天憑借卓越的創(chuàng)新能力及專業(yè)技術(shù)團(tuán)隊(duì)解決產(chǎn)品設(shè)計(jì)、制造、測(cè)試和交付,構(gòu)建商業(yè)航天領(lǐng)域的科技綜合體,打造世界一流商業(yè)航天企業(yè)。
關(guān)于fastone云平臺(tái)在各種CAE應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:
Bladed │ Fluent │ LS-DYNA │ COMSOL
速石科技工業(yè)仿真行業(yè)白皮書,可以戳下方查看:
仿真宇宙|評(píng)測(cè)篇(上) |評(píng)測(cè)篇(下)
- END -
我們有個(gè)工業(yè)仿真研發(fā)云平臺(tái)
CAE/CFD仿真設(shè)計(jì)全流程覆蓋
Auto-Scale自動(dòng)按需開關(guān)所需資源
任務(wù)一鍵提交,仿真結(jié)果可視化
自研DM工具,高效傳輸仿真數(shù)據(jù)
仿真成本自動(dòng)統(tǒng)計(jì)、分析、優(yōu)化
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多CAE電子書
歡迎掃碼關(guān)注小F(ID:iamfastone)獲取
你也許想了解具體的落地場(chǎng)景:
這樣跑COMSOL,是不是就可以發(fā)Nature了
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
工業(yè)仿真研發(fā)平臺(tái):
光電兼修的Alpha Cen,如何應(yīng)對(duì)上升期的甜蜜煩惱?
國(guó)產(chǎn)調(diào)度器之光——Fsched到底有多能打?
研發(fā)/IT工程師雙視角測(cè)評(píng)8大仿真平臺(tái),結(jié)果……
八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(cè)(上)
2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀
近期重大事件:
速石科技出席ICCAD2023,新一代芯片研發(fā)平臺(tái)助力半導(dǎo)體企業(yè)縮短研發(fā)周期
速石科技與芯啟源開啟戰(zhàn)略合作,聯(lián)手打造軟硬件一體芯片研發(fā)云平臺(tái)
速石科技作為特邀服務(wù)商入駐IC PARK,合力打造集成電路產(chǎn)業(yè)新生態(tài)
速石科技成為國(guó)家“芯火”深圳雙創(chuàng)基地(平臺(tái))戰(zhàn)略合作伙伴,推動(dòng)國(guó)產(chǎn)EDA公共技術(shù)服務(wù)云平臺(tái)建設(shè)
速石科技聯(lián)合電信、移動(dòng)、聯(lián)通三大運(yùn)營(yíng)商,為國(guó)家數(shù)字經(jīng)濟(jì)轉(zhuǎn)型注入新動(dòng)力
上一篇,我們圍繞著億萬(wàn)研發(fā)工程師的夢(mèng)想,考察了市面上幾乎所有類型的工業(yè)仿真平臺(tái),深度評(píng)測(cè)了他們本質(zhì)究竟是什么,適用場(chǎng)景有哪些,分別能給研發(fā)和IT工程師們減輕多少工作量。
據(jù)此,我們搭建了一個(gè)工業(yè)仿真平臺(tái)【心累指數(shù)】金字塔模型。
戳這里回顧金字塔模型與基本設(shè)定:八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(cè)(上)
不同廚房/餐廳設(shè)定對(duì)應(yīng)著同一層級(jí)不同“仿真平臺(tái)”的本質(zhì)屬性,詳細(xì)展開可以戳上面的鏈接。總之,從金字塔底層到塔尖,不論是對(duì)研發(fā)還是IT工程師,都是站得越高,用得越爽。
你可以跳過下文直接掃碼獲取白皮書閱讀原文,但看完會(huì)獲得一個(gè)新的視角,也非常不錯(cuò)。
在上篇里,我們從基礎(chǔ)定義與適用場(chǎng)景出發(fā),討論了8種平臺(tái)/方案的產(chǎn)品模式、兼容性、支持的CAE仿真軟件、底層資源量與類型、計(jì)費(fèi)模式等信息。
今天,我們將更進(jìn)一步,從研發(fā)和IT工程師的雙視角用戶體驗(yàn)出發(fā),一起看看這8種平臺(tái)/方案究竟是如何提升研發(fā)效率、降低IT工作量的?
3.1、需要研發(fā)掌握什么技能?
底層:
自己買機(jī)器,研發(fā)+IT需要聯(lián)合搞定包括但不限于軟件、系統(tǒng)、硬件行情、機(jī)房選址、網(wǎng)絡(luò)配置、IT運(yùn)維、數(shù)據(jù)安全、集群調(diào)度……等事情。自家IT的能力越強(qiáng),研發(fā)就相對(duì)輕松,反之就更心累。
超算中心需要研發(fā)點(diǎn)亮部分IT技能。
特別是超算中心大多使用Linux系統(tǒng),要求研發(fā)掌握一定的Linux常識(shí)才能上手。貼一張超算的實(shí)際運(yùn)行界面,大家感受一下?
云廠商同樣需要研發(fā)點(diǎn)亮部分IT技能。但是云廠商可同時(shí)提供Windows和Linux的若干版本供用戶選擇,只不過帶Windows系統(tǒng)的云資源普遍要比帶Linux系統(tǒng)的貴。
中層:
這一層屬于第三方平臺(tái),用戶沒有接觸底層資源的權(quán)限,自然也不需要有太多IT技能。但這也代表著,很多東西是不能輕易改動(dòng)的。
如果遇到使用上的問題,一般需要呼喚第三方平臺(tái)的人來(lái)協(xié)助。自家IT可能幫不了太多。
塔尖:
針對(duì)研發(fā)與IT之間的交叉領(lǐng)域,我們的一整套端到端的仿真研發(fā)環(huán)境將很多IT工作自動(dòng)化操作,大大減少了交叉領(lǐng)域的工作難度和工作量。另外,還有fastone的R&D-IT團(tuán)隊(duì)還可以提供全方位的服務(wù)支持。
fastone在支持Windows的同時(shí),也可支持用戶在Linux系統(tǒng)中使用圖形化界面操作仿真任務(wù),你只需熟悉一下Linux的常用操作與工具(如瀏覽器、文本編輯器),即可在很短的時(shí)間內(nèi)上手,操作習(xí)慣幾乎無(wú)需改變。
詳請(qǐng)可戳:怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
3.2、是否包含前后處理+求解等一整套完整功能?
底層:
買機(jī)器,系統(tǒng)環(huán)境都需要自己部署,更別提軟件功能了,一切都要靠自己。超算中心和云廠商絕大多數(shù)只支持計(jì)算求解。
中層:
你可在軟件平臺(tái)中直接點(diǎn)擊進(jìn)入相關(guān)步驟,完成前后處理和計(jì)算求解。其他平臺(tái)主要集中在計(jì)算求解這一環(huán)節(jié)。
塔尖:
同時(shí)包含前后處理+計(jì)算求解。
3.3、可以圖形化界面操作嗎?
底層:
均無(wú)。
中層:
云廠商的仿真平臺(tái)不支持。
部分硬件廠商的仿真平臺(tái)可支持圖形界面。
超算云做了類似電腦桌面的界面,所有服務(wù)(包括SSH、上傳下載,應(yīng)用等)都可以在圖形界面上操作。
軟件平臺(tái)一般完美支持。
塔尖:
fastone針對(duì)不同的用戶,提供多種任務(wù)提交方式以供選擇。
圖形界面模式:可通過Web瀏覽器啟動(dòng)集群,跳轉(zhuǎn)到虛擬桌面,并可在該桌面直接操作應(yīng)用進(jìn)行相應(yīng)設(shè)置以開啟云端仿真任務(wù)。
任務(wù)模式:用戶可以通過Web瀏覽器選擇新建任務(wù)、選擇應(yīng)用、上傳文件、輸入?yún)?shù)、配置資源等一系列向?qū)铰窂教峤蝗蝿?wù)。
集群模式:對(duì)于高級(jí)用戶,比如本身對(duì)應(yīng)用工作流的理解和編程能力超強(qiáng),可以不用走普通用戶通過應(yīng)用向?qū)教峤坏穆窂剑梢灾苯痈鶕?jù)自己寫的腳本,通過Web瀏覽器選擇新建集群,然后按需動(dòng)態(tài)地在云端創(chuàng)建HPC集群。
3.4、突然有個(gè)緊急項(xiàng)目,我能不能馬上用上?
底層:
買機(jī)器響應(yīng)時(shí)間最長(zhǎng),采購(gòu)、運(yùn)輸、調(diào)試、部署環(huán)境、安裝軟件一套流程走下來(lái),黃花菜都涼了。超算中心需要排隊(duì),基本不可能滿足緊急需求。
云廠商可以較快地拿到資源,但配置環(huán)境、安裝軟件也需要時(shí)間。
中層:
除了超算云依然面臨排隊(duì)問題,在資源需求量不大的情況下,其他三個(gè)平臺(tái)理論上均能較快地拿到資源并開始計(jì)算。
塔尖:
快速啟動(dòng),即開即用。
尤其是當(dāng)這個(gè)緊急項(xiàng)目需要非常多的算力時(shí),fastone云平臺(tái)的全球數(shù)據(jù)中心能持續(xù)穩(wěn)定地提供用戶所需資源類型及數(shù)量,分鐘級(jí)調(diào)度開啟上萬(wàn)核計(jì)算資源,滿足業(yè)務(wù)緊迫度。
3.5、自動(dòng)化程度有多高?
自動(dòng)化是什么意思?不需要你一臺(tái)臺(tái)地開機(jī)器,鼠標(biāo)簡(jiǎn)單點(diǎn)幾下就能自動(dòng)開關(guān)機(jī);能夠自定義工作流程,不需要每次跑仿真都重復(fù)設(shè)定;
自動(dòng)檢查任務(wù)狀態(tài),出現(xiàn)錯(cuò)誤可以及時(shí)重復(fù)提交并通知你;
甚至對(duì)于某些因資源類型報(bào)錯(cuò)的任務(wù),還能自動(dòng)定位并調(diào)度其他類型的資源來(lái)跑任務(wù)……
底層:
均無(wú)。
中層:
均無(wú)。
塔尖:
fastone云平臺(tái)可提供包括自動(dòng)化部署、自定義工作流、自動(dòng)檢查任務(wù)狀態(tài)與重復(fù)提交、自動(dòng)定位任務(wù)并調(diào)度其他類型資源重算等IT自動(dòng)化能力與Auto-Scale自動(dòng)伸縮等功能,可快速全面地提升仿真研發(fā)效率。
比如我們的Auto-Scale功能可以自動(dòng)監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動(dòng)態(tài)按需地開啟所需算力資源。在資源不夠的時(shí)候,還能根據(jù)不同的用戶策略,自動(dòng)化調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類型或相似類型實(shí)例資源。
效果怎么樣?看這篇:從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
3.6、當(dāng)有多個(gè)仿真任務(wù)時(shí),是否支持開多臺(tái)機(jī)器同時(shí)跑任務(wù)?
多個(gè)任務(wù)同時(shí)在數(shù)臺(tái)機(jī)器上跑,這個(gè)我們稱之為并行計(jì)算,一般都需要有調(diào)度器的參與。
關(guān)于調(diào)度器的相關(guān)知識(shí),看這里:億萬(wàn)打工人的夢(mèng):16萬(wàn)個(gè)CPU隨你用
這么多機(jī)器,這么多任務(wù),怎么順利一一配置、啟動(dòng)、關(guān)閉,提高整體資源利用率,最好還能自動(dòng)化管理等等,難度就陡然提升了。
對(duì)研發(fā)來(lái)說(shuō),能否支持大規(guī)模并行計(jì)算,是提升研發(fā)效率的關(guān)鍵。
底層:
買機(jī)器需要自己搞定一切。
超算中心和云廠商則是為你提供了一個(gè)基礎(chǔ)架構(gòu),只要應(yīng)用支持,你就可以進(jìn)行并行計(jì)算。
中層:
同樣在應(yīng)用支持的前提下,金字塔中層可以讓用戶較為方便地進(jìn)行并行計(jì)算。
不過這一層平臺(tái)提供的只是基礎(chǔ)環(huán)境,用戶能否用好取決于其自身技術(shù)能力。
塔尖:
我們自主研發(fā)的云原生國(guó)產(chǎn)化調(diào)度器Fsched,可分鐘級(jí)自動(dòng)化調(diào)度上萬(wàn)核計(jì)算資源,幫助用戶應(yīng)對(duì)突發(fā)算力需求場(chǎng)景。更重要的是,fastone能夠結(jié)合業(yè)務(wù)特點(diǎn)以及應(yīng)用特性,利用計(jì)算機(jī)技術(shù)提升不同業(yè)務(wù)場(chǎng)景的計(jì)算效率。
舉個(gè)栗子:這樣跑COMSOL,是不是就可以發(fā)Nature了
3.7、能否提供任務(wù)監(jiān)控及相應(yīng)的告警、優(yōu)化分析功能?
研發(fā)工程師關(guān)心的主要是自己的任務(wù)情況。
底層:
均無(wú)。
中層:
均無(wú)。
塔尖:
這方面fastone云平臺(tái)可謂一枝獨(dú)秀。
我們能多維度監(jiān)控任務(wù)狀態(tài),提供基于任務(wù)層的監(jiān)控、告警、數(shù)據(jù)統(tǒng)計(jì)分析功能與服務(wù)。
有啥用呢?戳這兩篇了解:
王者帶飛LeDock!開箱即用&一鍵定位分子庫(kù)+全流程自動(dòng)化,3.5小時(shí)完成20萬(wàn)分子對(duì)接
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
3.8、仿真文件那么大,數(shù)據(jù)傳輸效率跟得上嗎?
底層:
買機(jī)器如果是在本地進(jìn)行數(shù)據(jù)傳輸,取決于本地網(wǎng)絡(luò)配置。如果是多地傳輸,就看你買多大的帶寬了。
超算中心對(duì)外的網(wǎng)絡(luò)帶寬十分有限,且被很多并發(fā)用戶共享,數(shù)據(jù)傳輸是個(gè)大問題,人肉送硬盤有時(shí)甚至是最好的解決方案。
云廠商對(duì)結(jié)果數(shù)據(jù)支持直接讀取,云上存儲(chǔ),按需下載。但怎么用,能不能用好,還是取決于用戶自己。
中層:
超算云有專線網(wǎng)絡(luò),傳輸效率優(yōu)于超算中心。
其他三者的傳輸效率視自身機(jī)房條件/資源提供方而定。
塔尖:
fastone云平臺(tái)擁有自主可控的數(shù)據(jù)傳輸方案。
你只需要把數(shù)據(jù)上傳到的DM(Data Manager)工具上,就可以直接使用數(shù)據(jù)來(lái)跑任務(wù)。
與市面上開源的數(shù)據(jù)傳輸工具相比,DM使用方便、功能全面,利用fastone自主研發(fā)的分段上傳、高并發(fā)、斷點(diǎn)續(xù)傳等數(shù)據(jù)傳輸技術(shù),可大幅優(yōu)化海量數(shù)據(jù)的傳輸效率。
4.1、需要IT掌握什么技能?
底層:
自己買機(jī)器需要強(qiáng)大的IT團(tuán)隊(duì),搞定機(jī)房、硬件、環(huán)境、軟件……等一系列事項(xiàng)。超算中心與云廠商的情況比較類似,除了機(jī)器在別人機(jī)房你摸不著,IT需要協(xié)助研發(fā)搞定在使用過程中遇到的其他任何問題……
中層:
這一層,自家IT在熟讀第三方平臺(tái)操作說(shuō)明之后可以幫上一定的忙。
塔尖:
借助多個(gè)自動(dòng)化功能與管理系統(tǒng)(具體可見本章節(jié)其他回答),IT只需簡(jiǎn)單熟悉操作之后便可快速上手平臺(tái)。
而R&D-IT服務(wù)的存在也讓IT與研發(fā)之間的溝通更加順暢。
4.2、機(jī)器多了之后,方便管理嗎?
這個(gè)問題其實(shí)有兩層含義,即機(jī)器多了之后——
1)是否可以方便地自動(dòng)化運(yùn)維?這里面涉及到包括開關(guān)機(jī)、軟件安裝配置、資源監(jiān)控、集群管理等IT基礎(chǔ)工作的自動(dòng)化程度;
2)是否可以方便地分配業(yè)務(wù)?比如臨時(shí)需要將一批機(jī)器從團(tuán)隊(duì)A劃撥給團(tuán)隊(duì)B使用,是否能夠支持IT快速方便地進(jìn)行配置?
而能否做到第二點(diǎn),事實(shí)上是由第一點(diǎn)決定的。也就是說(shuō),自動(dòng)化運(yùn)維的程度越高,越能夠快速方便地分配業(yè)務(wù)。對(duì)IT來(lái)說(shuō),也就意味著更便于管理。
底層:
買機(jī)器需要IT自己搞定所有的運(yùn)維工作,機(jī)器越多越麻煩。
超算中心提供統(tǒng)一的人工運(yùn)維。
云廠商會(huì)提供諸如資源監(jiān)控、集群管理模塊等功能,具體使用程度取決于用戶本身。
中層:
金字塔中層基本都具備一定的自動(dòng)化運(yùn)維能力,如資源監(jiān)控、權(quán)限分配等,但同時(shí)也存在著一定程度的功能缺失,比如需要IT自行搞定支持列表之外的軟件、除云廠商的仿真平臺(tái)之外均缺失集群管理模塊等等。
塔尖:
fastone云平臺(tái)擁有完整的全維度自動(dòng)化運(yùn)維能力,機(jī)器再多都能輕松管理,快速分配業(yè)務(wù)。比如大家都熟悉的集群管理,在云端手動(dòng)管理集群和自動(dòng)化部署的工作量區(qū)別一目了然:
4.3、權(quán)限管理方便嗎?比如分配資源上限啥的?
底層:
均無(wú)此功能。
中層:
均可提供管理員賬號(hào)和子用戶權(quán)限分配功能。
塔尖:
支持管理員角色對(duì)每一個(gè)用戶進(jìn)行相關(guān)權(quán)限設(shè)定,包括預(yù)算使用上限和CPU核數(shù)使用上限。
4.4、需要用戶自己來(lái)維護(hù)機(jī)器嗎?
此處的“維護(hù)機(jī)器”專指對(duì)硬件的維護(hù)。
底層:
買機(jī)器需要自己負(fù)責(zé)所有機(jī)器的維護(hù)。超算中心和云廠商無(wú)需維護(hù)。
中層:
無(wú)需自己維護(hù)。
塔尖:
無(wú)需自己維護(hù)。
4.5、有沒有資源監(jiān)控及相應(yīng)的告警、優(yōu)化分析功能?
底層:
買機(jī)器需要自己搞定資源監(jiān)控。
超算中心的監(jiān)控功能僅存在于全局統(tǒng)計(jì),無(wú)法拆開,其他層面的監(jiān)控功能缺失。
云廠商會(huì)提供類似Cloud Watch的基礎(chǔ)監(jiān)控功能,對(duì)云資源的監(jiān)控十分細(xì)致,但配置相對(duì)復(fù)雜。
中層:
基本都支持資源監(jiān)控功能。
云廠商的Cloud Watch在金字塔底層說(shuō)過了,就不再重復(fù)了。
有的軟件平臺(tái)支持定制監(jiān)控管理工具,可實(shí)時(shí)監(jiān)控任務(wù)狀態(tài)以及CPU/內(nèi)存等資源的使用情況;也有的做了中央管理儀表板可視化功能,幫助你方便快捷地監(jiān)控?cái)?shù)據(jù)。
塔尖:
不同角色的用戶可根據(jù)自身需求,查看所需的資源監(jiān)控信息。如研發(fā)可查看單個(gè)任務(wù)的資源使用情況,IT則可通過監(jiān)控功能掌握平臺(tái)整體的資源消耗水平。團(tuán)隊(duì)管理者可以監(jiān)控各個(gè)重要指標(biāo),從全局角度掌握項(xiàng)目的整體任務(wù)及資源情況,為未來(lái)項(xiàng)目規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。
4.6、有什么安全上的風(fēng)險(xiǎn)嗎?
底層:
買機(jī)器的都是純本地資源,需要自己搭建防火墻等安全措施,還得注意機(jī)房安全。而且機(jī)器在自己上手看似能完全掌控計(jì)算資源,其實(shí)麻煩更多,軟件、硬件、機(jī)房、網(wǎng)絡(luò)、人員……任何環(huán)節(jié)出了問題都可能影響你的仿真進(jìn)程。
超算中心的底層是非隔離的,你能看到其他用戶的任務(wù)信息,這是一個(gè)比較致命的問題。
更致命的一點(diǎn)是,而超算由于要優(yōu)先服務(wù)國(guó)家級(jí)科研項(xiàng)目,在某些情況下,即便已經(jīng)分配到的超算資源,也有可能會(huì)被無(wú)條件收回。
想象一下,有一天,你吃著火鍋唱著歌,跑著仿真等結(jié)果,突然就被收回了資源……任務(wù)就涼了。
云廠商的是獨(dú)占資源,可以理解為在海量云資源中劃出一塊專屬區(qū)域供用戶使用,別人無(wú)法觸及。獨(dú)占資源意味著:
1)云資源在任何情況下都不用會(huì)被搶走;
2)可根據(jù)用戶的習(xí)慣和應(yīng)用的特性自由選擇操作系統(tǒng),沒有任何限制;
3)應(yīng)用與依賴組件安裝靈活;
4)安全。
中層:
跟第三方平臺(tái)底層資源保持一致。
塔尖:
fastone云平臺(tái)提供的也是獨(dú)占資源。
我們提供完整的云安全策略模型,可對(duì)整個(gè)安全生命周期進(jìn)行管理。我們用更完善更具體的產(chǎn)品安全架構(gòu),全面保障客戶業(yè)務(wù)系統(tǒng)安全,包括身份認(rèn)證、操作日志、MFA、數(shù)據(jù)隔離、數(shù)據(jù)加密、數(shù)據(jù)審批、日志審計(jì)、安全規(guī)范、安全組織、風(fēng)險(xiǎn)預(yù)警等。
綜合對(duì)比之后,我們來(lái)給8個(gè)產(chǎn)品/解決方案排個(gè)序:
我們還有更為完整的仿真平臺(tái)對(duì)比白皮書,歡迎直接掃碼獲取白皮書閱讀完整報(bào)告:
目錄先睹為快~
關(guān)于fastone云平臺(tái)在各種CAE應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:Bladed │ Fluent │ LS-DYNA │ COMSOL
- END -
我們有個(gè)CAE仿真研發(fā)云平臺(tái)
集成多種CAE/CFD應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫(kù)+全流程自動(dòng)化,3.5小時(shí)完成20萬(wàn)分子對(duì)接
這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(cè)(上)
2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀
當(dāng)仿真外包成為過氣網(wǎng)紅后…
和28家業(yè)界大佬排排坐是一種怎樣的體驗(yàn)?
這一屆科研計(jì)算人趕DDL紅寶書:學(xué)生篇
楊洋組織的“太空營(yíng)救”中, 那2小時(shí)到底發(fā)生了什么?
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
Ansys最新CAE調(diào)研報(bào)告找到阻礙仿真效率提升的“元兇”
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
從1998年發(fā)布首個(gè)版本至今,COMSOL一直在持續(xù)進(jìn)化,如今它已經(jīng)有了30多個(gè)針對(duì)不同應(yīng)用領(lǐng)域的專業(yè)模塊,涵蓋力學(xué)、電磁場(chǎng)、流體、傳熱、化工、MEMS、聲學(xué)等專業(yè)學(xué)科,并可以將不同的物理問題關(guān)聯(lián)起來(lái),方便研究不同物理過程之間的相互作用。
越來(lái)越多Nature、Science及其子刊論文都用到了COMSOL模擬。
今天我們以一個(gè)高校用戶為例,講講我們?cè)贑OMSOL實(shí)際運(yùn)用過程中,除了速度和效率的提升外,還幫他們解決了哪些問題?
比如:
Windows還是Linux?
這是個(gè)問題關(guān)于多機(jī)并行,有多少種不同的打開方式
一旦用了外部資源,比如超算,本地機(jī)器閑置了,就問你心不心疼?
本地環(huán)境維護(hù),就問你操不操心?
老師的需求:既要,又要,還要,一把滿足,這真實(shí)嗎?
……
所以,現(xiàn)在可以發(fā)Nature了嗎(劃掉)
用戶需求
某高校課題組有5臺(tái)工作站,雖然機(jī)器比較老舊,但平時(shí)大家協(xié)商著劃分時(shí)間輪流跑任務(wù),甚至還有排半夜的。整體來(lái)說(shuō),資源也勉強(qiáng)夠用。
最近該課題組新增了幾名成員,并申請(qǐng)到了幾個(gè)科研項(xiàng)目,需要使用COMSOL做大量仿真計(jì)算,這就直接導(dǎo)致了計(jì)算資源捉襟見肘。
現(xiàn)在的問題點(diǎn)主要有三個(gè):
1、人多了,難管理,資源利用率整體很低;
2、他們也用過超算,但是資源是共享的,有隨時(shí)被搶走的風(fēng)險(xiǎn),心里沒底,而且沒法跟本地連到一起來(lái)用;
3、本地的各種維護(hù)工作,應(yīng)用升級(jí),安裝配置等工作非常繁瑣,需要耗費(fèi)大量時(shí)間手工操作。
實(shí)證目標(biāo)
1、COMSOL任務(wù)能否在云端跑得更快?
2、fastone平臺(tái)的云解決方案能否同時(shí)利用好課題組的本地資源?
3、fastone平臺(tái)的資源能否提供更大的用戶權(quán)限?
4、fastone平臺(tái)能否將各種維護(hù)工作降到最低?
實(shí)證參數(shù)
平臺(tái):fastone企業(yè)版產(chǎn)品
應(yīng)用:COMSOL Multiphysics
場(chǎng)景:電磁場(chǎng)分析、風(fēng)力發(fā)電機(jī)噪音分析、HVAC導(dǎo)管流線分布等
系統(tǒng):Windows/Linux
云端配置:計(jì)算優(yōu)化型實(shí)例/網(wǎng)絡(luò)加強(qiáng)型實(shí)例
架構(gòu)圖:
實(shí)證過程
一、Windows還是Linux?這是個(gè)問題
COMSOL同時(shí)支持Windows和Linux系統(tǒng)的集群計(jì)算。用戶一直使用的是較為熟悉的Windows版本。
現(xiàn)在,讓我們默念三遍:Windows的世界,一切都要錢的。
單機(jī)跑的情況下,這不是什么大問題。但一旦涉及到多機(jī)多核運(yùn)行任務(wù),問題就大了。
比如:主流云廠商對(duì)不同操作系統(tǒng)鏡像有不同的定價(jià)方式。整體來(lái)說(shuō),通過Windows系統(tǒng)使用云資源價(jià)格比Linux系統(tǒng)要貴。
因此,使用Linux替換Windows也可以有效節(jié)省成本。
所有,都要錢。
總之,不是長(zhǎng)久之計(jì)。
而如何從Windows系統(tǒng)轉(zhuǎn)換到Linux系統(tǒng)呢?
這就跟習(xí)慣了用Android系統(tǒng)的人,換成iOS一樣。一旦適應(yīng),操作就如絲般順滑。
為了確保這一點(diǎn),我們支持用戶在Linux系統(tǒng)中使用圖形化界面操作COMSOL任務(wù),用戶只需熟悉一下Linux的常用操作與工具(如瀏覽器、文本編輯器),即可在很短的時(shí)間內(nèi)上手,操作習(xí)慣幾乎無(wú)需改變。
而這也為今后用戶在Linux上多機(jī)集群化跑COMSOL打下了省錢的基礎(chǔ)。
二、多機(jī)并行,不同的打開方式?jīng)Q定了運(yùn)算效率 根據(jù)我們的經(jīng)驗(yàn),COMSOL的情況與Fluent類似。
當(dāng)核數(shù)較低時(shí),性能提升與核數(shù)基本成正比;而當(dāng)云端核數(shù)逐漸增加后,由于節(jié)點(diǎn)間通信開銷指數(shù)級(jí)上升,性能的提升會(huì)隨著線程數(shù)增長(zhǎng)逐漸變緩。關(guān)于如何解決節(jié)點(diǎn)之間數(shù)據(jù)交換造成的通信開銷問題,可以參考Fluent和LS-DYNA這兩個(gè)應(yīng)用實(shí)證:
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
下圖可以看到我們推薦用戶使用的網(wǎng)絡(luò)加強(qiáng)型實(shí)例對(duì)比計(jì)算優(yōu)化型實(shí)例的效果。
基于Linux系統(tǒng)多機(jī)模式計(jì)算,在云端使用16-96核不等的計(jì)算資源運(yùn)行兩組COMSOL任務(wù),可以觀察到當(dāng)計(jì)算資源線性增加時(shí),任務(wù)耗時(shí)呈線性減少。
網(wǎng)絡(luò)加強(qiáng)型實(shí)例可以有效解決COMSOL任務(wù)通信開銷問題。
fastone平臺(tái)可以根據(jù)用戶需求和任務(wù)特性,為用戶推薦最適配的云端配置。
甚至,我們的Auto-Scale功能可以根據(jù)不同的用戶策略,比如成本最優(yōu)還是時(shí)間優(yōu)先,自動(dòng)化跨區(qū)、跨類型為用戶調(diào)度云資源,完成計(jì)算任務(wù)。
至于不同策略具體怎么落地執(zhí)行?
相比時(shí)間優(yōu)先策略,成本優(yōu)先怎么做到降低成本最多達(dá)67%-90%?
在這篇實(shí)證《生信云實(shí)證Vol.3:提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子》里體現(xiàn)得十分明顯。
而即便是比拼單機(jī)性能,由于云上機(jī)型更新速度快,相比課題組本地老舊的工作站單機(jī)性能也提升了超過三分之一。
關(guān)于單機(jī)和多機(jī)計(jì)算背后的詳細(xì)原理和意義,可以參考VCS應(yīng)用實(shí)證《EDA云實(shí)證Vol.7:揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事》
云上資源的更新有多快?看這篇《國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手》
三、多人并行又是個(gè)什么東西?
多機(jī)并行有了,多人并行又是個(gè)啥?
如果在本地工作站場(chǎng)景,多人并行就是幾臺(tái)機(jī)器就是幾個(gè)人用唄。使用我們平臺(tái),用戶數(shù)量和機(jī)器數(shù)量不再直接掛鉤。更不用說(shuō)云端無(wú)限資源帶來(lái)的幾乎無(wú)限的人員擴(kuò)容空間了。
這就不可避免地涉及到了權(quán)限和角色管理的問題。fastone平臺(tái)的權(quán)限和角色管理功能,支持管理員角色對(duì)每一個(gè)用戶進(jìn)行相關(guān)權(quán)限設(shè)定,包括預(yù)算使用上限和CPU核數(shù)使用上限。
多機(jī)并行+多人并行,簡(jiǎn)單來(lái)說(shuō)就是,要啥有啥。
四、本地云端統(tǒng)一平臺(tái),既不操心,又不心疼,還劃算,還簡(jiǎn)單
1、當(dāng)然是大大優(yōu)化整體效率。
由于課題組在平臺(tái)上跑的應(yīng)用遠(yuǎn)不止COMSOL一種,fastone平臺(tái)可對(duì)不同應(yīng)用、不同資源、不同成員的使用情況進(jìn)行整體監(jiān)控與評(píng)估,并為課題組提供合理化建議,極大地提升了整體效率。
2、本地工作站不再閑置,用滿不心疼
課題組導(dǎo)師覺得放著本地工作站不用簡(jiǎn)直就是“浪費(fèi)”。在獲取外部資源的同時(shí),還是希望能夠?qū)⒈镜氐墓ぷ髡举Y源給充分利用起來(lái),不然可太心疼了,畢竟當(dāng)年也是花大價(jià)錢買來(lái)的。
我們?yōu)檎n題組提供了一個(gè)混合云平臺(tái)。
當(dāng)用戶處理日常任務(wù)時(shí),可以只在本地運(yùn)行。
而當(dāng)本地資源不足以應(yīng)付時(shí),直接自動(dòng)連接云端海量資源進(jìn)行運(yùn)算,操作相當(dāng)方便,完全不改變用戶的操作習(xí)慣。
3、本地軟硬件資源維護(hù),不用操心
課題組的本地環(huán)境是需要持續(xù)維護(hù)的。有老師跟我們吐槽說(shuō),一天天地忙著維護(hù)環(huán)境,整得跟運(yùn)維工程師一樣了,太耽誤事兒。想找學(xué)生幫忙吧,他們很多也不懂啊~老師們的碩博后們也苦不堪言,本專業(yè)要學(xué)的東西已經(jīng)多到爆炸,又要理論還要搞實(shí)驗(yàn),還要學(xué)大量計(jì)算機(jī)專業(yè)知識(shí)……
我們的云上運(yùn)行環(huán)境都是自動(dòng)化配置的,不需要人工干預(yù),用戶還可以通過平臺(tái)進(jìn)行統(tǒng)一管理和監(jiān)控,方便易操作。
五、超算,是完美的解決方案嗎?
1、超算資源是無(wú)法與本地資源做成一個(gè)整體平臺(tái),統(tǒng)一管理的。所以,既沒有整體監(jiān)控和管理,又沒有混合云,還沒有自動(dòng)化維護(hù)。
當(dāng)然,Auto-scale也肯定沒有。
下圖是開啟Auto-Scale功能后,用戶某項(xiàng)目一周之內(nèi)所調(diào)用云端計(jì)算資源的動(dòng)態(tài)情況。
2、不同于超算的共享模式,我們提供的是絕對(duì)不會(huì)被搶走的獨(dú)占資源。
這點(diǎn)可太重要了:
1)云資源在任何情況下都不用會(huì)被搶走。而超算由于要優(yōu)先服務(wù)國(guó)家級(jí)科研項(xiàng)目,在某些情況下,即便已經(jīng)分配到的超算資源,也有可能會(huì)被無(wú)條件收回;
2)可根據(jù)用戶的習(xí)慣和應(yīng)用的特性自由選擇操作系統(tǒng),沒有任何限制;
3)提供完全開放的管理員權(quán)限,應(yīng)用安裝靈活,且fastone針對(duì)市面上常見企業(yè)級(jí)應(yīng)用均進(jìn)行過云原生優(yōu)化,可隨時(shí)提供技術(shù)指導(dǎo);
4)用戶可隨時(shí)安裝所需的依賴組件。
5)獨(dú)占資源,安全。
關(guān)于超算與云計(jì)算在整體規(guī)模、使用體驗(yàn)、計(jì)費(fèi)方式、商用門檻、更新周期、合作生態(tài)、云端支持等方面的全方位對(duì)比,可以掃碼添加小F獲取完整版白皮書。
實(shí)證小結(jié)
1、fastone平臺(tái)完美支持COMSOL的基于不同用戶策略的多機(jī)和多人并行,可大大提升任務(wù)效率;
2、fastone支持搭建本地云端統(tǒng)一的混合云平臺(tái),完全不浪費(fèi)本地資源,本地資源不足時(shí)自動(dòng)溢出到云端,操作還簡(jiǎn)單,提高整體效率;
3、fastone平臺(tái)提供獨(dú)占資源,絕不會(huì)被搶走,開放管理員權(quán)限,安全靈活;
4、fasonte平臺(tái)環(huán)境完全自動(dòng)化配置,無(wú)需手動(dòng)維護(hù),省事。
本次CAE行業(yè)Cloud HPC實(shí)證系列Vol.11就到這里了。下一期的CAE云實(shí)證中,我們聊Abaqus。
高效、方便、安全、穩(wěn)定、省錢……我們對(duì)于高校科研的提升遠(yuǎn)不止于此,更多有關(guān)fastone高校科研云平臺(tái)的疑問與解答
請(qǐng)掃描二維碼添加小F微信(ID:imfastone)獲取《這一屆科研計(jì)算人趕DDL紅寶書:學(xué)生篇/老師篇》
關(guān)于fastone云平臺(tái)在其他應(yīng)用上的具體表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:
HSPICE │ Bladed │ Vina │ OPC │ Fluent │ Amber │ VCS │ LS-DYNA │ MOE Virtuoso
- END -
我們有個(gè)為應(yīng)用定義的CAE云仿真平臺(tái)
集成多種CAE/CFD應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
這一屆科研計(jì)算人趕DDL紅寶書:學(xué)生篇
楊洋組織的“太空營(yíng)救”中, 那2小時(shí)到底發(fā)生了什么?
速石科技獲元禾璞華領(lǐng)投數(shù)千萬(wàn)美元B輪融資
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
速石科技成三星Foundry國(guó)內(nèi)首家SAFE云合作伙伴
Ansys最新CAE調(diào)研報(bào)告找到阻礙仿真效率提升的“元兇”
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
在《你是我的榮耀》這部劇中,楊洋飾演的男主于途是一個(gè)心懷夢(mèng)想的航天設(shè)計(jì)師。在前往西北衛(wèi)星測(cè)控中心搶救JX-1號(hào)衛(wèi)星的劇情里,涉及到了大量的航天專業(yè)知識(shí)。
當(dāng)中心領(lǐng)導(dǎo)脫口而出:“趕緊做仿真驗(yàn)證”,瞬間觸發(fā)我這顆新生代農(nóng)民工雷達(dá):
開多少核?
要做多久?
要排隊(duì)嗎?
來(lái)得及嗎?
要上云嗎?
……
錯(cuò)了,是這張:
仿真立功!衛(wèi)星拯救大作戰(zhàn)
事情是這樣的:
衛(wèi)星發(fā)射之后,需要時(shí)不時(shí)地給地面發(fā)射信號(hào),報(bào)告自己的狀態(tài)。
但是在某天夜里飛過我國(guó)地面監(jiān)控站范圍的時(shí)候,地面站沒有收到JX-1的信號(hào)。
地面站主動(dòng)聯(lián)絡(luò)了衛(wèi)星,也沒有得到回復(fù)。換句話說(shuō),JX-1失聯(lián)了。
兩位JX總體設(shè)計(jì)師——于途(楊洋)和關(guān)在(潘粵明),被緊急召到西北衛(wèi)星測(cè)控中心處理問題。
衛(wèi)星失聯(lián)有很多原因,會(huì)上一時(shí)也沒討論出個(gè)所以然。
回到酒店后,老潘已經(jīng)累到躺平,楊洋不肯放棄并順利開啟了主角光環(huán),在查閱了相關(guān)資料后,認(rèn)為衛(wèi)星故障可能是太陽(yáng)風(fēng)暴引發(fā)的高能粒子所造成的。
兩人立馬半夜趕回中心繼續(xù)開會(huì)。在中科院空間所確認(rèn)衛(wèi)星故障的時(shí)刻與發(fā)生太陽(yáng)風(fēng)暴的時(shí)間重疊后,中心領(lǐng)導(dǎo)指示相關(guān)人員立刻去做仿真驗(yàn)證,確認(rèn)事故原因。
兩個(gè)半小時(shí)后。仿真結(jié)果出爐:JX-1衛(wèi)星軌道和太陽(yáng)風(fēng)景導(dǎo)致高能電子暴范圍的確是匹配的,可能有粒子打進(jìn)了兩臺(tái)測(cè)控應(yīng)答機(jī)的內(nèi)部,使應(yīng)答機(jī)產(chǎn)生了故障,進(jìn)而影響了整顆衛(wèi)星的通信系統(tǒng)。
故障原因確定了,接下來(lái)就是一系列搶救措施:
1、應(yīng)答機(jī)的接受指令功能使用模擬電路搭的,不受高能粒子影響,盲發(fā)重啟指令重啟衛(wèi)星應(yīng)答機(jī)恢復(fù)通訊;
2、發(fā)現(xiàn)衛(wèi)星耗電過大,關(guān)閉非必要單機(jī)以節(jié)省電源;
3、進(jìn)一步發(fā)現(xiàn)無(wú)法控制衛(wèi)星姿態(tài)和軌道,切換到備份控制器;4、切換成功后調(diào)整姿態(tài),展開太陽(yáng)能充電板對(duì)準(zhǔn)太陽(yáng)定向充電(這一條據(jù)說(shuō)是BUG)。
衛(wèi)星滿血復(fù)活,撒花。
從69天的太空營(yíng)救到“數(shù)字太空”
現(xiàn)在的西安衛(wèi)星測(cè)控中心,有一套我國(guó)研發(fā)的 “數(shù)字衛(wèi)星”系統(tǒng)。系統(tǒng)中,太陽(yáng)能帆板、推進(jìn)器、應(yīng)答機(jī),甚至是一顆小小的螺絲釘,都能通過可視化、數(shù)字化的方式模擬仿真出來(lái)。
這套系統(tǒng)的研發(fā),就是因?yàn)?strong>15年前的一次“太空營(yíng)救“。
我國(guó)某顆遙感衛(wèi)星突發(fā)故障,在太空中急速翻滾,與地面的聯(lián)系時(shí)斷時(shí)續(xù)。出事的衛(wèi)星遠(yuǎn)在太空,看不見摸不著,只有海量的、碎片化的遙測(cè)數(shù)據(jù)。
前一天完成的數(shù)學(xué)模型,第二天就會(huì)發(fā)現(xiàn)完全錯(cuò)亂。
西安衛(wèi)星測(cè)控中心的技術(shù)團(tuán)隊(duì)通過整理收集海量衛(wèi)星平臺(tái)、遙測(cè)數(shù)據(jù),以及多年搶救衛(wèi)生的實(shí)際案例,在計(jì)算機(jī)中大量模擬仿真復(fù)現(xiàn)了衛(wèi)星上的故障,并進(jìn)行了針對(duì)性修復(fù)。
經(jīng)過整整69天的“太空營(yíng)救”,順利讓衛(wèi)星“起死回生”。
從此,開啟了“數(shù)字衛(wèi)星”系統(tǒng)的研發(fā)。
現(xiàn)在,我們的視野已經(jīng)從小小的衛(wèi)星拓展到了整個(gè)宇宙空間,通過研究大規(guī)模實(shí)體仿真推演計(jì)算框架,構(gòu)建衛(wèi)星、測(cè)控站、望遠(yuǎn)鏡和雷達(dá)等實(shí)體數(shù)字模型,通過系統(tǒng)集成形成“數(shù)字太空”系統(tǒng)。
仿真不總是扮演航天“救火隊(duì)長(zhǎng)”的角色
2019年12月27日,“實(shí)踐二十號(hào)”衛(wèi)星在中國(guó)文昌航天發(fā)射場(chǎng)搭載長(zhǎng)征五號(hào)遙三火箭升空。
衛(wèi)星發(fā)射前,西安衛(wèi)星測(cè)控中心的工程師們便通過多種最優(yōu)化方法,仿真計(jì)算了火箭將衛(wèi)星送到不同遠(yuǎn)地點(diǎn)高度下的10余份方案預(yù)案。
衛(wèi)星上天之后,他們還要通過仿真計(jì)算出在衛(wèi)星當(dāng)前的軌道狀態(tài)下,怎樣才是最節(jié)省燃料的變軌策略,確保衛(wèi)星準(zhǔn)確完成變軌,并盡可能延長(zhǎng)衛(wèi)星的工作壽命。
針對(duì)日益增多的空間物體,在軌衛(wèi)星在進(jìn)行變軌機(jī)動(dòng)時(shí),需對(duì)大量空間物體進(jìn)行高精度的軌道預(yù)報(bào)計(jì)算,以預(yù)防在軌航天器與其他空間天體的碰撞。
而在今年發(fā)射的“天問一號(hào)”火星探測(cè)器的背后,也有著仿真的貢獻(xiàn)。
在“天問一號(hào)”升空、下降和行星表面巡視等階段,航天器外部溫度、氣壓、風(fēng)速等參數(shù)的復(fù)雜變化,對(duì)航天器壁面壓力的承受能力、不同位置表面壓力分布狀況的精確計(jì)算等提出了很大挑戰(zhàn),甚至?xí)?duì)航天器內(nèi)部?jī)x器的正常運(yùn)轉(zhuǎn)產(chǎn)生不利影響。
為什么要仿真,做實(shí)驗(yàn)它不香嗎?
實(shí)驗(yàn)和仿真是認(rèn)知世界的兩種方式。
仿真是建立在一定的數(shù)理模型基礎(chǔ)上,是把現(xiàn)實(shí)的空間和時(shí)間分割成很小很小的單元,然后在這些很小的單元里,一次次反復(fù)求解線性關(guān)系。
而實(shí)驗(yàn)永遠(yuǎn)不可能做到對(duì)現(xiàn)實(shí)百分之一百地模擬。尤其是航天仿真,太空離我們實(shí)在過于遙遠(yuǎn),看不見摸不著。
在兼顧成本和可行性的前提下,仿真就成了很好的認(rèn)知世界的方式。
現(xiàn)在通過仿真,我們可以做很多事情:
我們可以對(duì)宇宙進(jìn)行建模,對(duì)宇宙進(jìn)行觀測(cè),了解宇宙的加速膨脹;
我們可以模擬地球周圍的磁流體動(dòng)力學(xué),根據(jù)太陽(yáng)風(fēng)預(yù)測(cè)行星側(cè)擾動(dòng)。
我們正在接近人類進(jìn)行太空旅行和太空探索的另一個(gè)黃金時(shí)代。
下一步征程,是太陽(yáng)
我國(guó)在太陽(yáng)探測(cè)衛(wèi)星方面一直缺席,第一顆綜合性太陽(yáng)探測(cè)衛(wèi)星——先進(jìn)天基太陽(yáng)天文臺(tái)(ASO-S)預(yù)計(jì)于2022年發(fā)射,其設(shè)計(jì)目標(biāo)是揭示太陽(yáng)磁場(chǎng)、太陽(yáng)耀斑和日冕物質(zhì)拋射的形成與相互關(guān)系。
在夸父追日、后羿射日、金烏負(fù)日等古代神話傳說(shuō)之后,科技的發(fā)展讓我們終于有機(jī)會(huì)看到更加真切的太陽(yáng)。
半個(gè)多世紀(jì)來(lái),仿真技術(shù)支持著人類航天事業(yè),從繞地軌道到月球,到火星,到冥王星,再到無(wú)限遙遠(yuǎn)的深空。
我們已經(jīng)造出了見過最多星星的兔子。
千百年來(lái)眺望的星空,正等待我們前往探索。
就像劇里說(shuō)的——
在茫茫宇宙中
尋找地球和人類起源的真相
在無(wú)窮無(wú)盡中
尋找另一個(gè)神跡存在的可能
證明人類不孤單
- END -
我們有個(gè)CAE云仿真平臺(tái)
集成多種CAE/CFD應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多電子書歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
速石科技獲元禾璞華領(lǐng)投數(shù)千萬(wàn)美元B輪融資
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
AI太笨了……暫時(shí)
速石科技成三星Foundry國(guó)內(nèi)首家SAFE云合作伙伴
Ansys最新CAE調(diào)研報(bào)告找到阻礙仿真效率提升的“元兇”,竟然是Ta……
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書
EDA云平臺(tái)49問
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
疲勞分析是設(shè)計(jì)和優(yōu)化需要高耐用性和可靠性的產(chǎn)品的關(guān)鍵步驟。疲勞失效分析有助于識(shí)別故障點(diǎn),防止產(chǎn)品故障、召回甚至災(zāi)難性事件。通過仿真預(yù)期的零件載荷,工程師可以優(yōu)化其設(shè)計(jì)的抗疲勞性、可靠性和性能。
疲勞是材料中在承受循環(huán)載荷時(shí)發(fā)生的失效機(jī)制。在疲勞失效中,即使施加的應(yīng)力低于屈服應(yīng)力或單次施加載荷損壞材料所需的應(yīng)力,在重復(fù)載荷下也會(huì)在材料中形成裂紋。
構(gòu)件的疲勞是個(gè)復(fù)雜的過程,受多種因素的影響,要精確地預(yù)估構(gòu)件的疲勞壽命,需要選擇合適的模型,這就需要宏觀力學(xué)方面的研究,包括疲勞裂紋發(fā)送、發(fā)展直至破壞的機(jī)理,還需要微觀力學(xué)方面的研究包括位錯(cuò)理論等。此外,還涉及到金屬材料科學(xué)、材料力學(xué)、振動(dòng)力學(xué)、疲勞理論、斷裂力學(xué)和計(jì)算方法多門學(xué)科。只有更深刻地認(rèn)識(shí)了疲勞破壞的機(jī)理,將宏觀和微觀研究結(jié)合起來(lái),才能更精確地預(yù)測(cè)壽命。
疲勞主要有兩種類型:
疲勞失效是由于載荷的循環(huán)性質(zhì)而發(fā)生的漸進(jìn)過程。這會(huì)導(dǎo)致材料中的微觀缺陷逐漸長(zhǎng)成宏觀裂縫。從那里開始,疲勞遵循三個(gè)連續(xù)的階段,最終導(dǎo)致骨折:
疲勞分析涉及幾種方法,最突出的是:
應(yīng)力壽命方法涉及根據(jù)失效周期數(shù)繪制施加的應(yīng)力水平。當(dāng)預(yù)期應(yīng)力不超過材料的彈性極限(屈服點(diǎn))時(shí),應(yīng)力-壽命法用于高周疲勞。
因此,應(yīng)力壽命法可以通過線性材料模型有限元分析仿真來(lái)支持,以預(yù)測(cè)預(yù)期應(yīng)力。
應(yīng)變-壽命法繪制應(yīng)變幅度與失效周期數(shù)的關(guān)系圖。當(dāng)某些應(yīng)力超過材料的彈性極限(屈服點(diǎn))時(shí),它用于低周疲勞。
因此,應(yīng)變-壽命方法需要非線性彈塑性材料模型有限元分析仿真來(lái)預(yù)測(cè)預(yù)期應(yīng)力。
使用LEFM方法預(yù)測(cè)疲勞裂紋擴(kuò)展長(zhǎng)度。它精確計(jì)算脆性材料的斷裂應(yīng)力,其中裂紋缺口處的應(yīng)力場(chǎng)是彈性的。但是,它沒有考慮凹口處延展性材料中發(fā)生的塑性流動(dòng)。它需要進(jìn)一步修改以解釋塑性區(qū)斷裂。這被稱為歐文的斷裂理論,改編自格里菲斯準(zhǔn)則,據(jù)說(shuō)是彈塑性斷裂力學(xué)的基礎(chǔ)。
目前市場(chǎng)上主流的仿真分析軟件較多,可以實(shí)現(xiàn)疲勞分析的軟件也較多,如SIMULIA的FE-Safe、ANSYS nCode DesignLife、MSC Fatigue、MSC Nastran及HyperLife、Simulation等,其中FE-Safe、ANSYS nCode DesignLife兩款軟件應(yīng)用較為廣泛。Fe-safe采用世界上最先進(jìn)的疲勞分析技術(shù),是一款擁有豐富疲勞損傷算法、擁有更全面的材料庫(kù),并且操作簡(jiǎn)便的耐久性疲勞分析軟件。由于Fe-safe疲勞算法基于海量的工程實(shí)踐,另外,客戶的反饋也表明,F(xiàn)e-safe可以給出準(zhǔn)確的疲勞點(diǎn)和疲勞壽命預(yù)測(cè)。MSC Fatigue是一款功能較為全面的疲勞設(shè)計(jì)軟件,在分析領(lǐng)域也廣泛應(yīng)用
平均應(yīng)力校正是影響疲勞分析的另一個(gè)因素。它考慮了可變載荷條件對(duì)材料疲勞的影響。平均應(yīng)力校正因子用于調(diào)整驅(qū)動(dòng)力或 S-N 曲線,該曲線將應(yīng)力幅度與失效周期數(shù)相關(guān)聯(lián)。
平均應(yīng)力校正因子的準(zhǔn)確性會(huì)顯著影響設(shè)計(jì)的疲勞壽命預(yù)測(cè),因此使用可靠、準(zhǔn)確的仿真和疲勞分析軟件非常重要。在許多情況下,用于設(shè)計(jì)的S-N曲線假設(shè)疲勞壽命的最壞情況,無(wú)需使用平均應(yīng)力校正因子。
疲勞測(cè)試是疲勞分析的重要組成部分。它涉及對(duì)材料或結(jié)構(gòu)進(jìn)行循環(huán)載荷并測(cè)量由此產(chǎn)生的疲勞損傷。了解材料和結(jié)構(gòu)疲勞特性和行為對(duì)于剩余壽命評(píng)估和斷裂力學(xué)分析至關(guān)重要。
為了使用這些方法中的任何一種準(zhǔn)確預(yù)測(cè)組件的疲勞壽命,首先需要預(yù)測(cè)預(yù)期的最小應(yīng)力、平均應(yīng)力、最大應(yīng)力、應(yīng)力幅度、應(yīng)力范圍和相關(guān)性。這就是仿真,特別是FEA結(jié)構(gòu)仿真可以提供幫助的地方。
通過模擬具有正確材料屬性的組件的預(yù)期載荷,可以假設(shè)疲勞分析的應(yīng)力應(yīng)該是多少。您可以將馮米塞斯等效應(yīng)力或主應(yīng)力作為疲勞分析的輸入。
速石CAE仿真平臺(tái)的主要優(yōu)勢(shì)之一是能夠快速輕松地仿真您的設(shè)計(jì),同時(shí)準(zhǔn)確捕獲設(shè)計(jì)細(xì)節(jié)。
這使您能夠模擬真實(shí)的加載和邊界條件,并準(zhǔn)確預(yù)測(cè)產(chǎn)品在負(fù)載下的行為。借助 速石CAE云平臺(tái),您可以輕松迭代和優(yōu)化產(chǎn)品設(shè)計(jì),以提高其耐用性、可靠性和整體性能,而無(wú)需專業(yè)硬件或昂貴的軟件。
根據(jù)仿真獲得的平均應(yīng)力值,可以使用諸如Gerber,Goodman和Soderberg之類的關(guān)系,這些關(guān)系將平均應(yīng)力幅度與疲勞壽命相關(guān)聯(lián),也稱為恒定壽命圖。下圖提供了恒定壽命圖的示例。
總之,疲勞分析和仿真是產(chǎn)品設(shè)計(jì)和工程中的關(guān)鍵步驟,可以幫助您了解和預(yù)測(cè)由循環(huán)載荷引起的材料和結(jié)構(gòu)失效。通過使用應(yīng)力-壽命和應(yīng)變-壽命等方法,并考慮平均應(yīng)力校正、耐久性極限、疲勞裂紋擴(kuò)展和概率疲勞分析等因素,您可以確保產(chǎn)品的耐用性和可靠性。立即聯(lián)系速石科技,詳細(xì)了解它如何幫助您優(yōu)化產(chǎn)品設(shè)計(jì)。
END -
我們有個(gè)CAE仿真研發(fā)云平臺(tái)
集成多種CAE/CFD應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫(kù)+全流程自動(dòng)化,3.5小時(shí)完成20萬(wàn)分子對(duì)接
這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
研發(fā)/IT工程師雙視角測(cè)評(píng)8大仿真平臺(tái),結(jié)果
八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(cè)(上)
2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀
當(dāng)仿真外包成為過氣網(wǎng)紅后…
和28家業(yè)界大佬排排坐是一種怎樣的體驗(yàn)?
這一屆科研計(jì)算人趕DDL紅寶書:學(xué)生篇
楊洋組織的“太空營(yíng)救”中, 那2小時(shí)到底發(fā)生了什么?
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
Ansys最新CAE調(diào)研報(bào)告找到阻礙仿真效率提升的“元兇”
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
調(diào)研委托Peerless Research Group進(jìn)行,包括仿真研發(fā)和設(shè)計(jì)工程師、工程經(jīng)理、IT經(jīng)理和高管,一共747人。
老規(guī)矩,先看幾個(gè)重要結(jié)論——
縮短設(shè)計(jì)周期是一半以上用戶在工作中面臨的最大挑戰(zhàn);
超過五分之一的人表示,他們最重要、最頻繁的仿真必須通宵運(yùn)行至少9至48個(gè)小時(shí)以上(2014年為近四分之一);
由于周轉(zhuǎn)時(shí)間的限制,大約三分之一的人降低了幾乎所有模型的大小或精確度;
使用云資源的人越來(lái)越多。超過四分之一的受訪者表示,使用云解決方案可以減少模擬的周轉(zhuǎn)時(shí)間限制,高于2014年的12%;
企業(yè)已經(jīng)從以工作站為中心的工作流轉(zhuǎn)變?yōu)槔貌块T集群、云資源、移動(dòng)設(shè)備和傳統(tǒng)工作站的混合;
有18%的受訪者正在使用云進(jìn)行工程仿真,另有18%的人計(jì)劃在未來(lái)12個(gè)月內(nèi)使用云;
使用128個(gè)以上CPU核計(jì)算資源的用戶比例是6年前的3倍。
以下是我們節(jié)選并整理的報(bào)告原文,完整報(bào)告可以掃描二維碼聯(lián)系小F獲取。
報(bào)告指出工程師正在面臨越來(lái)越大的壓力,要求他們更快地完成更好的設(shè)計(jì)。
52%的人表示在工程設(shè)計(jì)中所面臨的最大業(yè)務(wù)挑戰(zhàn)是如何縮短設(shè)計(jì)周期,其次才是對(duì)質(zhì)量和創(chuàng)新的要求。
設(shè)計(jì)周期究竟冗長(zhǎng)到了什么地步?
報(bào)告顯示,21%的工程師經(jīng)常有需要連續(xù)通宵執(zhí)行9至48個(gè)小時(shí)以上的仿真任務(wù)。
在中型公司(100-999人)這一比例甚至達(dá)到了25%。
如何才能把需要數(shù)天的超大規(guī)模仿真任務(wù)壓縮到短短幾小時(shí)之內(nèi):《從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?》
為了完成這些“超長(zhǎng)待機(jī)”的仿真任務(wù),工程師必須要獲取大量的計(jì)算資源。
在2014年的報(bào)告中,只有10%的人使用超過32個(gè)以上的內(nèi)核,僅僅3%的受訪者使用了128個(gè)以上的內(nèi)核。
如今,使用多核資源運(yùn)算仿真任務(wù)的用戶比例大幅增長(zhǎng)。有44%的用戶使用了12個(gè)以上的內(nèi)核并行處理其最大的仿真應(yīng)用程序,18%的用戶使用的內(nèi)核數(shù)量超過36個(gè),9%的人使用超過132個(gè)內(nèi)核。
預(yù)計(jì)今后使用更多內(nèi)核的用戶比例將繼續(xù)增長(zhǎng)。25%的受訪者希望在未來(lái)的12個(gè)月內(nèi)能夠使用36個(gè)以上的內(nèi)核來(lái)運(yùn)行仿真任務(wù),13%的受訪者則希望擁有132核以上的仿真資源。
2020年,世界上絕大多數(shù)的主要經(jīng)濟(jì)體都出現(xiàn)了一定程度的經(jīng)濟(jì)下行,許多企業(yè)也在精打細(xì)算過日子,不少項(xiàng)目甚至被整個(gè)砍掉。
但當(dāng)被問未來(lái)仿真解決方案的預(yù)算會(huì)增加還是減少時(shí),31%的人表示在未來(lái)12個(gè)月會(huì)增加更多的預(yù)算,35%的人表示保持不變,只有9%的人會(huì)減少預(yù)算。
“這凸顯了HPC資源在工程仿真方面的重要性,” Ansys戰(zhàn)略合作伙伴關(guān)系總監(jiān)Wim Slagter說(shuō),“盡管全球范圍內(nèi)的新冠大流行引發(fā)了經(jīng)濟(jì)動(dòng)蕩,但只有9%的受訪者表示將減少使用HPC仿真預(yù)算。顯然,很多工程組織都看到了這項(xiàng)技術(shù)在提升生產(chǎn)率方面的價(jià)值。”
在整個(gè)設(shè)計(jì)周期中更高頻地運(yùn)行仿真的能力是一項(xiàng)至關(guān)重要的競(jìng)爭(zhēng)優(yōu)勢(shì)。
更快,更高頻,更準(zhǔn)確的仿真可以加快產(chǎn)品上市時(shí)間,并帶來(lái)更好的產(chǎn)品。但是,受現(xiàn)有資源的限制,許多公司無(wú)法充分利用仿真的潛力。
當(dāng)前工程仿真的主要矛盾已經(jīng)轉(zhuǎn)化為工程師日益增長(zhǎng)的算力需求同企業(yè)落后的計(jì)算資源之間的矛盾。計(jì)算資源的限制導(dǎo)致許多工程師無(wú)法充分發(fā)揮仿真應(yīng)用的潛力。
在各種規(guī)模的企業(yè)中,缺乏計(jì)算資源是常態(tài)。
33%的受訪者因?yàn)榭偸桥挪坏劫Y源而不得不對(duì)仿真模型的細(xì)節(jié)大小和數(shù)量進(jìn)行限制,另有42%的受訪者有超過一半的概率會(huì)遇到這種糟心事,只有25%的受訪者表示幾乎不存在這種困擾。
對(duì)仿真模型細(xì)節(jié)大小和數(shù)量的限制嚴(yán)重影響了結(jié)果的質(zhì)量。
有20%的受訪者報(bào)告說(shuō)他們總是因?yàn)榉抡婕?xì)節(jié)的大小和數(shù)量受限而導(dǎo)致低保真結(jié)果,52%的受訪者表示這種情況發(fā)生的概率超過一半。
新冠疫情的蔓延讓全球很多企業(yè)都迅速改變了工作模式和策略。
面對(duì)疫情的影響,51%的受訪者認(rèn)為最需要優(yōu)先解決的事情是提高IT運(yùn)營(yíng)效率,從而更好地利用硬件和軟件資源;48%的受訪者則認(rèn)為需要優(yōu)先考慮采用遠(yuǎn)程協(xié)作和數(shù)據(jù)管理工具來(lái)應(yīng)對(duì)新冠疫情帶來(lái)的變化。
47%的使用者認(rèn)為公司設(shè)計(jì)團(tuán)隊(duì)及IT支持團(tuán)隊(duì)缺乏相應(yīng)的能力,導(dǎo)致他們難以更大規(guī)模地使用仿真工具,提升仿真效率。
44%的受訪者表示他們?nèi)狈δ苁褂孟鄳?yīng)仿真技術(shù)的IT硬件和支持性基礎(chǔ)架構(gòu)。
30%的人認(rèn)為公司并不重視對(duì)仿真技術(shù)和數(shù)字原型的使用。
6年來(lái),典型的工業(yè)仿真計(jì)算場(chǎng)景已經(jīng)從單個(gè)工作站這種單機(jī)模式逐漸演變?yōu)榘ぷ髡尽⒐P記本、集群和云端的復(fù)雜混合環(huán)境。
當(dāng)被問及公司通常在什么環(huán)境下運(yùn)行仿真應(yīng)用時(shí),有43%的受訪者表示他們僅在臺(tái)式工作站或筆記本上跑任務(wù)。
雖然這一數(shù)據(jù)相比2014年的63%有著顯著的下降,但從公司規(guī)模分析,IT能力更強(qiáng)的大公司比例為34%,而IT能力相對(duì)更弱的中小公司比例為50%。
從單機(jī)到集群
從集群到云端,包括純?cè)啤⒒旌显?/strong>
再到多云、跨不同地域的協(xié)同管理
每一步對(duì)企業(yè)的傳統(tǒng)IT管理和運(yùn)營(yíng)工作都是重大挑戰(zhàn)。
在這個(gè)實(shí)證中,我們沒有給用戶增添任何新計(jì)算資源,僅通過IT層面的優(yōu)化就讓用戶運(yùn)算20000個(gè)VCS任務(wù)的效率提升了50倍:《EDA云實(shí)證Vol.7:揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事》
更重要的是,怎么才能減少仿真設(shè)計(jì)工程師的IT負(fù)擔(dān),讓他們能專注于設(shè)計(jì)本身。
讓那些需要人工低效做的事,自動(dòng)化高效處理。
把一堆需要寫的代碼,變成圖形化操作界面。
用筆記本也能跑大規(guī)模的任務(wù)。
fastone平臺(tái)讓用戶可以不改變使用習(xí)慣,自動(dòng)化地完成工作:
直接通過圖形界面提交任務(wù)《怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?》
使用DM工具簡(jiǎn)單高效進(jìn)行數(shù)據(jù)傳輸《LS-DYNA求解效率深度測(cè)評(píng)│六種規(guī)模,本地VS云端5種不同硬件配置》
與6年前相比,升級(jí)和替換計(jì)算硬件仍然是提高仿真性能的最重要的策略之一。
將近一半(48%)的受訪者傾向于升級(jí)現(xiàn)有硬件,而43%的受訪者更喜歡直接購(gòu)買新設(shè)備。
36%的受訪者希望公司能夠購(gòu)買更多的許可證,這樣他們就可以用更多的計(jì)算資源來(lái)跑仿真任務(wù)。
超過四分之一(28%)的受訪者表示會(huì)通過上云來(lái)提升仿真性能,這一比例在6年前只有12%,提升幅度最大。
上云已經(jīng)成為加快仿真效率的一個(gè)重要解決方案。
上云有哪些好處?
56%的受訪者認(rèn)為是協(xié)同與監(jiān)控能力。
53%的人認(rèn)為云端短時(shí)間內(nèi)能夠獲取計(jì)算資源的能力非常突出。
我們調(diào)度了十萬(wàn)核CPU,幫助用戶將原本預(yù)估數(shù)年的超大型任務(wù)壓縮到了一天以內(nèi):《提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子》
關(guān)于fastone云平臺(tái)在其他應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:HSPICE │ Bladed │ Vina │ OPC │ Fluent │ Amber │ VCS │ LS-DYNA
我們有個(gè)為應(yīng)用定義的計(jì)算云平臺(tái)——
集成多種應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
- END -
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
2小時(shí),賬單47萬(wàn)!「Milkie Way公司破產(chǎn)未遂事件」復(fù)盤分析
高情商:人類世界模擬器是真的!低情商:你是假的……
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書
EDA云平臺(tái)49問
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
在風(fēng)力發(fā)電機(jī)組的各個(gè)設(shè)計(jì)階段,優(yōu)化設(shè)計(jì)都是重中之重。如果不能正確地對(duì)載荷、惡劣環(huán)境和結(jié)構(gòu)完整性進(jìn)行建模,或不能執(zhí)行準(zhǔn)確試驗(yàn),都可能會(huì)極大地危害機(jī)組長(zhǎng)期的安全性、功能性和盈利能力。
風(fēng)力機(jī)設(shè)計(jì)項(xiàng)目經(jīng)常需要進(jìn)行大量仿真計(jì)算,一組仿真計(jì)算耗費(fèi)數(shù)千小時(shí)的計(jì)算機(jī)時(shí)。
一方面,算力在總量和項(xiàng)目波峰波谷期的彈性供應(yīng)上能否滿足需求。充足的算力意味著縮短產(chǎn)品上市時(shí)間,拉大市場(chǎng)優(yōu)勢(shì)。
另一方面,超大規(guī)模算力的調(diào)度使用和企業(yè)場(chǎng)景的復(fù)雜性帶來(lái)的管理等問題對(duì)IT自動(dòng)化和智能化要求很高。如何調(diào)度超大規(guī)模集群的過程,還有其中隱藏的成本優(yōu)化問題,其實(shí)很多。
怎么解決這些問題?
我們拿實(shí)證說(shuō)話。
某風(fēng)電新能源集團(tuán)建設(shè)有本地機(jī)房,但機(jī)器較陳舊,資源有限。跑Bladed仿真任務(wù)計(jì)算周期長(zhǎng),特別是有大型仿真任務(wù)時(shí),往往需要數(shù)周甚至數(shù)月才能出結(jié)果。
用戶要求將跑大型任務(wù)的時(shí)間縮短到一天以內(nèi),同時(shí)能夠?qū)θ蝿?wù)進(jìn)行管理和監(jiān)控。
1. Bladed任務(wù)能否在云端有效運(yùn)行?
2. fastone平臺(tái)能否將大規(guī)模Bladed仿真任務(wù)周期縮短到一天?
3. fastone平臺(tái)能否提供高效靈活的數(shù)據(jù)傳輸方案?
4. fastone平臺(tái)能否提供有效的任務(wù)管理和監(jiān)控?
平臺(tái):
fastone企業(yè)版產(chǎn)品
應(yīng)用:
Bladed 4.10版
操作系統(tǒng):
Bladed 4.10之前的版本不支持Linux系統(tǒng),只支持Windows。
本次實(shí)證由于用戶更熟悉Windows操作系統(tǒng),所以并未選擇Linux鏡像。
主流云廠商對(duì)不同操作系統(tǒng)鏡像有不同的定價(jià)方式。整體上來(lái)說(shuō),通過Windows系統(tǒng)使用云資源價(jià)格比Linux系統(tǒng)要貴。
適用場(chǎng)景:
構(gòu)建風(fēng)力發(fā)電機(jī)性能模型,運(yùn)行仿真計(jì)算并處理結(jié)果,為工程師提供有關(guān)風(fēng)力機(jī)動(dòng)力學(xué)和優(yōu)化的重要決策信息。
License配置:
Bladed License Server設(shè)置在云端。
云端硬件配置:
Bladed是一個(gè)計(jì)算密集型應(yīng)用,對(duì)CPU要求高、內(nèi)存要求不大,因此平臺(tái)為用戶推薦選擇了滿足其應(yīng)用特點(diǎn)的計(jì)算優(yōu)化型實(shí)例機(jī)型。
調(diào)度器:
因?yàn)檫x擇了Windows操作系統(tǒng),所以本實(shí)證中集群調(diào)度使用的是PBS調(diào)度器。
技術(shù)架構(gòu)圖:
用戶通過Web方式登錄構(gòu)建于公有云上的fastone算力運(yùn)營(yíng)平臺(tái),根據(jù)實(shí)際計(jì)算需求自動(dòng)創(chuàng)建、銷毀集群,提交計(jì)算任務(wù),上傳下載任務(wù),監(jiān)控管理。
用戶通過NAT方式訪問位于公網(wǎng)的License服務(wù)器。
用戶通過VPN接入,可更安全地訪問云上私密的HPC環(huán)境。
9600個(gè)用例
----------------------------------------------------
本地VS云端300核
結(jié)論:
1. 云端可提供滿足Bladed應(yīng)用特點(diǎn)的機(jī)型,運(yùn)行Bladed Windows版本的任務(wù);
2. 本地資源運(yùn)算9600個(gè)用例,耗時(shí)約4天;通過fastone平臺(tái)調(diào)用300核計(jì)算優(yōu)化型實(shí)例運(yùn)算9600個(gè)用例,總耗時(shí)約8小時(shí),任務(wù)運(yùn)行時(shí)間7小時(shí);
3. fastone平臺(tái)的自動(dòng)化伸縮,有效降低整個(gè)計(jì)算周期資源占用率;
4. fastone平臺(tái)能提供靈活高效的數(shù)據(jù)傳輸方案,滿足計(jì)算數(shù)據(jù)量大需求;
5. fastone平臺(tái)可穩(wěn)定運(yùn)行Bladed任務(wù)、測(cè)試過程中未發(fā)生服務(wù)中斷;
6. fastone平臺(tái)可監(jiān)控、管理任務(wù)與集群的運(yùn)行情況。
實(shí)證過程:
數(shù)據(jù)傳輸優(yōu)化:
Bladed的風(fēng)文件和任務(wù)文件數(shù)據(jù)量極大,傳統(tǒng)傳輸模式往往會(huì)面臨以下問題:
1、初始化大文件傳輸。在本實(shí)證中,用戶在跑任務(wù)之前需要上傳多達(dá)數(shù)百GiB的風(fēng)文件;
2、隨著任務(wù)的調(diào)整,有大量小文件需要增量上傳。在本實(shí)證中,用戶需要上傳9600個(gè)任務(wù)文件,每個(gè)幾十MiB不等。
fastone支持全自動(dòng)化數(shù)據(jù)上傳,可充分利用帶寬,幫助用戶快速上傳、下載海量數(shù)據(jù)。同時(shí),利用fastone自主研發(fā)的分段上傳、高并發(fā)、斷點(diǎn)續(xù)傳等數(shù)據(jù)傳輸技術(shù),優(yōu)化海量數(shù)據(jù)的傳輸效率。
自動(dòng)化部署:
在手動(dòng)模式下,通常都是先構(gòu)建一個(gè)固定規(guī)模的集群,然后提交任務(wù),全部任務(wù)結(jié)束后,關(guān)閉集群。在本實(shí)證中,如果是手動(dòng)部署,300核的集群一旦拉起,第一到第五步手動(dòng)配置的時(shí)間里,所有機(jī)器一直都是開啟狀態(tài),也就是說(shuō),燒錢中。
更詳盡的涉云成本計(jì)算,可參考:幫助CXO解惑上云成本的迷思,看這篇就夠了
再看看我們的自動(dòng)化部署:
在本實(shí)證中,fastone平臺(tái)在任務(wù)的不同階段采取不同的策略應(yīng)對(duì),除任務(wù)運(yùn)行的7小時(shí)內(nèi)有300核云資源滿負(fù)荷運(yùn)作以外,在數(shù)據(jù)處理和結(jié)果數(shù)據(jù)上傳階段均只開啟了1-2臺(tái)機(jī)器,而其他準(zhǔn)備過程不需要開啟機(jī)器。
很重要的一點(diǎn)是:任務(wù)完成后會(huì)及時(shí)下載結(jié)果并自動(dòng)關(guān)機(jī)。
fastone的Auto-Scale功能可以自動(dòng)監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動(dòng)態(tài)按需地開啟所需算力資源,在提升效率的同時(shí)有效降低成本。
用戶可根據(jù)自己需求,設(shè)置自動(dòng)化調(diào)度集群規(guī)模上下限。
詳細(xì)分解手動(dòng)模式 VS 自動(dòng)部署,看這里:EDA云實(shí)證Vol.1:從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
任務(wù)和集群管理:
提交任務(wù)后,可以在監(jiān)控界面中查看任務(wù)和集群運(yùn)行情況。
9600個(gè)用例
---------------------------------------------------------
云端300核 VS 3000核
Bladed應(yīng)用具備線性擴(kuò)展性。
當(dāng)我們把自動(dòng)化調(diào)度集群規(guī)模上限設(shè)為3000核,任務(wù)運(yùn)行時(shí)間從7小時(shí)縮短到45分鐘,整體計(jì)算周期也從8小時(shí)縮短至1.75小時(shí)。
實(shí)證過程:
本實(shí)證中,單個(gè)任務(wù)運(yùn)行時(shí)間為10-30分鐘,當(dāng)有任務(wù)提前運(yùn)行完成且數(shù)據(jù)下載完后,相應(yīng)的機(jī)器會(huì)自動(dòng)關(guān)閉,避免資源浪費(fèi)。
最后我們回顧一下實(shí)證目標(biāo):
1. Bladed Windows版本任務(wù)在云端能夠有效運(yùn)行;
2. fastone平臺(tái)成功將大規(guī)模Bladed仿真任務(wù)的運(yùn)算時(shí)間從4天縮短到1~7小時(shí);
3. fastone平臺(tái)能夠提供靈活高效的數(shù)據(jù)傳輸方案;
4. fastone平臺(tái)能夠提供可靠的任務(wù)管理和監(jiān)控。
除了Windows系統(tǒng),我們還支持通過fastone平臺(tái)同時(shí)調(diào)度任務(wù)至本地和云上的Windows節(jié)點(diǎn)和Linux節(jié)點(diǎn),滿足業(yè)務(wù)需求。同時(shí),我們也支持SLURM/SGE/LSF等主流調(diào)度器,本次實(shí)證未曾涉及。
本次CAE行業(yè)Cloud HPC實(shí)證系列Vol.2就到這里了。
在下一期的實(shí)證中,我們將利用速石平臺(tái),在混合云場(chǎng)景下調(diào)度集群運(yùn)行CAE分析,使LS-DYNA模擬性能得到極大提升。
未來(lái)我們還會(huì)帶給大家更多領(lǐng)域的用云“真香”實(shí)證,請(qǐng)保持關(guān)注哦!
- END -
2分鐘自動(dòng)開通,即刻獲得TOP500超級(jí)算力
點(diǎn)擊下圖立即體驗(yàn)
2020年新版《六大云廠商資源價(jià)格對(duì)比工具包》
添加小F微信(ID: imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC領(lǐng)域年均復(fù)合增長(zhǎng)率超21%
EDA云實(shí)證Vol.1:從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
15小時(shí)虛擬篩選10億分子,《Nature》+HMS驗(yàn)證云端新藥研發(fā)未來(lái)
關(guān)于云端高性能計(jì)算平臺(tái):
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
靈魂畫師,在線科普多云平臺(tái)/CMP云管平臺(tái)/中間件/虛擬化/容器是個(gè)啥
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500