東方物探是業內耳熟能詳的專業“找油”公司,近年來,承擔國內外的內外陸地、淺海地震勘探,及綜合物化探采集、處理、解釋的數個重大項目。即便如此,東方物探依然在提高自身相關技術上下狠功夫,大量投入資金購置計算機軟、硬件設備,以確保高效、安全地交付工程任務。在總工程師賴能和的眼里,如何用好這些軟硬件并提高其性能,成為他工作的重中之重。
日前,記者采訪了賴能和先生。他表示,在英特爾的協助下,進行必要的合理配置軟硬件,就能實現整體系統負載平衡。東方物探目前擁有5.8萬個核,運算能力達到528萬億次/秒(528T),存儲達8000個T。在2011年一共引進的2498個CPU中,90%來自英特爾。
合理配置
實現HPC平衡負載
據賴能和介紹,對于一臺高性能計算機,要實現最大效益,不僅需要硬件系統,還要有配套的系統軟件、應用軟件,可謂“平衡”。比如并行文件系統,一些操作系統的優化,英特爾公司和BGP進行了近六年的合作,主要體現在GeoEast軟件開發上。
從應用軟件角度講,優化則更明顯,每一套應用軟件要采用英特爾編譯系統。英特爾的專家針對GeoEast軟件在石油行業的應用,提出了很多建議。如時間偏移,他們進行持續跟蹤,根據應用采用有效工具對軟件進行特征分析,使“時間偏移”軟件性能當時就提高5倍左右;其次是三維RNA,該模塊非常費時,英特爾公司幫助進行優化,目前已經取得極大進展。
賴能和告訴記者,東方物探這幾年投入上千萬做技術改造,目的是要提高CPU利用率,提高存儲性能,確保數據安全及降低能耗。
CPU的架構和網絡技術、存儲、存儲網絡、核心應用等,都會影響CPU利用率。因此,合理選擇CPU的主頻,可有效提高CPU利用效率。賴能和認為,不同的存儲架構,差別非常大,萬兆的性能遠遠超過千兆,兩者相差5倍。不同的存儲品牌,性能差別也很大,存儲網絡對存儲的性能影響同樣非常大。要優化配置,存儲關鍵是參數。從這五個方面提升I/O的性能,便可提升整個系統存儲性能,最終達到提高CPU利用率的目的。協調好上述五方面,才能建立一個平衡的計算機系統。賴能和總工指出,要建造一套高性能、高效率的計算機,需要英特爾這樣擁有雄厚技術力量做支撐和后盾的公司。
近五年來,存儲是作為目前石油行業在IT設備里增長最快的一項,每年增長在2500~3000T左右,而目前價格卻都在下降。賴能和介紹說,從性能上他們也在選擇一些高性能的存儲。英特爾提出SSD,因為它功耗非常低,I/O讀寫性非常好,他們現在正在做數據庫應用的嘗試,全部采用SSD(固態硬盤),同時高性能計算機的內置盤也開始嘗試用SSD,以后可能會用得比較多。
如何更好地優選軟、硬件
CPU、APU、GPU,業內已經很熟悉,尤其是GPU目前被炒得很熱。東方物探目前擁有184個GPU,一個168個GPU是整裝。當然GPU還有很多不足的地方。賴能和建議,選擇GPU時,不注意選密度。因為密度高,其功耗、噪音非常大,穩定性還有些不足。目前GPU在工業界用得非常多,主要的服務商全部都支持。“我們曾做過測試,軟件在上面跑的效果不錯,全部采用英特爾至強處理器,8萬個核,不到兩天就完成了。”
“網絡方面選擇時也要注意,因為大家可能會選萬兆。“賴能和坦言,當時他們選用的是銅纜,集成困難較多,容易出問題。”GPU是好東西,但還很新,很多東西都需要摸索。”
目前的多路服務器,國內非常多,應用非常好,尤其像惠普、IBM、曙光、聯想等都有2路、4路、8路,特別是8路服務器用得比較多。賴能和透露,東方物探目前有二三十套8路服務器。
云計算是把很多計算機聯網或者自動傳到計算機上,減少終端用戶的負擔,目前受到廣泛關注。云計算被國家列為新興產業重要發展戰略之一,市場潛力比較大。賴能和總工指出,“我們要保持清醒,尤其是從事計算機領域的工作者,需要跟上級領導客觀反映。現在有很多問題沒有解決。一是云計算發展的相關法律法規沒有解決,這關系到數據安全問題,誰來保護數據安全。二是知識產權的相關內容。如目前石油數據處理,世界上沒有一家公司把所有數據處理任務都放在云平臺上,因為數據的移動很大,很難做。三是一些核心技術需要突破。芯片、服務器、存儲、設備要繼續發展,云計算要客觀理解和對待,但我們還是要跟蹤,我的觀點是要緊密跟蹤,客觀評價。”