(2011年05月18日,中國北京)中國石油西南油氣田公司勘探開發研究院始建于1953年,是我國石油天然氣勘探開發行業中建院較早,集石油天然氣地質勘探、油氣田開發、地質開發試驗和計算機應用等為一體的綜合性應用科學研究機構,其主要任務是圍繞川渝油氣工業發展目標,開展各級重點科技項目攻關,資源評價,編制勘探開發規劃、油氣田開發方案,為開拓油氣勘探新領域,擴大后備資源和科學、合理、高效開發油氣田提供重要科學依據。
亟需輕量級、高效的監控管理系統
油氣勘探與開發要面對著多種多樣的復雜多變的地質情況,特別是在我國,油氣田大多埋藏于幾百甚至幾千米的地層深處,而且地質狀況復雜,準確尋找油氣田位置非常困難,油氣勘探與開發呈現高風險、高投資和見效慢的特點。為了提高勘探的精度,縮短勘探時間,高性能計算技術被引入到石油勘探業務中,成為石油勘探業務提高效率的利器。
中國石油西南油氣田公司勘探開發研究院一直走在用高性能計算技術助力油氣勘探與開發的前列。從1977年為承擔引進的用于測井資料處理解釋的85機的管理需求組建第七研究室開始,經過30余年的發展,中國石油西南油氣田公司勘探開發研究院計算機中心已經擁有大中型計算機服務器、PC集群、專業計算機工作站等設備組成的計算機群,形成了包括地震數據處理和解釋、測井數據處理和解釋、油氣藏數值模擬、油氣藏生產分析、三維地質建模等處理和解釋能力,成為西南油氣田公司最大的計算機技術應用中心,為川渝老氣田穩產,并加快增儲上產步伐,著力推進技術創新尋找新的勘探目標,提供了強有力的計算機應用服務。
由于油氣勘探計算機應用環境管理的復雜性,中國石油西南油氣田公司勘探開發研究院一直在尋求一個簡潔的、輕量級的、全面的、高度集成的計算中心監控管理解決方案,該解決方案要能對計算中心所有主要軟件的應用情況、硬件設備狀況,包括:許可證、數據庫、服務器、交換機、存儲、UPS、機房環境等實現全面的監控;能夠針對所有被監控的設備提供功能全面的異常報警功能,能快速發現和定位問題;其本身的系統要求開銷極低,對監控對象的干擾幾乎可以忽略不計,同時其監控信息收集的功能又必須高效、強大,在保證監控信息足夠詳細的情況下,其數據收集延遲最小可到秒級,從而達到極高的時效性和實用性。例如針對機器監控,中國石油西南油氣田公司勘探開發研究院定義了30多項監控指標,包括:CPU利用率、內存利用率、IO、網絡流量、網卡狀態、CPU溫度、CPU風扇、當前進程、活動用戶、本地磁盤、NFS磁盤、BIOS狀態等,這些信息在特定情況下,必須數秒內更新,以保證對機器監控的精細程度,滿足性能分析和調優的要求。
Platform Cloud Insight —— 一體化、集成的IT信息管理軟件
在考察了業界主要的高性能計算解決方案提供商之后,西南油氣田公司勘探開發研究院選擇了全球領先的集群、網格、云中間件和云管理平臺提供商Platform公司的Platform Cloud Insight解決方案。Platform Cloud Insight將資產管理、資源監控、統計分析和常用的系統管理功能有機地整合在一起,利用Platform Cloud Insight,系統管理員可以一站式地完成大多數日常的系統管理工作,極大地簡化系統管理工作的復雜性、減少工作量。
Platform Cloud Insight提供了以下功能:
Platform Cloud Insight 通過包括Platform專利的EGO資源管理協議以及SNMP、IPMI、Telnet、SSH、JDBC、SYSLOG、Flexlm/Flexnet等多種協議和方法,提供了對計算中心幾乎所有軟、硬件設備的監控功能,包括:機器、交換機、存儲系統、UPS、數據庫、軟件許可證、機房環境;并提供針對這些設備詳細的、全方位的信息收集和必要的遠程管理功能。
基于角色的權限管理和訪問控制。
Platform Cloud Insight 支持細粒度的系統管理權限劃分和角色定義,可以輕易定制多種角色,以不同的權限訪問系統。例如:可以定義網絡管理員、存儲管理員、數據庫管理員等多種角色,相應地只分配合適的權限,避免管理員權限過大和不必要的誤操作。
強大的報警功能。
Platform Cloud Insight 提供了強大的事件配置和報警功能,幾乎所有的監控指標都可以定義為報警事件。并且,Platform Cloud Insight 可以在全局層面和指定設備層面配置報警事件,實現從宏觀到精細的事件報警。
高擴展性、超輕量級和高效率。
針對計算中心數量占絕對多數的服務器設備,Platform Cloud Insight 通過底層使用Platform專利的EGO資源管理技術,實現了高擴展性、超輕量級和高效率。Platform EGO已經在多家客戶生產環境中實現了5000個機器以上的統一資源管理和監控,并且在這種情況下,即使監控數據更新的延遲設為數秒,產品本身對被監控機器的系統開銷(CPU、內存、網絡等)極低、幾乎可以忽略不計。
從“黑箱”變為“白箱”
通過實施Platform Cloud Insight解決方案,中國石油西南油氣田公司勘探開發研究院將資產管理、資源監控、統計分析和常用的系統管理功能有機地整合在一起,通過瀏覽器就可以輕松、方便地監控管理計算中心幾乎所有軟、硬件設備,計算中心的運行情況,通過網絡拓撲圖和物理拓撲圖結合,大大提高了計算中心設備可視化程度,通過Cloud Insight性能統計分析功能,找出各種設備的運行規律,從而制定有效的報警策略,實現異常的快速發現和報警,大大減少了計算中心設備故障率和故障時間,提高了計算中心的服務水平,在提高系統管理員對故障的響應時間的同時,減少了系統管理員的工作強度。
統一的勘探開發數據庫監控管理。
針對中國石油西南油氣田公司勘探開發研究院的多套勘探開發應用數據庫,Platform Cloud Insight 提供了統一的監控界面,可以快速、詳盡地監控 Oracle 9i,10g 等不同版本數據庫,包括數據庫服務器的狀態(CPU,內存,IO,CPU溫度、風扇等)和數據庫本身的狀態(包括進程狀態、內存使用、用戶、表空間、文件、Session、后臺作業等)。很多監控信息,即使是熟練的DBA,也很難快速、直觀地獲得。通過Platform Cloud Insight,中國石油西南油氣田公司勘探開發研究院顯著提高對多套勘探開發數據庫的監控效率和詳細程度,大大降低了數據庫監控管理的技術門檻。
詳細、高度關聯的存儲系統監控管理。
Platform Cloud Insight 對存儲系統監控管理不僅是針對存儲本身,而是將磁盤陣列、交換機(光纖交換機、以太網交換機等)、存儲服務器、文件系統有機整合在一起,提供一個詳細且高度關聯的監控界面,幫助存儲系統在各個方面的性能調優。例如:針對中國石油西南油氣田公司勘探開發研究院高性能計算系統的存儲監控,Platform Cloud Insight 同時提供了存儲服務器狀態、并行文件系統狀態、光纖交換機流量和端口狀態,存儲磁盤LUN的讀寫狀態監控。系統管理員可以通過Cloud Insight 檢查并行文件系統中多臺存儲服務器的負載和讀寫是否均衡,從而針對文件系統進行調優;存儲上每個LUN的讀寫是否均衡,從而調整存儲配置,達到最大的條帶化讀寫效率;光纖交換機流量是否飽和和端口狀態,從而確定多路徑軟件是否工作正常。
中國石油西南油氣田公司勘探開發研究院計算中心應用研究室主任王軍介紹說:“選擇Platform Cloud Insight是從我們管理業務本身和適用性上考慮的,在實測中,軟件本身的系統開銷(CPU、內存、網絡流量)不到0.5%。Platform Cloud Insight可以充分滿足我們對監控軟件的要求。”