數據庫連接出錯:SELECT S.*,M.alias AS M_alias,M.keywords AS M_keyword,M.config AS M_config FROM p8_sort S LEFT JOIN p8_article_module M ON S.fmid=M.id WHERE S.fid='148'

Table 'ksfbw.p8_sort' doesn't exist
1146 在线综合亚洲欧美日韩,狠狠做五月深爱婷婷天天综合,国产成人AV综合久久

高性能計算機中互連網絡的可靠性研究

作者:劉曉婷 賈志淳時間:2015-12-05 10:20:33  來源:www.6scc.cn  閱讀次數:2959次 ]
【文章摘要】
高性能計算機屬于一種計算機系統,能夠比較好的處理大型應用和大數據。高性能計算機在為用戶提供服務時,系統的可靠性是提供服務質量的主要保證。尤其是近年來高性能計算機得到了快速的發展,系統內的組件變得越來越多,這樣一來,用于組件連接的互聯網絡規模就會相應增加, 由此使得故障結點發生的可能性大增,進而導致互聯網絡的可靠性出現問題,最終影響整個計算機系統的可靠性,因此,互聯網絡的可靠性非常重要,本文對高性能計算機中互聯網絡的可靠性進行了必要的研究,以便于保證互聯網絡具有較高的可靠性。
【關鍵詞】
高性能計算機;互聯網絡;可靠性
0 前言
隨著計算機技術以及科學技術的發展,高性能計算機技術得到了廣泛的應用,在技術應用加深的過程中,對高性能計算機的系統可靠性提出了更高的要求。所謂系統可靠性,是指能夠保證系統正常運行,從而提供更為優質服務的技術。但是在高性能計算機發展的過程中,為了使系統具有很多的功能,增加了很多的組件,這樣一來,其所具有的互聯網絡規模急劇增加,而互聯網絡的穩定性對系統的穩定性有著很大的影響,因此,對互聯網絡的可靠性研究具有十分重要的現實意義。
1 當前高性能計算機所采用的可靠性技術
1.1 避錯技術
所謂避錯技術,是指在進行設計時, 通過正確的設計以及科學的質量控制方法,將可能出現在系統的故障避免掉,同時將器件發生失效的概率降至最低,在避錯技術中,包含了比較多的內容,比如熱設計、降額設計等。在進行高性能計算機可靠性設計時,所選擇的組件均要具有較高的可靠性,同時,所選擇的組件要具有較高的集成度,以便于減少組件的數目, 減小互聯網絡的規模,增強可靠性。另外, 在高性能計算機發展的過程中,功耗會變得越來越大,由此,避錯技術的熱設計就變得越來越重要,通過科學的熱設計,可以將組件的結溫降低,從而提高組件的可靠性,最終提高系統的可靠性。
1.2 靜態冗余
靜態冗余技術也被稱為故障屏蔽技術,在該項技術中,承認系統是會存在的故障的,在基礎上,通過科學的措施將故障可能會帶來的影響消除,一般來說,可采取的措施有硬件冗余、信息冗余,目前, 靜態冗余技術廣泛的應用于高性能計算機的可靠性設計中。在高性能計算機中, 出現頻率最高的故障就是電源故障,因此在利用靜態冗余技術進行設計時,需要各層次全方位的電源冗余設計,從而有效地保證電源的可靠工作。
1.3 動態冗余
在動態冗余技術中,一旦計算機系統出現故障,就會采用標準模塊配置對故障進行檢測,進而準確的診斷出故障發生的位置,之后通過重組或恢復的措施使系統再次正常運行。動態冗余技術由三個環節組成,一是故障檢測與診斷,在該環節中,故障所發生的位置將會被準確的診斷出來,無論聯機與否,故障檢測與診斷都可以正常工作,不過在聯機的狀態下,才能有效的提高系統的可靠性;二是重組技術,這是一個非常重要的環節,主要的作用是防止失效的產生影響系統的操作, 如果系統發生的故障是無法進行恢復的, 那么系統就會啟動重組技術,利用備用的組件來保持系統的繼續運行,但是如果沒有備用的組件,重組技術就可以將產生故障的組件隔離掉,從而保證系統的正常運行;三是恢復技術,重組技術針對的是不可恢復的故障,而當檢測出來是瞬態故障時,就會采用恢復技術貴故障進行恢復, 同時,將故障的影響消除掉,從而使系統繼續運行,在恢復技術中,最為重要的方法就是重試。
1.4 在線替換
當高性能計算機系統的組件發生故障時,可以通過在線替換技術將故障組件替換掉,以此來保證系統的繼續運行,在線替換技術在進行工作時,要與冗余技術互相配合,這樣一來,系統的可靠性就會得到較大的提高。高性能計算機系統中所包含的組件比較多,并不是所有的組件都可以應用在線替換技術,也不是所有的組件利用此種方式都能獲得較為理想的效果,一般來說,可以進行在線替換的組件有替換單元板、磁盤、風扇、電源等。
2 互聯網絡可靠性的度量指標
2.1 容錯性
對于計算機系統來說,故障是客觀存在的。計算機系統具有規定的功能,當實際的功能表現與規定不一致時,就說明系統存在了故障。當系統中節點或者鏈路發生故障時,如果計算機依然可以正常工作,那么這就是系統的容錯性在發揮作用。因而,從某種意義上來說,容錯性可以等同于可靠性,可以有效地減少故障到來的影響,保證系統的正常運行。容錯性的概念于1971 年被正式提出,隨后高性能計算機出現之后,容錯性技術得到了廣泛的關注,并進行了推廣及應用,容錯性技術的應用,對于高性能計算機的可靠性有著十分重要的意義。在計算機系統中,容錯性包括硬件容錯和軟件容錯,硬件容錯是指當系統發生故障時,通過容錯功能部件的作用,系統可以恢復到正常運行的狀態,而且故障之前所運行的計算方法或程序也可恢復正常;軟件容錯是指在容許的程度之內,軟件的出錯不會影響到系統的運行。在容錯性中,比較重要的兩個衡量標準分別為圖的嵌入能力和圖的連通性, 首先是圖的嵌入能力,對于計算機系統來說,如果具備容錯能力,就必須要解決互聯網絡系統正確執行何種算法以及會發生何種類型的故障的問題;其次是圖的連通性,所謂連通性,是指在未發生故障的節點之間,存在完整的通信鏈路,從而有效地保證互聯網絡的正常運行。
2.2 故障診斷
隨著市場的發展,要求計算的成本要變得更低,同時計算投資人的利益還要得到保護。現今,科學計算的應用領域變得越來越廣,而且應用的程度越深,對性能的要求就越高,而且在很長的一段時間內,這種狀況都會保持著增長的趨勢。基于這項要求,高性能計算機在提高自身性能時,最為關鍵的問題就是結點的互聯網絡。當前,在高性能計算機中的互聯網絡中,為了實現結點之間的互聯,采取了比較典型的互聯系統,然而在這些系統中, 結點之間的通信邊都存在著發生故障的概率,這些故障一旦發生,就會帶來嚴重的損失。因此,對于高性能計算機系統的穩定性來說,互聯網絡的可靠性最為重要。一般來說,高性能計算機系統可靠性所采取的技術為容錯性技術,在容錯性技術中,動態冗余是經常被依賴的一種方式,動態冗余技術中,包括故障檢測和診斷環節,在對故障進行檢測和診斷時,首先需要進行測試,之后再進行診斷。測試的主要目的的確定系統中是否存在故障, 因此,也被成為故障檢測;而診斷除了要確定是否存在故障之外,還需要確定故障發生的位置,因此,診斷工作的難度非常大。在度量系統的可靠性時,故障診斷能力也是一項比較重要的指標。在故障診斷中,最為有效的方法就是系統級診斷,從范圍上來看,系統級診斷包括四類:門級、芯片級、子系統以及系統級。
3 高性能計算機中互聯網絡的可靠性研究
3.1 互聯網絡的容錯性
(1)OTIS 網絡的容錯性研究
OTIS 是指光電轉換網絡,在這種類型的互聯網絡中,處理器由n 個簇造成, 而每個簇又包含至少一個芯片,在同一個簇中,通過電來實現處理器的互聯,而在不同的簇之間,實現互聯所依賴的是光信號。在并行系統和分布式的系統中,所擁有的比較重要的特性就是容錯性,在互聯網絡中,處理器或承載處理器的芯片以及處理器之間的通信比較容易發生故障,通過抽象理解,這兩大故障可以看作是結點和邊故障。對于OTIS 網絡的結構設計來說,需要格外注意的因素為網絡的可靠性,為了提高互聯網絡的可靠性,就需要進行網絡限制連通設計。由此一來,該類型的互聯網絡將會具有較好的容錯性。
(2)光互聯網絡hypermesh 的容錯性研究
隨著高性能計算機的發展,通信要求得到不斷地提升,這樣一來,傳統的電互聯方式已經無法滿足要求,需要研究出新的互聯方式,由此,光互聯網絡應運而生。大部分的光互聯網絡在進行設計時, 以分布式光交換開光為基礎,但是這種設計方式的缺陷是圖論定義不精確,因此, 為了改善這個問題,就研究出了光互聯網hypermesh,在這種類型的互聯網絡中,圖論結構以超圖規則為基礎。高性能計算機中的光網絡技術得到了快速的發展,為了保證網絡的可靠性,就需要提高系統的容錯性能。
3.2 互聯網絡的故障診斷
(1)診斷模型
互聯網絡故障診斷模型主要有兩種類型:第一種類型為PMC 模型,在這一網絡故障診斷模型當中,將網絡系統進行了劃分,將其分為若干結點機,這些結點機之間可以進行互相測試。在測試時,模型會根據測試者給出的測試程序來進行,測試完成之后通過比較測試結果,能夠最終得出被測試者處于正常狀態還是故障狀態。第二種類型為比較模型,在利用比較模型對互聯網系統進行故障診斷時,需要借助一些相關的故障診斷算法,最終來實現對互聯網系統故障的診斷。
(2)OMMH 的故障診斷
OMMH 為光互聯網絡光多網格超立方體,是超立方體和網格網絡的完美結合,這一故障診斷模型在建立時兼取了網格網絡和超立方體的所有優點,避免了其所具有的缺點。因此,在利用OMMH 網絡對互聯網系統進行故障診斷時,具有高效及快速的特點,而且故障診斷的準確性非常高,極大的提高了互聯網故障診斷的整體效率。
(3)折疊立方體互聯網絡的悲觀故障診斷
故障診斷也需要容錯技術的支持,以便于有效的保證最終的故障診斷結果的有效性,在折疊立方體互聯網絡中,利用悲觀故障診斷策略,可以有效節省故障診斷的時間,提升故障診斷準確性以及有效性。
4 結論
隨著計算機技術及科學技術的發展, 高性能計算機的功能得到了有效的提升, 由此一來,高性能計算機所具有的組件就會增加許多,使得互聯網絡的規模變得越來越大,這樣一來,互聯網絡的可靠性就受到了很大的影響,因為,為了提高互聯網絡的可靠性,就需要對容錯性及故障診斷進行研究,通過這兩項技術的提高,使得互聯網絡的可靠性增強,從而提升高性能計算機的可靠性,保證系統為用戶提供更為優質的服務。
【參考文獻】
[1] 王凱,陳飛,李強等. 一種面向高性能計算機的超節點控制器的研究[J]. 計算機研究與發展,2011, (01):1-8.
[2] 肖利民,祝明發. 淺談超級計算中心的高性能計算機系統面臨的挑戰及應對[J]. 科研信息化技術與應用,2010,(01):27-34.
[3] 李暉,吳俊敏,陳國良. 一種新的高性能計算機互連網絡及其并行仿真[J]. 小型微型計算機系統, 2010,(09):1697-1701.
[4] 蔡曄,劉剛,毛睿等.KD-90 普及型個人高性能計算機系統設計與性能優化[J]. 深圳大學學報(理工版),2013,(02):138-143.

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除! 快速論文發表網(www.6scc.cn)本中心和國內數百家期刊雜志社有良好的合作關系,可以幫客戶代發論文投稿.

投稿郵箱:ksfbw@126.com
客服Q  Q: 論文發表在線咨詢82702382
聯系電話:15295038833

本站論文資源均為來自網絡轉載,免費提供給廣大作者參考,不進行任何贏利,如有版權問題,請聯系管理員刪除!

廣告推薦

文章評論

共有 0 位網友發表了評論

閱讀排行

推薦文章

最新文章

主站蜘蛛池模板: 狠狠亚洲婷婷综合色香五月排名| 一个色综合导航| 人人狠狠综合久久亚洲88| 欧美综合自拍亚洲综合图片区| 婷婷综合缴情亚洲狠狠尤物| 国产91色综合久久免费分享| 亚州欧州一本综合天堂网| 欧美激情综合色综合啪啪五月| 欧美亚洲综合色在| 久久国产综合精品五月天| 国产在线一区二区综合免费视频| 亚洲高清无码综合性爱视频| 91探花国产综合在线精品| 激情五月激情综合网| 五月天婷五月天综合网在线| 亚洲伊人色欲综合网| 伊人yinren6综合网色狠狠| 狠狠激情五月综合婷婷俺| 激情综合亚洲色婷婷五月| 激情综合色五月丁香六月欧美| 97se色综合一区二区二区| 精品综合久久久久久97超人| 伊人yinren6综合网色狠狠| 区三区激情福利综合中文字幕在线一区亚洲视频1| 亚洲va欧美va国产综合| 亚洲综合激情另类专区| 久久婷婷五月综合国产尤物app| 一本久久综合亚洲鲁鲁五月天| 亚洲欧美国产日产综合不卡| 国产巨作麻豆欧美亚洲综合久久| 综合欧美亚洲日本| 欧美日韩亚洲综合一区二区三区| 色欲色香天天天综合网站| 亚洲高清无码综合性爱视频| 五月综合激情网| 亚洲国产综合无码一区二区二三区| 国产成人综合日韩精品无码不卡| 国产成人综合久久精品尤物| 狠狠久久综合伊人不卡| 天天综合久久一二三区| 久久综合成人网|