提高實(shí)時(shí)操作系統(tǒng)的實(shí)時(shí)性能和可靠性策略論文
提高實(shí)時(shí)操作系統(tǒng)的實(shí)時(shí)性能和可靠性策略論文
實(shí)時(shí)操作系統(tǒng)是保證在一定時(shí)間限制內(nèi)完成特定功能的操作系統(tǒng)。實(shí)時(shí)操作系統(tǒng)有硬實(shí)時(shí)和軟實(shí)時(shí)之分,硬實(shí)時(shí)要求在規(guī)定的時(shí)間內(nèi)必須完成操作,這是在操作系統(tǒng)設(shè)計(jì)時(shí)保證的;軟實(shí)時(shí)則只要按照任務(wù)的優(yōu)先級(jí),盡可能快地完成操作即可。我們通常使用的操作系統(tǒng)在經(jīng)過一定改變之后就可以變成實(shí)時(shí)操作系統(tǒng)。以下是學(xué)習(xí)啦小編今天為大家精心準(zhǔn)備的:提高實(shí)時(shí)操作系統(tǒng)的實(shí)時(shí)性能和可靠性策略相關(guān)論文,內(nèi)容僅供參考,歡迎閱讀!
提高實(shí)時(shí)操作系統(tǒng)的實(shí)時(shí)性能和可靠性策略全文如下:
對很多嵌入式系統(tǒng)來說,一個(gè)設(shè)計(jì)良好的實(shí)時(shí)操作系統(tǒng)(RTOS)可以讓開發(fā)工程師掌握系統(tǒng)執(zhí)行任何任務(wù)或響應(yīng)任何關(guān)鍵事件的時(shí)間,滿足系統(tǒng)實(shí)時(shí)性要求。為了理解RTOS如何通過系統(tǒng)調(diào)度策略實(shí)現(xiàn)實(shí)時(shí)性要求,本文介紹了搶占式調(diào)度、可搶占的內(nèi)核、優(yōu)先級(jí)繼承和中斷處理等概念。
在設(shè)計(jì)工業(yè)控制系統(tǒng)或醫(yī)療設(shè)備時(shí),大部分工程師和系統(tǒng)設(shè)計(jì)工程師會(huì)認(rèn)為采用RTOS是必需的。然而,網(wǎng)際路由器、車載娛樂系統(tǒng)和多媒體設(shè)備等普通應(yīng)用還需要采用RTOS嗎?像Linux或Windows這樣的通用操作系統(tǒng)是否就能勝任呢?通常,這些產(chǎn)品需要采用RTOS,但是這個(gè)問題常常直到設(shè)計(jì)階段的后期才能意識(shí)到。
RTOS對于很多嵌入式系統(tǒng)來說不但是有益的,而且也是必要的,認(rèn)識(shí)到這一點(diǎn)很重要。例如,一個(gè)播放如MPEG格式電影的設(shè)備,如果依靠軟件來實(shí)現(xiàn)其整個(gè)內(nèi)容傳輸,可能會(huì)出現(xiàn)用戶難以接受的高丟幀率。然而,通過使用RTOS,系統(tǒng)設(shè)計(jì)工程師能夠準(zhǔn)確地控制軟件過程的執(zhí)行順序,從而保證按照給定的媒體速率進(jìn)行播放。上述大部分情況適用于用戶希望對輸入做出立即響應(yīng)的系統(tǒng)。通過RTOS,開發(fā)人員能夠保證由用戶的操作總能得到及時(shí)的響應(yīng),除非一個(gè)更重要的操作(如一項(xiàng)有助于保障用戶安全的操作)必須首先執(zhí)行。
總之,一個(gè)好的RTOS支持開發(fā)人員控制系統(tǒng)執(zhí)行任何任務(wù)或?qū)θ魏沃匾录龀龇磻?yīng)的時(shí)間,并且能夠以一種可以預(yù)測并且完全一致的形式滿足任務(wù)執(zhí)行的最終期限要求。但是,如果RTOS崩潰,這些最終期限就不能被滿足。因此,RTOS必須提供高度的可靠性。特別是它必須提供在不需要重啟的情況下,從軟件故障中快速并智能恢復(fù)的機(jī)制。
搶占式調(diào)度
在像Linux這樣的通用操作系統(tǒng)中,在對線程和進(jìn)程的CPU占用上采用了“公平”調(diào)度策略。這樣的策略能夠提供良好的整體表現(xiàn),但是不能保證高優(yōu)先級(jí)、對時(shí)間要求嚴(yán)格的線程將優(yōu)先于低優(yōu)先級(jí)的線程執(zhí)行。事實(shí)上,操作系統(tǒng)有時(shí)甚至?xí)袛喔邇?yōu)先級(jí)的線程來為低優(yōu)先級(jí)線程提供CPU時(shí)間。其結(jié)果可能造成對時(shí)間要求嚴(yán)格的線程很容易地錯(cuò)過它們的最終期限,甚至在一個(gè)高速的高端處理器上運(yùn)行時(shí)也會(huì)出現(xiàn)這種情況。
而在RTOS中,線程按照其優(yōu)先級(jí)順序執(zhí)行。如果一個(gè)高優(yōu)先級(jí)的線程準(zhǔn)備運(yùn)行時(shí),它將在一個(gè)短的、有限時(shí)間間隔內(nèi)從任何可能正在運(yùn)行的低優(yōu)先級(jí)進(jìn)程接管CPU。另外,高優(yōu)先級(jí)的線程能夠不被中斷地運(yùn)行,直到它已經(jīng)完成了需要做的事情-當(dāng)然是在不被更高優(yōu)先級(jí)進(jìn)程搶占的前提下。這種方法就是搶占式調(diào)度,保證了高優(yōu)先級(jí)線程始終滿足其最終期限,而不管有多少其它線程正在競爭CPU時(shí)間。
通過合理地控制線程優(yōu)先級(jí),開發(fā)者能顯著地提高很多對用戶非常重要的應(yīng)用響應(yīng)速度。然而,控制優(yōu)先級(jí)可能是一把雙刃劍,當(dāng)使用不當(dāng)時(shí)它可能會(huì)潛在地導(dǎo)致低優(yōu)先級(jí)的進(jìn)程不能得到CPU時(shí)間。保證高優(yōu)先級(jí)的進(jìn)程和線程的同時(shí)確保不會(huì)使其它進(jìn)程處于“饑餓”狀態(tài)的關(guān)鍵是要對它們的執(zhí)行進(jìn)行限制,通過對執(zhí)行進(jìn)行調(diào)整或在響應(yīng)加載的過程中進(jìn)行控制,開發(fā)人員能夠限制這些活動(dòng)消耗的CPU時(shí)間比例,并支持低優(yōu)先級(jí)進(jìn)程獲得對CPU的共享。
優(yōu)先級(jí)控制能夠使很多應(yīng)用受益,包括像前面提到的媒體播放器(MP3、WAV、MPEG2等格式)。媒體播放器需要實(shí)現(xiàn)正常播放所要求的速率(例如44kHz的音頻、30fps的視頻)。在這種限制之下,一個(gè)讀線程和一個(gè)顯示線程可以被設(shè)計(jì)成依靠一個(gè)可編程的定時(shí)器來喚醒,緩沖或顯示一幀后進(jìn)入睡眠狀態(tài),直到下一個(gè)定時(shí)觸發(fā)。這提供了一種調(diào)整機(jī)制,支持高于正常用戶活動(dòng)而又低于關(guān)鍵系統(tǒng)功能的優(yōu)先級(jí)設(shè)置。換句話說,如果沒有更重要的任務(wù)準(zhǔn)備運(yùn)行,媒體播放將始終以給定的媒體速率執(zhí)行。
最壞情形
搶占式調(diào)度僅在高優(yōu)先級(jí)的線程在一個(gè)短的、有限時(shí)間段內(nèi)搶占低優(yōu)先級(jí)線程的情況下有效。否則,系統(tǒng)將不可能預(yù)測要花費(fèi)多長時(shí)間來執(zhí)行一個(gè)給定的操作。因此,任何銷售進(jìn)程模式的RTOS的供應(yīng)商都必須提供針對下面兩種時(shí)間間隔提供最壞情形:線程切換時(shí)間,即當(dāng)兩個(gè)線程處于同一進(jìn)程的情況下,從執(zhí)行一個(gè)線程的最后一條指令到執(zhí)行下一個(gè)被調(diào)度線程的第一條指令所經(jīng)過的時(shí)間;前后關(guān)系切換(context switch)時(shí)間,其定義同上,但僅針對兩個(gè)線程處于不同進(jìn)程的情況。
可以將線程看作是最小的“執(zhí)行單元”,而將進(jìn)程看作是一個(gè)或多個(gè)線程的“容器”,進(jìn)程定義了線程將要在其中執(zhí)行的地址空間。顯然,最壞情形的前后關(guān)系切換時(shí)間將比最壞情形的線程切換時(shí)間要慢,盡管在一個(gè)好的RTOS設(shè)計(jì)中差別可能是微不足道的。
將所有的線程放在幾個(gè)大的進(jìn)程中將是錯(cuò)誤的,因?yàn)榫€程提供的切換速度更快。雖然線程能實(shí)現(xiàn)并行處理優(yōu)勢因而適合于某些設(shè)計(jì),但將一個(gè)應(yīng)用分成多個(gè)內(nèi)存保護(hù)的進(jìn)程使得代碼更容易調(diào)試,提供了更好的錯(cuò)誤隔離和恢復(fù)能力,并允許系統(tǒng)進(jìn)行新功能的動(dòng)態(tài)升級(jí)。
可搶占的內(nèi)核
在大部分通用操作系統(tǒng)中,操作系統(tǒng)的內(nèi)核是不可搶占的。其結(jié)果是,一個(gè)高優(yōu)先級(jí)的進(jìn)程不可能搶占一個(gè)內(nèi)核調(diào)用,而是必須等待整個(gè)調(diào)用完成,即使這個(gè)調(diào)用是由系統(tǒng)中的低優(yōu)先級(jí)進(jìn)程發(fā)起的。另外,當(dāng)經(jīng)常在內(nèi)核調(diào)用中執(zhí)行的驅(qū)動(dòng)程序或其它系統(tǒng)服務(wù)代表一個(gè)客戶線程執(zhí)行的時(shí)候,所有的優(yōu)先級(jí)信息常常會(huì)丟失,這導(dǎo)致了不可預(yù)測的延遲并阻止了關(guān)鍵活動(dòng)的準(zhǔn)時(shí)完成。
而在RTOS中,內(nèi)核操作是可搶占的。盡管仍然會(huì)存在一些時(shí)間窗口,在這些時(shí)間窗口中可能沒有搶占,但是這些時(shí)間間隔應(yīng)該是相當(dāng)短暫的,通常在幾百納秒。另外,必須有一個(gè)關(guān)于搶占被推遲或中斷被禁止的時(shí)間上限,這樣開發(fā)者可以確定最壞情形下的等待時(shí)間。
為了實(shí)現(xiàn)這個(gè)目標(biāo),操作系統(tǒng)內(nèi)核必須盡可能簡潔,只有具有較短執(zhí)行路徑的服務(wù)才被包含在內(nèi)核中,任何需要大量工作(如進(jìn)程加載)的操作必須被安排到外部進(jìn)程或線程。這種方法有助于通過內(nèi)核確保最長的不可搶占代碼路徑具有一個(gè)時(shí)間上限。
優(yōu)先級(jí)繼承
然而,為一個(gè)進(jìn)程設(shè)定一個(gè)高優(yōu)先級(jí)并不總能保證該進(jìn)程能夠搶占低優(yōu)先級(jí)的進(jìn)程。有時(shí)候,系統(tǒng)會(huì)出現(xiàn)一種稱為優(yōu)先級(jí)倒置(priority inversion)的狀態(tài),在這種狀態(tài)下,低優(yōu)先級(jí)的進(jìn)程將在“無意中”阻止較高優(yōu)先級(jí)進(jìn)程占用CPU。優(yōu)先級(jí)倒置可能會(huì)表現(xiàn)為幾種形式,為了防止發(fā)生這種情況,RTOS必須提供一種稱為優(yōu)先級(jí)繼承的功能。
假定系統(tǒng)有三個(gè)進(jìn)程:A(低優(yōu)先級(jí)),B(中等優(yōu)先級(jí)),Z(高優(yōu)先級(jí))。這里Z是一個(gè)為A和B提供服務(wù)的“服務(wù)器”進(jìn)程。參見圖1。
現(xiàn)在假定A已經(jīng)請求Z來執(zhí)行一個(gè)計(jì)算,而在這期間,突然B需要Z的服務(wù)。因?yàn)锽擁有比A更高的優(yōu)先級(jí),一般會(huì)認(rèn)為Z將立即掛起A的請求并將轉(zhuǎn)向?yàn)锽服務(wù)。但是實(shí)際情況并非如此,因?yàn)閆比B具有更高的優(yōu)先級(jí)。其結(jié)果是,B不能阻止Z完成它當(dāng)前的工作,即對A做出響應(yīng)。
從效果上看,低優(yōu)先級(jí)的進(jìn)程A占用了更高優(yōu)先級(jí)進(jìn)程B的CPU時(shí)間,這是引入優(yōu)先級(jí)繼承的原因。通過使用RTOS提供的優(yōu)先級(jí)繼承機(jī)制,系統(tǒng)可以在A發(fā)出請求的情況下,讓Z繼承A的低優(yōu)先級(jí)。通過這種方式,B能夠在任何時(shí)候搶占A的請求。
如果一個(gè)應(yīng)用程序分布于幾個(gè)通過網(wǎng)絡(luò)連接的處理器,那么RTOS也應(yīng)該支持分布式優(yōu)先級(jí)繼承,這樣可以按照優(yōu)先級(jí)的順序處理來自多個(gè)處理器的請求。如果沒有優(yōu)先級(jí)繼承,一個(gè)多處理器系統(tǒng)可能會(huì)落入無限的優(yōu)先級(jí)倒置和死鎖中。
中斷處理
為了獲得對外部事件的及時(shí)響應(yīng),最小化硬件中斷發(fā)生到執(zhí)行該中斷的第一條代碼的時(shí)間很重要。這個(gè)時(shí)間間隔稱為中斷延遲,為了保證中斷延遲盡可能小,一個(gè)好的RTOS應(yīng)該在幾乎所有時(shí)間內(nèi)都支持產(chǎn)生中斷。正如在關(guān)于內(nèi)核搶占部分提到的那樣,一些重要的代碼段的確需要暫時(shí)屏蔽中斷。這種最大的屏蔽時(shí)間通常被定義為最大的中斷延遲。
在某些情況下,硬件中斷處理器必須調(diào)度并運(yùn)行一個(gè)更高優(yōu)先級(jí)的線程(例如在一個(gè)驅(qū)動(dòng)程序中)。在這樣的情況下,中斷處理器將返回并指示一個(gè)事件將被處理。這樣的處理將引入了第二種形式的延遲-調(diào)度延遲,這個(gè)延時(shí)必須在設(shè)計(jì)中加以考慮。調(diào)度延遲是介于用戶的中斷處理器的最后一條指令和驅(qū)動(dòng)程序線程第一條指令的執(zhí)行之間的時(shí)間。
在一個(gè)嵌入式系統(tǒng)中可能會(huì)同時(shí)出現(xiàn)多個(gè)硬件中斷。例如,在一個(gè)病人監(jiān)護(hù)系統(tǒng)中,當(dāng)一個(gè)傳感器記錄了病人心跳的一次變化并且網(wǎng)卡接收到網(wǎng)絡(luò)傳來的數(shù)據(jù)的同時(shí),護(hù)士按了觸摸屏。很明顯,一些中斷(如心率的變化)應(yīng)該立即得到處理,而其他的則可以延緩。通過提供對嵌套中斷的支持,RTOS支持嵌入式系統(tǒng)優(yōu)先處理更高優(yōu)先級(jí)的中斷。
如何提高可靠性
我們已經(jīng)明白怎樣使RTOS具有可以預(yù)測性,但是如何實(shí)現(xiàn)其可靠性呢?答案在很大程度上取決于RTOS的架構(gòu)。
例如在實(shí)時(shí)執(zhí)行模式架構(gòu)中,大部分或所有軟件組件都在一個(gè)單一的內(nèi)存地址空間中運(yùn)行,包括操作系統(tǒng)內(nèi)核、網(wǎng)絡(luò)協(xié)議棧、設(shè)備驅(qū)動(dòng)程序、應(yīng)用程序等。雖然很有效率,但這種架構(gòu)有兩個(gè)明顯的缺陷:1. 在任何組件中的一個(gè)指針錯(cuò)誤,不論這個(gè)錯(cuò)誤多么細(xì)微,都可能破壞操作系統(tǒng)內(nèi)核或任何其它組件,導(dǎo)致不可預(yù)測的行為和整個(gè)系統(tǒng)的崩潰;2. 很難動(dòng)態(tài)修復(fù)或替換任何有故障的組件。在大多數(shù)情況下,出現(xiàn)這些問題時(shí)系統(tǒng)復(fù)位是唯一的選擇。
一些RTOS,也像Linux一樣,試圖通過使用單內(nèi)核架構(gòu)來解決這個(gè)問題。在這種架構(gòu)中,用戶的應(yīng)用程序在隔離的、受保護(hù)內(nèi)存地址空間中運(yùn)行。如果一個(gè)應(yīng)用程序試圖訪問其地址空間之外的數(shù)據(jù),內(nèi)存管理單元(MMU)將通知操作系統(tǒng),操作系統(tǒng)可能會(huì)采取保護(hù)措施,例如終止出錯(cuò)進(jìn)程。然而,這樣的操作系統(tǒng)需要將大多數(shù)或所有驅(qū)動(dòng)程序、文件系統(tǒng)和其它系統(tǒng)服務(wù)綁定到內(nèi)核中。因此,任何組件中的一個(gè)錯(cuò)誤都可能帶來災(zāi)難性的內(nèi)核故障。
第三種方法是采用微內(nèi)核(mricokernel)架構(gòu)來提供更精確的故障隔離,像QNX Neutrino這樣的操作系統(tǒng)都基于微內(nèi)核架構(gòu)。微內(nèi)核有兩個(gè)明確的特征:
1. 在操作系統(tǒng)內(nèi)核中只實(shí)現(xiàn)了一個(gè)包含了基本OS服務(wù)的小內(nèi)核(如信號(hào)量、定時(shí)器、任務(wù)調(diào)度等)。包括驅(qū)動(dòng)程序、文件系統(tǒng)、協(xié)議棧和用戶應(yīng)用程序在內(nèi)的所有其它的組件在內(nèi)核外部分離的、保護(hù)內(nèi)存的進(jìn)程中運(yùn)行。有問題的系統(tǒng)服務(wù)不再作為孤立的故障點(diǎn),而是在它破壞其它服務(wù)或操作系統(tǒng)內(nèi)核之前被終止并重啟。
2. 所有的組件能夠通過消息傳遞進(jìn)行通信,一個(gè)定義良好的通信機(jī)制保障了程序在保持彼此安全隔離的前提下進(jìn)行數(shù)據(jù)交換。適當(dāng)實(shí)現(xiàn)的消息傳遞也可以作為一個(gè)虛擬的“軟件總線”,允許幾乎任何的軟件組件,甚至是一個(gè)設(shè)備驅(qū)動(dòng)程序被動(dòng)態(tài)地加入或替換,對于必須提供連續(xù)服務(wù)的系統(tǒng)而言這是一項(xiàng)關(guān)鍵要求。
和傳統(tǒng)的操作系統(tǒng)架構(gòu)相比,微內(nèi)核支持嵌入式設(shè)備贏得明顯更快的平均修復(fù)時(shí)間(MTTR)。例如,如果一個(gè)設(shè)備驅(qū)動(dòng)程序失敗將可能出現(xiàn)以下情況:操作系統(tǒng)可以終止該驅(qū)動(dòng)程序,回收其正在使用的資源,并對其進(jìn)行重新啟動(dòng),這個(gè)過程通常這只需要幾個(gè)毫秒時(shí)間。
盡管和傳統(tǒng)的操作系統(tǒng)相比,基于消息傳遞的微內(nèi)核RTOS通常提供了更好的容錯(cuò)性和動(dòng)態(tài)升級(jí)能力,也有一些觀點(diǎn)認(rèn)為消息傳遞增加了開銷。在實(shí)際應(yīng)用中,如果實(shí)現(xiàn)正確,消息傳遞的性能可以接近底層硬件的內(nèi)存帶寬。例如,一個(gè)微內(nèi)核RTOS可以采用多段式(multipart)消息和線程到線程的消息數(shù)據(jù)直接拷貝等各種技術(shù),來確保系統(tǒng)性能可以達(dá)到傳統(tǒng)的進(jìn)程間通信(IPC)方法的水平。由一些組織如Dedicated Systems等進(jìn)行的獨(dú)立測試證實(shí),和傳統(tǒng)的RTOS相比,微內(nèi)核RTOS在一系列的實(shí)時(shí)指標(biāo)方面表現(xiàn)良好,在很多情況下甚至有更好的表現(xiàn)。
策略決策
RTOS有助于使一個(gè)復(fù)雜的應(yīng)用程序具有可預(yù)測性和可靠性。當(dāng)然,選擇一個(gè)合適的RTOS本身就是一項(xiàng)復(fù)雜的任務(wù),而RTOS的底層架構(gòu)是選擇的重要依據(jù),此外還有一些其它因素,包括:
1. 調(diào)度算法的靈活選擇。RTOS應(yīng)該支持調(diào)度算法的選擇(先入先出(FIFO)、輪詢(round robin)、零星調(diào)度等)并支持以線程為單位設(shè)定這些算法。這樣,工程師就可以不必將一個(gè)算法用到系統(tǒng)中的所有線程。
2. 圖形用戶界面(GUI)。RTOS使用的是原始的圖形庫還是能支持多層界面、多路顯示、3D渲染以及其它高級(jí)的圖形功能的真正的窗口系統(tǒng)?能很容易定制GUI的外觀嗎?GUI支持同時(shí)顯示和輸入多種語言(漢語、韓語、日語、英語、俄語等)嗎?
3. 遠(yuǎn)程診斷工具。因?yàn)閷芏嗲度胧较到y(tǒng)而言,中斷系統(tǒng)運(yùn)行進(jìn)行檢測和維護(hù)是無法接受的。RTOS供應(yīng)商應(yīng)該提供診斷工具,這些工具能夠在不中斷系統(tǒng)服務(wù)的前提下分析系統(tǒng)的行為。要尋找能提供代碼覆蓋、應(yīng)用測評(píng)、跟蹤分析和內(nèi)存分析工具的供應(yīng)商。
4. 開發(fā)平臺(tái)。RTOS提供商提供的開發(fā)環(huán)境是基于像Eclipse那樣的開放平臺(tái),允許工程師嵌入所喜愛的第三方工具來進(jìn)行建模、版本控制嗎?還是開發(fā)環(huán)境基于專利技術(shù)?
5. 互聯(lián)網(wǎng)功能。RTOS支持預(yù)集成最新的IPv4、IPv6、IPsec、SCTP和具有NAT功能的IP過濾等協(xié)議棧套件嗎?它支持嵌入式網(wǎng)絡(luò)瀏覽器嗎?瀏覽器應(yīng)該具有可擴(kuò)展的封裝模式,并能夠在很小的屏幕上繪制網(wǎng)頁。它也應(yīng)該支持像HTML 4.01、XHTML 1.1、SSL 3.0和 WML 1.3這樣的標(biāo)準(zhǔn)。
6. 標(biāo)準(zhǔn)API。RTOS將你限定到專有的API之中了嗎?還是它對于像POSIX這樣的標(biāo)準(zhǔn)API提供了完全的支持,這使得將代碼移植到其它操作系統(tǒng),或者從其它操作系統(tǒng)移植代碼變得更容易?另外,所用的RTOS提供完全一致性的API還是僅僅支持被定義接口的一個(gè)子集?例如,POSIX.1的最新版本包含了大約1,300個(gè)接口。
7. 多處理技術(shù)。RTOS能支持對稱多處理和分布式多處理技術(shù)來提高應(yīng)用性能和容量嗎?如果這樣,是必須重新設(shè)計(jì)你的應(yīng)用程序呢,還是RTOS能夠?qū)?yīng)用程序透明的分配到多個(gè)處理器上去呢?
8. 源代碼工具包。RTOS供應(yīng)商提供了能使RTOS滿足設(shè)計(jì)需求的具有詳細(xì)文檔的定制工具包嗎?供應(yīng)商提供了方便開發(fā)驅(qū)動(dòng)定制硬件的驅(qū)動(dòng)程序開發(fā)工具包嗎?
9. 對于很多公司而言,選擇一款RTOS是一項(xiàng)戰(zhàn)略性決策。RTOS供應(yīng)商在對上述問題提供了清楚的回答后,你將選擇出一個(gè)在現(xiàn)在和將來都適合你的RTOS。