終於找到了一篇文章!通俗地講解計算機工作原理
發布時間:2019-11-09 責任編輯:wenwei
【導讀】為(wei)解(jie)決(jue)各(ge)種(zhong)問(wen)題(ti),人(ren)們(men)發(fa)明(ming)了(le)不(bu)計(ji)其(qi)數(shu)的(de)機(ji)器(qi)。計(ji)算(suan)機(ji)種(zhong)類(lei)繁(fan)多(duo),從(cong)嵌(qian)入(ru)火(huo)星(xing)漫(man)遊(you)機(ji)器(qi)人(ren)的(de)計(ji)算(suan)機(ji)到(dao)為(wei)操(cao)縱(zong)核(he)潛(qian)艇(ting)導(dao)航(hang)係(xi)統(tong)的(de)計(ji)算(suan)機(ji),不(bu)一(yi)而(er)足(zu)。馮(feng)• 諾伊曼在1945 年nian提ti出chu第di一yi種zhong計ji算suan模mo型xing,無wu論lun筆bi記ji本ben電dian腦nao還hai是shi電dian話hua,幾ji乎hu所suo有you計ji算suan機ji都dou遵zun循xun與yu這zhe種zhong模mo型xing相xiang同tong的de工gong作zuo原yuan理li。那na麼me你ni們men了le解jie計ji算suan機ji是shi如ru何he工gong作zuo的de嗎ma?本ben文wen將jiang討tao論lun這zhe些xie內nei容rong:
◎ 理解計算機體係結構的基礎知識
◎ 選擇編譯器將代碼轉換為計算機可以執行的指令
◎ 根據存儲器層次結構提高數據的存儲速度
畢竟,在非程序員看來,編程要像魔法一樣神奇,我們程序員不會這麼看。
體係結構
計算機是一種根據指令操作數據的機器,主要由處理器與存儲器兩部分組成。存儲器又稱RAM(隨機存取存儲器),用於存儲指令以及需要操作的數據。處理器又稱CPU(中央處理器),它從存儲器獲取指令與數據,並執行相應的計算。接下來,我們將討論這兩部分的工作原理。
存儲器
存cun儲chu器qi被bei劃hua分fen為wei許xu多duo單dan元yuan,每mei個ge單dan元yuan存cun儲chu少shao量liang數shu據ju,通tong過guo一yi個ge數shu字zi地di址zhi加jia以yi標biao識shi。在zai存cun儲chu器qi中zhong讀du取qu或huo寫xie入ru數shu據ju時shi,每mei次ci對dui一yi個ge單dan元yuan進jin行xing操cao作zuo。
為讀寫特定的存儲單元,必須找到該單元的數字地址。
由於存儲器是一種電氣元件,單元地址作為二進製數通過信號線傳輸。
二進製數以 2 為基數表示,其工作原理如下:

每條信號線傳輸一個比特,以高電壓表示信號“1”,低電壓表示信號“0”,如圖7-1 所示。

對於某個給定的單元地址,存儲器可以進行兩種操作:獲取其值或存儲新值,如圖7-2 所示。存儲器包括一條用於設置操作模式的特殊信號線。

每個存儲單元通常存儲一個 8 位二進製數,它稱為字節。設置為“讀”模式時,存儲器檢索保存在單元中的字節,並通過8 條數據傳輸線輸出,如圖7-3 所示。

設置為“寫”模式時,存儲器從數據傳輸線獲取一個字節,並將其寫入相應的單元,如圖7-4 所示。

傳輸相同數據的一組信號線稱為總線。用於傳輸地址的8 條信號線構成地址總線,用於在存儲單元之間傳輸數據的另外8 條信號線構成數據總線。地址總線是單向的(僅用於接收數據),而數據總線是雙向的(用於發送和接收數據)。
在所有計算機中,CPU 與RAM 無時無刻不在交換數據:CPU 不斷從RAM 獲取指令與數據,偶爾也會將輸出與部分計算存儲在RAM 中,如圖7-5 所示。

CPU
CPU 包括若幹稱為寄存器的內部存儲單元,它能對存儲在這些寄存器中的數字執行簡單的數學運算,也能在RAM 與寄存器之間傳輸數據。可以指示CPU 執行以下典型的操作:
◎ 將數據從存儲位置 220 複製到寄存器 3;
◎ 將寄存器 3 與寄存器 1 中的數字相加。
CPU 可以執行的所有操作的集合稱為指令集,指令集中的每項操作被分配一個數字。計算機代碼本質上是表示CPU 操作的數字序列,這些操作以數字的形式存儲在RAM 中。輸入/ 輸出數據、部分計算以及計算機代碼都存儲在RAM 中。
通過在RAM zhongbaohanzhongxiebufendaimadezhiling,daimashenzhikeyiduizishenxiugai,zheshijisuanjibingdutaobifanbingduruanjianjiancedeguanyongshoufa。yuzhileisi,shengwubingdutongguogaibianzishendeDNA以躲避宿主免疫係統的打擊。
圖7-6 取自Intel 4004 操作手冊,顯示了部分CPU 指令映射為數字的方法。隨著製造工藝的發展,CPU 支持的操作越來越多。現代CPU 的指令集極為龐大,但最重要的指令在幾十年前就已存在。

CPU 的運行永無休止,它不斷從存儲器獲取並執行指令。這個周期的核心是PC 寄存器,PC (program counter)是“程序計數器”的簡稱。PC 是一種特殊的寄存器,用於保存下一條待執行指令的存儲地址。CPU 的工作流程如下:
(1) 從PC 指定的存儲地址獲取指令;
(2) PC 自增;
(3) 執行指令;
(4) 返回步驟1。
PC 在CPU 上電時複位為默認值,它是計算機中第一條待執行指令的地址。這條指令通常是一種不可變的內置程序,用於加載計算機的基本功能。
在許多個人計算機中,這種程序稱為BIOS(基本輸入輸出係統)。
CPU 上電後將繼續執行這種“獲取- 執行”周期直至關機。然而,如果CPU 隻能遵循有序、順序的操作列表,那麼它與一個花哨的計算器並無二致。CPU 的神奇之處在於可以指示它向PC 中寫入新值,從而實現執行過程的分支,或“跳轉”到存儲器的其他位置。這種分支可以是有條件的。以下麵這條CPU 指令為例:“如果寄存器1 等於0,將PC設置為地址200”。該指令相當於:
if x = 0
compute_this()
else
compute_that()
僅此而已。無論是打開網站、玩計算機遊戲抑或編輯電子表格,所涉及的計算並無區別,都是一係列隻能對存儲器中的數據求和、比較或移動的簡單操作。
大量簡單的操作組合在一起,就能表達複雜的過程。以經典的《太空侵略者》遊戲為例,其代碼包括大約3000 條機器指令。

CPU 時鍾 早在20 世紀80 年代,《太空侵略者》就已風靡一時。這個遊戲在配備2 MHz CPU 的街機上運行。“2 MHz”表示CPU 的時鍾,即CPU 每秒可以執行的基本操作數。時鍾頻率為200 萬赫茲(2 MHz)的CPU 每秒大約可以執行200 萬次基本操作。完成一條機器指令需要5到10 次基本操作,因此老式街機每秒能運行數十萬條機器指令。
隨著現代科技的進步,普通的台式計算機與智能手機通常配備2 GHzCPU,每秒可以執行數億條機器指令。時至今日,多核CPU 已投入大規模應用,如四核2 GHz CPU 每秒能執行近10 億條機器指令。展望未來,CPU 配備的核心數量或許會越來越多。
CPU 體係結構 讀者是否思考過,PlayStation 的遊戲CD 為何無法在台式計算機中運行?iPhone 應用為何無法在Mac 中運行?原因很簡單,因為它們的CPU 體係結構不同。
x86 體係結構如今已成為行業標準,因此相同的代碼可以在大部分個人計算機中執行。但考慮到節電的要求,手機采用的CPU 體係結構有所不同。不同的CPU 體係結構意味著不同的CPU 指令集,也意味著將指令編碼為數字的方式各不相同。台式計算機CPU 的指令並非手機CPU的有效指令,反之亦然。
32 位與64 位體係結構 第一種CPU 是Intel 4004,它采用4 位體係架構。換言之,這種CPU 在一條機器指令中可以對最多4 位二進製數執行求和、比較與移動操作。Intel 4004 的數據總線與地址總線均隻有4 條。
不久之後,8 位CPU 開始廣為流行,這種CPU 用於運行DOS 的早期個人計算機。20 世紀八九十年代,著名的便攜式遊戲機Game Boy 就采用8 位處理器。這種CPU 可以在一條指令中對8 位二進製數進行操作。
技術的快速發展使16 位以及之後的32 位體係結構成為主導。CPU 寄存器隨之增大,以容納32 位數字。更大的寄存器自然催生出更大的數據總線與地址總線:具有32 條信號線的地址總線可以對232 字節(4 GB)的內存進行尋址。
人們對計算能力的渴求從未停止。計算機程序越來越複雜,消耗的內存越來越多,4 GB 內存已無法滿足需要。使用適合32 位寄存器的數字地址對超過4 GB 內存進行尋址頗為棘手,這成為64 位體係結構興起的動因,這種體係結構如今占據主導地位。64 位CPU 可以在一條指令中對極大的數字進行操作,而64 位寄存器將地址存儲在海量的存儲空間中:264 字節相當於超過170 億吉字節(GB)。
大端序與小端序 一些計算機設計師認為,應按從左至右的順序在RAM 與CPU zhongcunchushuzi,zhezhongmoshichengweixiaoduanxu。lingyixiejisuanjishejishizeqingxiangyuancongyouzhizuodeshunxuzaicunchuqizhongxierushuju,zhezhongmoshichengweidaduanxu。yinci,genju“字節序”的不同,二進製序列1-0-0-0-0-0-1-1 表示的數字也有所不同。
◎ 大端序:27 + 21 + 20 = 131
◎ 小端序:20 + 26 + 27 = 193
目前的大部分CPU 采用小端序模式,但同樣存在許多采用大端序模式的計算機。如果大端序CPU 需要解釋由小端序CPU chanshengdeshuju,zebixucaiqucuoshiyimianchuxianzijiexubupipei。chengxuyuanzhijieduierjinzhishujinxingcaozuo,zaijiexilaiziwangluojiaohuanjideshujushiyouqixuyaozhuyizhegewenti。suiranmuqianduoshujisuanjicaiyongxiaoduanxumoshi,danyouyudabufenzaoqidewangluoluyouqishiyongdaduanxuCPU,所以因特網流量仍然以大端序為基礎進行標準化。以小端序模式讀取大端序數據時將出現亂碼,反之亦然。
模擬器 某些情況下,需要在計算機上運行某些為不同CPU 設計的代碼,以便在沒有iPhone 的情況下測試iPhone 應用,或玩膾炙人口的老式超級任天堂遊戲。這是通過稱為模擬器的軟件來實現的。
模擬器用於模仿目標機器,它假定與其擁有相同的CPU、RAM yijiqitayingjian。moniqichengxuduizhilingjinxingjiema,bingzaimonijiqizhongzhixing。keyixiangjian,ruguoliangtaijiqidetixijiegoubutong,namezaiyitaijiqineibumonilingyitaijiqijuefeiyishi。haozaixiandaijisuanjidesuduyuanyuanchaoguozhiqiandejiqi,yincimonibingfeiwufashixian。womenkeyiliyongGame Boy 模擬器在計算機中創建一個虛擬的Game Boy,然後就能像使用實際的Game Boy 那樣玩遊戲。
編譯器
通過對計算機進行編程,可以完成核磁共振成像、聲音識別、行星探索以及其他許多複雜的任務。值得注意的是,計算機執行的所有操作最終都要通過簡單的CPU 指令完成,即歸結為對數字的求和與比較。而Web 瀏覽器等複雜的計算機程序需要數百萬乃至數十億條這樣的機器指令。
但我們很少會直接使用CPU 指令來編寫程序,也無法采用這種方式開發一個逼真的三維計算機遊戲。為了以一種更“自然”且更緊湊的方式表達命令,人們創造了編程語言。我們使用這些語言編寫代碼,然後通過一種稱為編譯器的程序將命令轉換為CPU 可以執行的機器指令。
我們用一個簡單的數學類比來解釋編譯器的用途。假設我們向某人提問,要求他計算5 的階乘。
5! = ?
但如果回答者不了解什麼是階乘,則這樣提問並無意義。我們必須采用更簡單的操作來重新表述問題。
5×4×3×2×1 = ?
不過,如果回答者隻會做加法怎麼辦?我們必須進一步簡化問題的表述。
5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 +5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 + 5 = ?
可以看到,表達計算的形式越簡單,所需的操作數量越多。計算機代碼同樣如此。編譯器將編程語言中的複雜指令轉換為等效的CPU 指令。結合功能強大的外部庫,就能通過相對較少的幾行代碼表示包含數十億條CPU 指令的複雜程序,而這些代碼易於理解和修改。
計算機之父艾倫• 圖靈發現,簡單的機器有能力計算任何可計算的事物。如果機器具有通用的計算能力,那麼它必須能遵循包含指令的程序,以便:
◎ 對存儲器中的數據進行讀寫;
◎ 執行條件分支:如果存儲地址具有給定的值,則跳轉到程序的另一個點。
我們稱具有這種通用計算能力的機器是圖靈完備的。無論計算的複雜性或難度如何,都可以采用簡單的讀取/ 寫入/ 分支指令來表達。隻要分配足夠的時間與存儲空間,這些指令就能計算任何事物。

人們最近發現,一種稱為MOV(數據傳送)的CPU 指令是圖靈完備的。這意味著僅能執行MOV 指令的CPU 與完整的CPU 在功能上並無不同:換言之,通過MOV 指令可以嚴格地表達任何類型的代碼。
這(zhe)個(ge)重(zhong)要(yao)概(gai)念(nian)在(zai)於(yu),無(wu)論(lun)簡(jian)單(dan)與(yu)否(fou),如(ru)果(guo)程(cheng)序(xu)能(neng)采(cai)用(yong)編(bian)程(cheng)語(yu)言(yan)進(jin)行(xing)編(bian)碼(ma),就(jiu)可(ke)以(yi)重(zhong)寫(xie)後(hou)在(zai)任(ren)何(he)圖(tu)靈(ling)完(wan)備(bei)的(de)機(ji)器(qi)中(zhong)運(yun)行(xing)。編(bian)譯(yi)器(qi)是(shi)一(yi)種(zhong)神(shen)奇(qi)的(de)程(cheng)序(xu),能(neng)自(zi)動(dong)將(jiang)代(dai)碼(ma)從(cong)複(fu)雜(za)的(de)語(yu)言(yan)轉(zhuan)換(huan)為(wei)簡(jian)單(dan)的(de)語(yu)言(yan)。
操作係統
從本質上講,編譯後的計算機程序是CPU 指令的序列。如前所述,為台式計算機編譯的代碼無法在智能手機中運行,因為二者采用不同的CPU體係結構。不過,由於程序必須與計算機的操作係統通信才能運行,編譯後的程序也可能無法在共享相同CPU 架構的兩台計算機中使用。
為實現與外界的通信,程序必須進行輸入與輸出操作,如打開文件、在屏幕上顯示消息、打開網絡連接等。但不同的計算機采用不同的硬件,因此程序不可能直接支持所有不同類型的屏幕、聲卡或網卡。
zhejiushichengxuyilaiyucaozuoxitongzhixingdeyuanyinsuozai。jiezhucaozuoxitongdebangzhu,chengxukeyihaobufeilidishiyongbutongdeyingjian。chengxuchuangjianteshudexitongtiaoyong,qingqiucaozuoxitongzhixingsuoxudeshuru/ 輸出操作。編譯器負責將輸入/ 輸出命令轉換為合適的係統調用。
然而,不同的操作係統往往使用互不兼容的係統調用。例如,與macOS或Linux 相比,Windows 在屏幕上打印信息所用的係統調用有所不同。
因此,在使用x86 處理器的Windows 中編譯的程序,無法在使用x86處理器的Mac 中運行。除針對特定的CPU 體係結構外,編譯後的代碼還會針對特定的操作係統。
編譯優化
優you秀xiu的de編bian譯yi器qi致zhi力li於yu優you化hua它ta們men生sheng成cheng的de機ji器qi碼ma。如ru果guo編bian譯yi器qi認ren為wei可ke以yi通tong過guo修xiu改gai部bu分fen代dai碼ma來lai提ti高gao執zhi行xing效xiao率lv,則ze會hui處chu理li。在zai生sheng成cheng二er進jin製zhi輸shu出chu之zhi前qian,編bian譯yi器qi可ke能neng嚐chang試shi應ying用yong數shu百bai條tiao優you化hua規gui則ze。
因此,應使代碼易於閱讀以利於進行微優化。編譯器最終將完成所有細微的優化。例如,一些人對以下代碼頗有微詞。
function factorial(n)
if n > 1
return factorial(n - 1) * n
else
return 1
他們認為應該進行以下修改:
function factorial(n)
result ← 1
while n > 1
result ← result * n
n ← n - 1
return result
誠然,在不使用遞歸的情況下執行factorial 函數將消耗較少的計算資源,但仍然沒有理由因此而改變代碼。現代編譯器將自動重寫簡單的遞歸函數,舉例如下。
i ← x + y + 1
j ← x + y
為避免進行兩次x+y 計算,編譯器將上述代碼重寫為:
t1 ← x + y
i ← t1 + 1
j ← t1
應(ying)專(zhuan)注(zhu)於(yu)編(bian)寫(xie)清(qing)晰(xi)且(qie)自(zi)解(jie)釋(shi)的(de)代(dai)碼(ma)。如(ru)果(guo)性(xing)能(neng)出(chu)現(xian)問(wen)題(ti),可(ke)以(yi)利(li)用(yong)分(fen)析(xi)工(gong)具(ju)尋(xun)找(zhao)代(dai)碼(ma)中(zhong)的(de)瓶(ping)頸(jing),並(bing)嚐(chang)試(shi)改(gai)用(yong)更(geng)好(hao)的(de)方(fang)法(fa)計(ji)算(suan)存(cun)在(zai)問(wen)題(ti)的(de)代(dai)碼(ma)。此(ci)外(wai),避(bi)免(mian)在(zai)不(bu)必(bi)要(yao)的(de)微(wei)操(cao)作(zuo)上(shang)浪(lang)費(fei)太(tai)多(duo)時(shi)間(jian)。
但在某些情況下,我們希望跳過編譯,接下來將對此進行討論。
腳本語言
某些語言在執行時並未被直接編譯為機器碼,這些語言稱為腳本語言,包括JavaScript、Python 以及Ruby。在腳本語言中,代碼由解釋器而非CPU 執行,解釋器必須安裝在運行代碼的機器中。
jieshiqishishizhuanyibingzhixingdaima,yinciqiyunxingsudutongchangbibianyihoudedaimamandeduo。danlingyifangmian,chengxuyuansuishidounenglijiyunxingdaimaerwuxudengdaibianyiguocheng。
對於規模極大的項目,編譯可能耗時數小時之久。
Google 工程師必須不斷編譯大量代碼,導致程序員“損失”了很多時間(圖7-9)。由於需要保證編譯後的二進製文件有更好的性能,Google 無法切換到腳本語言。公司為此開發了Go 語言,它的編譯速度極快,同時仍然保持很高的性能。

反彙編與逆向工程
給定一個已編譯的計算機程序,無法在編譯之前恢複其源代碼。但我們可以對二進製程序解碼,將用於編碼CPU 指令的數字轉換為人類可讀的指令序列。這個過程稱為反彙編。
接下來,可以查看這些CPU zhiling,bingchangshifenxitamendeyongtu,zhejiushisuoweidenixianggongcheng。mouxiefanhuibianchengxuduizheyiguochengdayoubiyi,tamennengzidongjiancebingzhushixitongtiaoyongyuchangyonghanshu。jieyoufanhuibiangongju,heikeduierjinzhidaimadegegehuanjieleruzhizhang。woxiangxin,xuduodingjiandeIT 公司都設有秘密的逆向工程實驗室,以便研究競爭對手的軟件。
地下黑客經常分析Windows、Photoshop、《俠盜獵車手》等(deng)授(shou)權(quan)程(cheng)序(xu)中(zhong)的(de)二(er)進(jin)製(zhi)代(dai)碼(ma),以(yi)確(que)定(ding)哪(na)部(bu)分(fen)代(dai)碼(ma)負(fu)責(ze)驗(yan)證(zheng)軟(ruan)件(jian)許(xu)可(ke)證(zheng)。黑(hei)客(ke)將(jiang)二(er)進(jin)製(zhi)代(dai)碼(ma)修(xiu)改(gai),在(zai)其(qi)中(zhong)加(jia)入(ru)一(yi)條(tiao)指(zhi)令(ling),直(zhi)接(jie)跳(tiao)轉(zhuan)到(dao)驗(yan)證(zheng)許(xu)可(ke)證(zheng)後(hou)執(zhi)行(xing)的(de)代(dai)碼(ma)部(bu)分(fen)。運(yun)行(xing)修(xiu)改(gai)後(hou)的(de)二(er)進(jin)製(zhi)代(dai)碼(ma)時(shi),它(ta)在(zai)檢(jian)查(zha)許(xu)可(ke)證(zheng)前(qian)獲(huo)取(qu)注(zhu)入(ru)的(de)JUMP 命令,從而可以在沒有付費的情況下運行非法的盜版副本。
在秘密的政府情報機構中,同樣設有供安全研究人員與工程師研究iOS、Windows、IE 瀏liu覽lan器qi等deng流liu行xing消xiao費fei者zhe軟ruan件jian的de實shi驗yan室shi。他ta們men尋xun找zhao這zhe些xie程cheng序xu中zhong可ke能neng存cun在zai的de安an全quan漏lou洞dong,以yi防fang禦yu網wang絡luo攻gong擊ji或huo對dui高gao價jia值zhi目mu標biao的de入ru侵qin。在zai這zhe類lei攻gong擊ji中zhong,最zui知zhi名ming的de當dang屬shu“震網”病毒,它是美國與以色列情報機構研製的一種網絡武器。通過感染控製地下聚變反應堆的計算機,“震網”延緩了伊朗核計劃。
開源軟件
如前所述,我們可以根據二進製可執行文件分析有關程序的原始指令,但無法恢複用於生成二進製文件的原始源代碼。
在沒有原始源代碼的情況下,即使可以稍許修改二進製文件以便以較小的方式破解,實際上也無法對程序進行任何重大更改(如添加新功能)。一些人推崇協作構建代碼的方式,因此將自己的源代碼開放供他人修改。“開源”的主要概念就在於此:所有人都能自由使用與修改的軟件。基於Linux 的操作係統(如Ubuntu、Fedora 與Debian)是開源的,而Windows 與macOS 是閉源的。
開kai源yuan操cao作zuo係xi統tong的de一yi個ge有you趣qu之zhi處chu在zai於yu,任ren何he人ren都dou可ke以yi檢jian查zha源yuan代dai碼ma以yi尋xun找zhao安an全quan漏lou洞dong。現xian已yi證zheng實shi,政zheng府fu機ji構gou通tong過guo日ri常chang消xiao費fei者zhe軟ruan件jian中zhong未wei修xiu補bu的de安an全quan漏lou洞dong,對dui數shu百bai萬wan平ping民min進jin行xing利li用yong和he監jian視shi。
但對開源軟件而言,代碼受到的關注度更高,因此惡意的第三方與政府機構很難植入監控後門程序。使用macOS 或Windows 時,用戶必須相信Apple 或Microsoft duizijideanquanbuhuigouchengweihai,bingjinzuidanulifangzhirenheyanzhongdeanquanloudong。erkaiyuanxitongzhiyugongzhongdejianduzhixia,yincianquanloudongbeihushidekenengxingdaweijiangdi。
存儲器層次結構
我們知道,計算機的操作可以歸結為使CPU 執行簡單的指令,這些指令隻能對存儲在CPU 寄存器中的數據操作。但寄存器的存儲空間通常被限製在1000 字節以內,這意味著CPU 寄存器與RAM 之間必須不斷進行數據傳輸。
如果存儲器訪問速度過慢,CPU 將被迫處於空閑狀態,以等待RAM 完成數據傳輸。CPU 讀寫存儲器中數據所需的時間與計算機性能直接相關。提高存儲器速度有助於加快計算機運行,也可以提高CPU 訪問數據的速度。CPU 能以近乎實時的速度(一個周期以內)訪問存儲在寄存器中的數據,但訪問RAM 則慢得多。
對於時鍾頻率為1 GHz 的CPU,一個周期的持續時間約為十億分之一秒,這是光線從本書進入讀者眼中所需的時間。
處理器與存儲器之間的鴻溝
近年來的技術發展使得CPU 速度成倍增長。雖然存儲器速度同樣有所提高,但卻慢得多。CPU 與RAM 之間的這種性能差距稱為“處理器與存儲器之間的鴻溝”。我們可以執行大量CPU 指令,因此它們很“廉價”;而從RAM 獲取數據所需的時間較長,因此它們很“昂貴”。隨著兩者之間的差距逐漸增大,提高存儲器訪問效率的重要性越發明顯。

現代計算機需要大約1000 個CPU 周期(1 微秒左右) 從RAM 獲取數據。這種速度已很驚人,但與訪問CPU 寄存器的時間相比仍然較慢。減少計算所需的RAM 操作次數,是計算機科學家追求的目標。
在兩個麵對麵的人之間,聲波傳播需要大約10 微秒。
時間局部性與空間局部性
在嚐試盡量減少對RAM 的訪問時,計算機科學家開始注意到兩個事實。
◎ 時間局部性:訪問某個存儲地址時,可能很快會再次訪問該地址。
◎ 空間局部性:訪問某個存儲地址時,可能很快會訪問與之相鄰的地址。
因此,將這些存儲地址保存在CPU 寄存器中,有助於避免大部分對RAM的“昂貴”操作。不過在設計CPU xinpianshi,gongyegongchengshibingweizhaodaokexingdefangfalairongnazugouduodeneibujicunqi,dantamenrengranfaxianleruheyouxiaodiliyongshijianjubuxingyukongjianjubuxing。jiexialaijiangduicijinxingtaolun。
一級緩存
可以構建一種集成在CPU 內部且速度極快的輔助存儲器,這就是一級緩存。將數據從一級緩存讀入寄存器,僅比直接從寄存器獲取數據稍慢。
利用一級緩存,我們將可能訪問的存儲地址中的內容複製到CPU 寄存器附近,借此以極快的速度將數據載入CPU 寄存器。將數據從一級緩存讀入寄存器僅需大約10 個CPU 周期,速度是從RAM 獲取數據的近百倍。
借由10 KB 左右的一級緩存,並合理利用時間局部性與空間局部性,超過一半的RAM 訪問調用僅通過緩存就能實現。這一創新使計算技術發生了翻天覆地的變化。一級緩存可以極大縮短CPU 的等待時間,使CPU 將更多時間用於實際計算而非處於空閑狀態。
二級緩存
提高一級緩存的容量有助於減少從RAM 獲取數據的操作,進而縮短CPU 的等待時間。但是,增大一級緩存的同時也會降低它的速度。在一級緩存達到50 KB zuoyoushi,jixuzengjiaqirongliangjiuyaofuchujigaodechengben。genghaodefanganshigoujianyizhongchengweierjihuancundehuancun。erjihuancundesudushaoman,danrongliangbiyijihuancundadeduo。xiandaiCPU 配備的二級緩存約為200 KB,將數據從二級緩存讀入CPU 寄存器需要大約100 個CPU 周期。
我們將最有可能訪問的地址複製到一級緩存,較有可能訪問的地址複製到二級緩存。如果CPU 沒有在一級緩存中找到某個存儲地址,仍然可以嚐試在二級緩存中搜索。僅當該地址既不在一級緩存、也不在二級緩存中時,CPU 才需要訪問RAM。
目前,不少製造商推出了配備三級緩存的處理器。三級緩存的容量比二級緩存大,雖然速度不及二級緩存,但仍然比RAM 快得多。一級/ 二級/ 三級緩存非常重要,它們占據了CPU 芯片內部的大部分矽片空間。見圖7-11。

使用一級/ 二級/ 三級緩存能顯著提高計算機的性能。在配備200 KB的二級緩存後,CPU 發出的存儲請求中僅有不到10% 必須直接從RAM獲取。
讀者今後購買計算機時,對於所挑選的CPU,請記住比較一級/ 二級/三級緩存的容量。CPU 越好,緩存越大。一般來說,建議選擇一款時鍾頻率稍低但緩存容量較大的CPU。
第一級存儲器與第二級存儲器
ruqiansuoshu,jisuanjipeiyoubutongleixingdecunchuqi,tamenancengcijiegoupailie。xingnengzuihaodecunchuqirongliangyouxianqiechengbenjigao。yancengcijiegouxiangxia,keyongdecunchukongjianyuelaiyueduo,danfangwensuduyuelaiyueman。

在存儲器層次結構中,位於CPU 寄存器與緩存之下的是RAM,它負責存儲當前運行的所有進程的數據與代碼。截至2017 年,計算機配備的RAM 容量通常為1 GB 到10 GB。但在許多情況下,RAM 可能無法滿足操作係統以及所有運行程序的需要。
因此,我們必須深入探究存儲器層次結構,使用位於RAM 之下的硬盤。截至2017 年,計算機配備的硬盤容量通常為數百吉字節,足以容納當前運行的所有程序數據。如果RAM 已滿,當前的空閑數據將被移至硬盤以釋放部分內存空間。
問題在於,硬盤的速度非常慢,它一般需要100 萬個CPU 周期(1 毫秒)a 在磁盤與RAM 之間傳輸數據。從磁盤訪問數據看似很快,但不要忘記,訪問RAM 僅需1000 個周期,而訪問磁盤需要100 萬個周期。RAM 通常稱為第一級存儲器,而存儲程序與數據的磁盤稱為第二級存儲器。
標準照片在大約4 毫秒內捕捉光線。
CPU wufazhijiefangwendierjicunchuqi。zhixingbaocunzaidierjicunchuqizhongdechengxuzhiqian,bixujiangqifuzhidaodiyijicunchuqi。shijishang,meiciqidongjisuanjishi,jibianshicaozuoxitongyeyaocongcipanfuzhidaoRAM,否則CPU 無法運行。
確保RAM 永不枯竭 在典型活動期間,確保計算機處理的所有數據與程序都能載入RAM 至關重要,否則計算機將不斷在磁盤與RAM zhijianjiaohuanshuju。youyuzhexiangcaozuodesudujiman,jisuanjixingnengjiangyanzhongxiajiang,shenzhiwufashiyong。zhezhongqingkuangxia,jisuanjibudebuhuafeigengduoshijiandengdaishujuchuanshu,erwufajinxingshijidejisuan。
當計算機不斷將數據從磁盤讀入RAM 時,則稱計算機處於抖動模式。必須對服務器進行持續監控,如果服務器開始處理無法載入RAM 的de數shu據ju,那na麼me抖dou動dong可ke能neng會hui導dao致zhi整zheng個ge服fu務wu器qi崩beng潰kui。銀yin行xing或huo收shou銀yin機ji前qian將jiang因yin此ci排pai起qi長chang隊dui,而er服fu務wu員yuan除chu了le責ze怪guai發fa生sheng抖dou動dong的de計ji算suan機ji係xi統tong之zhi外wai別bie無wu他ta法fa。內nei存cun不bu足zu或huo許xu是shi導dao致zhi服fu務wu器qi故gu障zhang的de主zhu要yao原yuan因yin之zhi一yi。
外部存儲器與第三級存儲器
womenjixuyancunchuqicengcijiegouxiangxiafenxi。zailianjiedaowangluozhihou,jisuanjijiunengfangwenyouqitajisuanjiguanlidecunchuqi。tamenyaomeweiyubendiwangluo,yaomeweiyuyintewang(即雲端)。但訪問這些數據所需的時間更長:讀取本地磁盤需要1 毫秒,而獲取網絡中的數據可能耗時數百毫秒。網絡包從一台計算機傳輸到另一台計算機大約需要10 毫秒,如果經由因特網傳輸則需要200 毫秒到300 毫秒,與眨眼的時間相仿。
位於存儲器層次結構底部的是第三級存儲器,這種存儲設備並非總是在線與可用的。在盒式磁帶或CD 中存儲數百萬吉字節的數據成本較低,但訪問這類介質中的數據時,需要將介質插入某種讀取設備,這可能需要數分鍾甚至數天之久(不妨嚐試讓IT 部門在周五晚上備份磁帶中的數據……)。有鑒於此,第三級存儲器僅適合歸檔很少訪問的數據。
存儲技術的發展趨勢
一方麵,很難顯著改進“快速”存儲器(位於存儲器層次結構頂端)所用的技術;另一方麵,“慢速”存儲器的速度越來越快,價格也越來越低。幾十年來,硬盤存儲的成本一直在下降,這種趨勢似乎還將持續下去。
新技術也使磁盤的速度得以提高。人們正從旋轉磁盤轉向固態硬盤(SSD),它沒有動件,因而更快、更可靠且更省電。
采用SSD 技術的磁盤正變得越來越便宜且越來越快,但其價格仍然不菲。有鑒於此,一些製造商推出了同時采用SSD 與磁技術的混合磁盤。後者將訪問頻率較高的數據存儲在SSD 中,訪問頻率較低的數據存儲在速度較慢的磁盤中。當需要頻繁訪問原先不經常訪問的數據時,則將其複製到混合驅動器中速度較快的SSD。這與CPU 利用內部緩存提高RAM 訪問速度的技巧頗為類似。

小結
本文介紹了一些基本的計算機工作原理。任何可計算的事物都能采用簡單的指令來表示。為將複雜的計算命令轉換為CPU 可以執行的簡單指令,需要使用一種稱為編譯器的程序。計算機之所以能進行複雜計算,僅僅是因為CPU 可以執行大量基本操作。
計算機的處理器速度很快,但存儲器相對較慢。CPU 並(bing)非(fei)以(yi)隨(sui)機(ji)方(fang)式(shi)訪(fang)問(wen)存(cun)儲(chu)器(qi),而(er)是(shi)遵(zun)循(xun)空(kong)間(jian)局(ju)部(bu)性(xing)與(yu)時(shi)間(jian)局(ju)部(bu)性(xing)原(yuan)理(li)。因(yin)此(ci),可(ke)以(yi)將(jiang)訪(fang)問(wen)頻(pin)率(lv)較(jiao)高(gao)的(de)數(shu)據(ju)緩(huan)存(cun)在(zai)速(su)度(du)更(geng)快(kuai)的(de)存(cun)儲(chu)器(qi)中(zhong)。這(zhe)一(yi)原(yuan)則(ze)在(zai)多(duo)個(ge)級(ji)別(bie)的(de)緩(huan)存(cun)中(zhong)得(de)到(dao)了(le)應(ying)用(yong):從一級緩存直到第三級存儲器,不一而足。
本ben文wen討tao論lun的de緩huan存cun原yuan則ze可ke以yi應ying用yong於yu多duo種zhong場chang景jing。確que定ding應ying用yong程cheng序xu頻pin繁fan使shi用yong的de數shu據ju,並bing設she法fa提ti高gao這zhe部bu分fen數shu據ju的de訪fang問wen速su度du,是shi縮suo短duan計ji算suan機ji程cheng序xu運yun行xing時shi間jian的de最zui常chang用yong策ce略lve之zhi一yi。
——本文選自《計算機科學精粹》
本文來源:圖靈教育
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- e絡盟與Same Sky簽署全球分銷協議,拓展高性能元器件版圖
- 告別“偏色”煩惱:光譜傳感器如何重塑手機攝影的真實色彩
- 從“掃描”到“洞察”:Hyperlux ID iToF技術如何攻克30米測距極限
- 解鎖算力芯片的“速度密碼”:SmartDV全棧IP方案深度解析
- 發燒友福音!XMOS推出32段EQ調節與一鍵升頻功能
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
開關三極管
科通
可變電容
可調電感
可控矽
空心線圈
控製變壓器
控製模塊
藍牙
藍牙4.0
藍牙模塊
浪湧保護器
雷度電子
鋰電池
利爾達
連接器
流量單位
漏電保護器
濾波電感
濾波器
路由器設置
鋁電解電容
鋁殼電阻
邏輯IC
馬達控製
麥克風
脈衝變壓器
鉚接設備
夢想電子
模擬鎖相環



