計(jì)算機(jī)中信息的編碼 在計(jì)算機(jī)中,各種信息都是以二進(jìn)制編碼的形式存在的;也就是說,不管是文字、圖形、聲音、動(dòng)畫,還是電影等各種信息,在計(jì)算機(jī)中都是以0和1組成的二進(jìn)制代碼表示的;計(jì)算機(jī)之所以能區(qū)別這些信息的不同,是因?yàn)樗鼈儾捎玫木幋a規(guī)則不同.比如:同樣是文字,英文字母與漢字的編碼規(guī)則就不同,英文字母用的是單字節(jié)的ASCII碼,漢字采用的是雙字節(jié)的漢字內(nèi)碼;但隨著需求的變化,這兩種編碼有被統(tǒng)一的UNICODE碼(由Unicode 協(xié)會(huì)開發(fā)的能表示幾乎世界上所有書寫語言的字符編碼標(biāo)準(zhǔn))所取代的趨勢;當(dāng)然圖形、聲音等的編碼就更復(fù)雜多樣了.這也就告訴我們,信息在計(jì)算機(jī)中的二進(jìn)制編碼是一個(gè)不斷發(fā)展的、高深的、跨學(xué)科的知識(shí)領(lǐng)域. 1、字符(英文,包括字母、數(shù)字、標(biāo)點(diǎn)、運(yùn)算符等)編碼 字符的編碼采用國際通用的ASCII碼(American Standard Code for Information Interchange,美國信息交換標(biāo)準(zhǔn)代碼),每個(gè)ASCII碼以1個(gè)字節(jié)(Byte)儲(chǔ)存,從0到數(shù)字127代表不同的常用符號(hào),例如大寫A的ASCII碼是65,小寫a則是97.由于ASCII碼只用了字節(jié)的七個(gè)位,最高位并不使用,所以后來又將最高的一個(gè)位也編入這套編碼碼中,成為八個(gè)位的延伸ASCII(ExtendedASCII)碼,這套內(nèi)碼加上了許多外文和表格等特殊符號(hào),成為目前常用的編碼.基本的ASCII字符集共有128個(gè)字符,其中有96個(gè)可打印字符,包括常用的字母、數(shù)字、標(biāo)點(diǎn)符號(hào)等,另外還有32個(gè)控制字符.標(biāo)準(zhǔn)ASCII碼使用7個(gè)二進(jìn)位對字符進(jìn)行編碼,對應(yīng)的ISO標(biāo)準(zhǔn)為ISO646標(biāo)準(zhǔn).下表展示了基本ASCII字符集及其編碼: 字母和數(shù)字的ASCII碼的記憶是非常簡單的.我們只要記住了一個(gè)字母或數(shù)字的ASCII碼(例如記住A為65,0的ASCII碼為48),知道相應(yīng)的大小寫字母之間差32,就可以推算出其余字母、數(shù)字的ASCII碼. 雖然標(biāo)準(zhǔn)ASCII碼是7位編碼,但由于計(jì)算機(jī)基本處理單位為字節(jié)(1byte = 8bit),所以一般仍以一個(gè)字節(jié)來存放一個(gè)ASCII字符.每一個(gè)字節(jié)中多余出來的一位(最高位)在計(jì)算機(jī)內(nèi)部通常保持為0(在數(shù)據(jù)傳輸時(shí)可用作奇偶校驗(yàn)位).由于標(biāo)準(zhǔn)ASCII字符集字符數(shù)目有限,在實(shí)際應(yīng)用中往往無法滿足要求.為此,國際標(biāo)準(zhǔn)化組織又制定了ISO2022標(biāo)準(zhǔn),它規(guī)定了在保持與ISO646兼容的前提下將ASCII字符集擴(kuò)充為8位代碼的統(tǒng)一方法.ISO陸續(xù)制定了一批適用于不同地區(qū)的擴(kuò)充ASCII字符集,每種擴(kuò)充ASCII字符集分別可以擴(kuò)充128個(gè)字符,這些擴(kuò)充字符的編碼均為高位為1的8位代碼(即十進(jìn)制數(shù)128~255),稱為擴(kuò)展ASCII碼.下表展示的是最流行的一套擴(kuò)展ASCII字符集和編碼: 2、漢字的編碼 (1)漢字內(nèi)碼 漢字信息在計(jì)算機(jī)內(nèi)部也是以二進(jìn)制方式存放.由于漢字?jǐn)?shù)量多,用一個(gè)字節(jié)的128種狀態(tài)不能全部表示出來,因此在1980年我國頒布的《信息交換用漢字編碼字符集——基本集》,即國家標(biāo)準(zhǔn)GB2312-80方案中規(guī)定用兩個(gè)字節(jié)的十六位二進(jìn)制表示一個(gè)漢字,每個(gè)字節(jié)都只使用低7位(與ASCII碼相同),即有128×128=16384種狀態(tài).由于ASCII碼的34個(gè)控制代碼在漢字系統(tǒng)中也要使用,為不致發(fā)生沖突,不能作為漢字編碼,128除去34只剩94種,所以漢字編碼表的大小是94×94=8836,用以表示國標(biāo)碼規(guī)定的7445個(gè)漢字和圖形符號(hào). 每個(gè)漢字或圖形符號(hào)分別用兩位的十進(jìn)制區(qū)碼(行碼)和兩位的十進(jìn)制位碼(列碼)表示,不足的地方補(bǔ)0,組合起來就是區(qū)位碼.把區(qū)位碼按一定的規(guī)則轉(zhuǎn)換成的二進(jìn)制代碼叫做信息交換碼(簡稱國標(biāo)碼).國標(biāo)碼共有漢字6763個(gè)(一級(jí)漢字,是最常用的漢字,按漢語拼音字母順序排列,共3755個(gè);二級(jí)漢字,屬于次常用漢字,按偏旁部首的筆劃順序排列,共3008個(gè)),數(shù)字、字母、符號(hào)等682個(gè),共7445個(gè). 由于國標(biāo)碼不能直接存儲(chǔ)在計(jì)算機(jī)內(nèi),為方便計(jì)算機(jī)內(nèi)部處理和存儲(chǔ)漢字,又區(qū)別于ASCII碼,將國標(biāo)碼中的每個(gè)字節(jié)在最高位改設(shè)為1,這樣就形成了在計(jì)算機(jī)內(nèi)部用來進(jìn)行漢字的存儲(chǔ)、運(yùn)算的編碼叫機(jī)內(nèi)碼(或漢字內(nèi)碼,或內(nèi)碼).內(nèi)碼既與國標(biāo)碼有簡單的對應(yīng)關(guān)系,易于轉(zhuǎn)換,又與ASCII碼有明顯的區(qū)別,且有統(tǒng)一的標(biāo)準(zhǔn)(內(nèi)碼是惟一的). (2)漢字外碼 無論是區(qū)位碼或國標(biāo)碼都不利于輸入漢字,為方便漢字的輸入而制定的漢字編碼,稱為漢字輸入碼.漢字輸入碼屬于外碼.不同的輸入方法,形成了不同的漢字外碼.常見的輸入法有以下幾類: 按漢字的排列順序形成的編碼(流水碼):如區(qū)位碼; 按漢字的讀音形成的編碼(音碼):如全拼、簡拼、雙拼等; 按漢字的字形形成的編碼(形碼):如五筆字型、鄭碼等; 按漢字的音、形結(jié)合形成的編碼(音形碼):如自然碼、智能ABC. 輸入碼在計(jì)算機(jī)中必須轉(zhuǎn)換成機(jī)內(nèi)碼,才能進(jìn)行存儲(chǔ)和處理. (3)漢字字形碼 為了將漢字在顯示器或打印機(jī)上輸出,把漢字按圖形符號(hào)設(shè)計(jì)成點(diǎn)陣圖,就得到了相應(yīng)的點(diǎn)陣代碼(字形碼). 全部漢字字碼的集合叫漢字字庫.漢字庫可分為軟字庫和硬字庫.軟字庫以文件的形式存放在硬盤上,現(xiàn)多用這種方式,硬字庫則將字庫固化在一個(gè)單獨(dú)的存儲(chǔ)芯片中,再和其它必要的器件組成接口卡,插接在計(jì)算機(jī)上,通常稱為漢卡. 用于顯示的字庫叫顯示字庫.顯示一個(gè)漢字一般采用16×16點(diǎn)陣或24×24點(diǎn)陣或48×48點(diǎn)陣.已知漢字點(diǎn)陣的大小,可以計(jì)算出存儲(chǔ)一個(gè)漢字所需占用的字節(jié)空間.例:用16×16點(diǎn)陣表示一個(gè)漢字,就是將每個(gè)漢字用16行,每行16個(gè)點(diǎn)表示,一個(gè)點(diǎn)需要1位二進(jìn)制代碼,16個(gè)點(diǎn)需用16位二進(jìn)制代碼(即2個(gè)字節(jié)),共16行,所以需要16行×2字節(jié)/行=32字節(jié),即16×16點(diǎn)陣表示一個(gè)漢字,字形碼需用32字節(jié). 即:字節(jié)數(shù)=點(diǎn)陣行數(shù)×點(diǎn)陣列數(shù)/8 用于打印的字庫叫打印字庫,其中的漢字比顯示字庫多,而且工作時(shí)也不像顯示字庫需調(diào)入內(nèi)存. 可以這樣理解,為在計(jì)算機(jī)內(nèi)表示漢字而統(tǒng)一的編碼方式形成漢字編碼叫內(nèi)碼(如國標(biāo)碼),內(nèi)碼是惟一的.為方便漢字輸入而形成的漢字編碼為輸入碼,屬于漢字的外碼,輸入碼因編碼方式不同而不同,是多種多樣的.為顯示和打印輸出漢字而形成的漢字編碼為字形碼,計(jì)算機(jī)通過漢字內(nèi)碼在字模庫中找出漢字的字形碼,實(shí)現(xiàn)其轉(zhuǎn)換.\x0d很不錯(cuò)哦,你可以試下
x瞌qeéi睽侉ju〓簪椹vx瞌l◥g15047710612011-9-12 15:19:50
國標(biāo)GB2312-80中收集的一級(jí)、二級(jí)常用漢字都是按拼音字母順序排列的嗎?
國標(biāo)GB2312-80中收集的一級(jí)、二級(jí)常用漢字都是按拼音字母順序排列的嗎?
語文人氣:989 ℃時(shí)間:2019-10-11 19:52:07
優(yōu)質(zhì)解答
我來回答
類似推薦
- 在漢字系統(tǒng)中,我國國標(biāo)漢字一律是按拼音順序排列的
- 利用標(biāo)準(zhǔn)ascii碼表示一個(gè)英文字母和利用國標(biāo)gb2312-80碼表示一個(gè)漢字,分別需要幾個(gè)二進(jìn)制位
- 按漢語拼音字母表順序排列大寫字母
- 在漢字系統(tǒng)中,我國國標(biāo)漢字一律是按拼音順序排列的.
- 漢語拼音字母表A B C D……的標(biāo)準(zhǔn)讀法是什么
- 草字頭+佳 是什么字
- empty what is full,fill what is empty! 永遠(yuǎn)不讓自己空虛,永遠(yuǎn)不讓自己自滿 給點(diǎn)點(diǎn)評
- 16S rRNA基因通用引物1492r/F27,1492和27分別是什么意思?編號(hào)么?
- 用短除法分解素因素:42 81 40
- 在長1.6米,寬1.2米的長方形三合板上,裁出半徑是20厘米的圓,最多可裁多少個(gè)?
- 線性代數(shù) 設(shè)A,B,C均為n階矩陣,I為n階單位矩陣,且ABC=I,則下列矩陣乘積一定等于I的是哪個(gè)?
- 試以下面的方程為例,敘述用分離變量法求解方程的步驟.
猜你喜歡
- 1每天堅(jiān)持朗讀對學(xué)外語有什么好處?
- 2You are yuji?急.
- 3思密達(dá)到底是什么意思
- 4計(jì)算(a的立方-b的立方)+ab(a-3b)-2(b的立方-a的平方b)
- 5求寫英語書面表達(dá)
- 6油酸的作用是什么
- 7請幫忙翻譯:Payment and and Charging
- 8近紅外區(qū)的吸收光譜代表什么含義?
- 9大正方形邊長為15cm,小正方形邊長為10cm.求陰影甲的面積比陰影乙的面積大多少平
- 10有甲乙丙三種文具,若購甲2件,乙1件、丙3件共需23元,若夠甲1件、乙4件、丙5件共需36元,問夠甲一件,乙2件,丙3件共需多少元
- 11Jack has a dog and so have I.____dog and____had a fight
- 12英語翻譯