Unicode

統(tǒng)一碼/國際通用碼(Unicode)為文字系統(tǒng)數(shù)字編碼之業(yè)界標(biāo)準(zhǔn),由統(tǒng)一碼/國際通用碼聯(lián)盟(Unicode Consortium),全球網(wǎng)頁有一半以上是用Unicode編碼。

Unicode是萬維網(wǎng)網(wǎng)頁標(biāo)準(zhǔn)的基礎(chǔ),最大的好處就是對於每一個(gè)字元提供了一個(gè)跨平臺(tái)語言與程式的統(tǒng)一數(shù)碼。使原來不同語言文字符號(hào)無法在同一文件中出現(xiàn),和用戶遇到亂碼的問題獲得基本解決。

Unicode編碼

將人類自然語言的書寫文字符號(hào)轉(zhuǎn)換成數(shù)字機(jī)器能處理的“0”和“1”進(jìn)行編碼
一般而言,Unicode編碼的書寫表達(dá)形式以U+開頭,接16進(jìn)制符

由于各國各地方的的字符集標(biāo)準(zhǔn)不一,導(dǎo)致不同語言符號(hào)無法在同一文件顯示,為此需要Unicode Consortium對其進(jìn)行額外的轉(zhuǎn)換
此外,由于編碼之間的相容性及應(yīng)用程序如瀏覽器的支援不一,會(huì)發(fā)生編碼錯(cuò)誤以致顯示內(nèi)容不正確,又稱亂碼(Mojibake),或甚致是安全漏洞。為此需要Unicode的出現(xiàn),統(tǒng)一數(shù)字編碼

Unicode聯(lián)盟中有一數(shù)據(jù)庫——CLDR(通用區(qū)域資料庫),協(xié)助設(shè)備處理世界上所有的語言,為不同的語言和國家提供的術(shù)語和格式 ,Unicode CLDR數(shù)據(jù)庫存有不少數(shù)據(jù),可以使用XML或JSON格式取用

Unicode與Emoji

表情符號(hào)(Emoji)是一種象形文字 (圖案符號(hào)),用來表達(dá)各式各樣的東西。Unicode Emoji的支援則需要廠商提供對映的Unicode字型。

例如微笑(Grinning Face)的表情符號(hào)??
不同的廠商提供不同的Unicode字型,微笑的表情符號(hào)呈現(xiàn)的效果也不同
??Grinning Face的多種效果

Unicode與文化政治

任何東西的發(fā)展都難以與文化政治脫軌,Unicode自然也是

文化
  • Unicode發(fā)展史上以及多語互聯(lián)網(wǎng)上,Unicode支持東亞主要的語言
  • Unicode的一個(gè)重要的里程碑是統(tǒng)一漢字
    統(tǒng)一漢字(Unihan)的特點(diǎn)在于,如是幾種語言共享的符號(hào)且經(jīng)同意,是共享同一編碼,專用的漢字則否
政治
  • 2016年,由於美國槍支暴力的問題,Apple把其槍支的表情符號(hào)改成水槍。
  • 為了促進(jìn)性別平等,2016年Unicode 的Emoji委員會(huì)同意加入11個(gè)表情符號(hào),可以搭配不同的姓別及膚色,排列組合可以產(chǎn)出百多馀的表情符號(hào)

Unicode作為非盈利機(jī)構(gòu),其的成功讓電腦使用進(jìn)入了一個(gè)新紀(jì)元,并應(yīng)用于很多新技術(shù)。Unicode的運(yùn)作模式就猶如眾包模式,讓大眾都能參與其中,從中獲利與提升價(jià)值。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容