字符編碼 ASCII碼 Unicode 漢字編碼 UTF-8

在讀 AFN 源碼時(shí),遇到了字符編碼的問(wèn)題, 這里做一個(gè)記錄

字符編碼 ASCII碼 Unicode 漢字編碼 UTF-8
ASCII碼: 一個(gè)字節(jié)表示 只占用了 7 bit 一共可以表示 128 個(gè)字符
可以表示所有的英文字符

非ASCII編碼: 除英語(yǔ)之外的其他語(yǔ)言 無(wú)法用ASCII碼 表示 稱為 非 ASII碼

Unicode: 世界上所有的符號(hào)都可以使用 Unicode碼表示

Unicode 雖然囊括了世界上所有的符號(hào) 但是 如何才能在電腦上顯示呢

UTF-8 : 互聯(lián)網(wǎng)上最流傳的 Unicode 編碼方式, 可使用 UTF-8 在電腦上顯示 Unicode 字符

漢字編碼:
GB2312 : 國(guó)標(biāo)碼 簡(jiǎn)體字
Big5 : 大五碼 繁體字
GBK : GB2312的升級(jí)版 包含簡(jiǎn)體字和繁體字

  • url 編碼(percentcode 百分號(hào)編碼)
    Url的編碼格式采用的是ASCII碼,而不是Unicode,這也就是說(shuō)你不能在Url中包含任何非ASCII字符,例如中文。否則如果客戶端瀏覽器和服務(wù)端瀏覽器支持的字符集不同的情況下,中文可能會(huì)造成問(wèn)題。

Url編碼的原則就是使用安全的字符(沒(méi)有特殊用途或者特殊意義的可打印字符)去表示那些不安全的字符。

RFC3986文檔規(guī)定,Url中只允許包含英文字母(a-zA-Z)、數(shù)字(0-9)、-_.~4個(gè)特殊字符以及所有保留字符。

Ruby character 標(biāo)注字符
比如 北京(bei jing) 用拼音來(lái)標(biāo)注漢字

Unicode U+FFFC
是一個(gè)可被替換字符,如可以用一個(gè)圖片來(lái)代替。
所以說(shuō),unicode中可以有非字符對(duì)象
https://en.wikipedia.org/wiki/Specials_(Unicode_block)#cite_note-2
http://blog.csdn.net/acorld/article/details/10063543

YYText
中列舉了幾乎所有的富文本屬性 demo 還有效果圖等,是學(xué)習(xí)coreText的神器啊

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 以天地之大,善惡之心,孰能盡知?且老子孤幼,漂泊海疆,一倉(cāng)載,孰輕孰重,不救為惡,救亦為惡,故人心之善忘,又豈在一...
    竹林醉翁閱讀 256評(píng)論 0 0
  • 我基本上每天都會(huì)逛微博,近幾天的微博熱議話題之一就是武漢的殺人事件,火車站附近一家面館老板與食客發(fā)生口角,老板當(dāng)場(chǎng)...
    老狼叔叔閱讀 417評(píng)論 0 3
  • 年底了,必須來(lái)說(shuō)說(shuō)每天陪伴我的老朋友--得到APP。 年底了,我想對(duì)得到APP說(shuō)聲:謝謝你。感謝并非是自己每天學(xué)習(xí)...
    夏花把時(shí)間當(dāng)朋友閱讀 280評(píng)論 0 1
  • 最近幾日胳膊不舒服,又累又煩,對(duì)丫頭缺少關(guān)照,再加上連著雨天,沒(méi)帶她出去玩,丫頭雖沒(méi)法用語(yǔ)言表達(dá)她的急躁與無(wú)奈,但...
    蘇夏閱讀 825評(píng)論 2 11
  • 2016-10-14 華杉 沒(méi)有學(xué)習(xí)誠(chéng)意的人,怎么教他都是錯(cuò),只有不搭理他,他或許還有一點(diǎn)點(diǎn)醒悟。孟子對(duì)滕更的方式...
    郁萍閱讀 583評(píng)論 0 0

友情鏈接更多精彩內(nèi)容