Unicode 常用問答 - 斷行

原文標(biāo)題:FAQ - Line Breaking

原文來源:

unicode.org


問:什么是“斷行"(自動(dòng)換行)

答:斷行就是計(jì)算機(jī)讓一長串文字自動(dòng)的換行,最后形成一個(gè)真實(shí)可見的段落。計(jì)算機(jī)通過算法來確定每一行的每一個(gè)字符是否可以斷行。一個(gè)簡單的例子就是。每當(dāng)你調(diào)整瀏覽器的窗口寬度時(shí),經(jīng)過斷行處理后,原先段落里的字符都會(huì)發(fā)生了變動(dòng),或者被擠到下一行開頭,或者變成了上一行的末尾,最后形成一個(gè)新的段落,而這個(gè)段落的每一行寬度都沒有超過段落的可見范圍。

問:Unicode 是否有關(guān)于斷行的標(biāo)準(zhǔn) ?

答:有。《Unicode Standard Annex #14, Unicode 斷行算法》 規(guī)定了使用于所有 Unicode 字符的斷行算法。相關(guān)文件介紹了 Unicode 字符對(duì)應(yīng)的斷行屬性。

問:為了使用 Unicode,是不是就必須完全遵循 UAX #14 標(biāo)準(zhǔn) ?

答: 不一定, UAX#14 算法是經(jīng)過仔細(xì)設(shè)計(jì)的,它可以適用于各種環(huán)境,但是更復(fù)雜的樣例就不行了。比如給長單詞自動(dòng)添加連字符然后斷行,就超出了這個(gè)算法的功能。所以不直接使用空格斷行的東南亞字符集就必須通過字典模塊逐個(gè)字符匹配,才能識(shí)別出當(dāng)前字符是否是可以斷行的。也就是說,用戶是被允許調(diào)整斷行算法,來達(dá)到某種需要的排版風(fēng)格。

問:那我可以隨意修改斷行規(guī)則么?

答:不能。因?yàn)橛行┳址某霈F(xiàn)就是為了表示這個(gè)地方可以斷行的。它們的行為必須和 Unicode 規(guī)定的一致。這一部分不能根據(jù)用戶需求修改的斷行規(guī)則, 具體可以看 Section 4 of UAX #14

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 注:本翻譯使用符號(hào)「」來突出某些可能會(huì)產(chǎn)生歧義的名詞。目前狀態(tài):勘誤中。 Unicode?標(biāo)準(zhǔn)附錄#9 UNICO...
    Eriice閱讀 2,388評(píng)論 0 1
  • Unicode?標(biāo)準(zhǔn)附錄#9 UNICODE雙向算法#### 摘要#### 本附件是一份關(guān)于字符定位的規(guī)范,主要描...
    Eriice閱讀 5,222評(píng)論 0 6
  • 在當(dāng)前這個(gè)時(shí)代(比如說公元2016年),如果你并不是在維護(hù)歷史遺留的文本處理代碼,沒有在每個(gè)地方都使用Unicod...
    縱橫而樂閱讀 2,862評(píng)論 3 16
  • 最近這段時(shí)間,心情是比較平靜的,平靜到那種,甚至連同一顆石子投進(jìn)都不帶起漣漪的那種。 話說這一年,體驗(yàn)了很多很多事...
    遇見子美一一閱讀 313評(píng)論 0 0
  • 腳疼 腳,你一定要挺住?。?馬上就到了?。? ...
    肖麗娟_閱讀 542評(píng)論 2 1

友情鏈接更多精彩內(nèi)容