win-utf解释
[root@release nginx]# more win-utf # This map is not a full windows-1251 <> utf8 map: it does not # contain Serbian and Macedonian letters. If you need a full map, # use contrib/unicode2nginx/win-utf map instead. charset_map windows-1251 utf-8 { 82 E2809A ; # single low-9 quotation mark 84 E2809E ; # double low-9 quotation mark 85 E280A6 ; # ellipsis 86 E280A0 ; # dagger 87 E280A1 ; # double dagger 88 E282AC ; # euro 89 E280B0 ; # per mille 91 E28098 ; # left single quotation mark 92 E28099 ; # right single quotation mark 93 E2809C ; # left double quotation mark 94 E2809D ; # right double quotation mark 95 E280A2 ; # bullet 96 E28093 ; # en dash 97 E28094 ; # em dash 99 E284A2 ; # trade mark sign A0 C2A0 ; # A1 D18E ; # capital Byelorussian short U A2 D19E ; # small Byelorussian short u A4 C2A4 ; # currency sign A5 D290 ; # capital Ukrainian soft G A6 C2A6 ; # borken bar A7 C2A7 ; # section sign A8 D081 ; # capital YO A9 C2A9 ; # (C) AA D084 ; # capital Ukrainian YE AB C2AB ; # left-pointing double angle quotation mark AC C2AC ; # not sign AD C2AD ; # soft hypen AE C2AE ; # (R) AF D087 ; # capital Ukrainian YI B0 C2B0 ; # ° B1 C2B1 ; # plus-minus sign B2 D086 ; # capital Ukrainian I B3 D196 ; # small Ukrainian i B4 D291 ; # small Ukrainian soft g B5 C2B5 ; # micro sign B6 C2B6 ; # pilcrow sign B7 C2B7 ; # · B8 D191 ; # small yo B9 E28496 ; # numero sign BA D194 ; # small Ukrainian ye BB C2BB ; # right-pointing double angle quotation mark BF D197 ; # small Ukrainian yi C0 D090 ; # capital A C1 D091 ; # capital B C2 D092 ; # capital V C3 D093 ; # capital G C4 D094 ; # capital D C5 D095 ; # capital YE C6 D096 ; # capital ZH C7 D097 ; # capital Z C8 D098 ; # capital I C9 D099 ; # capital J CA D09A ; # capital K CB D09B ; # capital L CC D09C ; # capital M CD D09D ; # capital N CE D09E ; # capital O CF D09F ; # capital P D0 D0A0 ; # capital R D1 D0A1 ; # capital S D2 D0A2 ; # capital T D3 D0A3 ; # capital U D4 D0A4 ; # capital F D5 D0A5 ; # capital KH D6 D0A6 ; # capital TS D7 D0A7 ; # capital CH D8 D0A8 ; # capital SH D9 D0A9 ; # capital SHCH DA D0AA ; # capital hard sign DB D0AB ; # capital Y DC D0AC ; # capital soft sign DD D0AD ; # capital E DE D0AE ; # capital YU DF D0AF ; # capital YA E0 D0B0 ; # small a E1 D0B1 ; # small b E2 D0B2 ; # small v E3 D0B3 ; # small g E4 D0B4 ; # small d E5 D0B5 ; # small ye E6 D0B6 ; # small zh E7 D0B7 ; # small z E8 D0B8 ; # small i E9 D0B9 ; # small j EA D0BA ; # small k EB D0BB ; # small l EC D0BC ; # small m ED D0BD ; # small n EE D0BE ; # small o EF D0BF ; # small p F0 D180 ; # small r F1 D181 ; # small s F2 D182 ; # small t F3 D183 ; # small u F4 D184 ; # small f F5 D185 ; # small kh F6 D186 ; # small ts F7 D187 ; # small ch F8 D188 ; # small sh F9 D189 ; # small shch FA D18A ; # small hard sign FB D18B ; # small y FC D18C ; # small soft sign FD D18D ; # small e FE D18E ; # small yu FF D18F ; # small ya }
文件 win-utf 是一个字符集映射文件,用于将 Windows-1251 编码转换为 UTF-8 编码。这个文件中包含了一系列的映射条目,每个条目将一个 Windows-1251 编码的字符映射到相应的 UTF-8 编码字符。该文件指出,它并不包含塞尔维亚和马其顿字母的完整映射,如果需要完整的映射,建议使用 contrib/unicode2nginx/win-utf 文件。
以下是部分条目的解释:
字符映射详解
- 82 E2809A:单低-9引号(single low-9 quotation mark)。
- 84 E2809E:双低-9引号(double low-9 quotation mark)。
- 85 E280A6:省略号(ellipsis)。
- 86 E280A0:剑号(dagger)。
- 87 E280A1:双剑号(double dagger)。
- 88 E282AC:欧元符号(euro sign)。
- 89 E280B0:每千符号(per mille sign)。
Cyrillic 字符
- A1 D18E:大写白俄罗斯短 U(capital Byelorussian short U)。
- A2 D19E:小写白俄罗斯短 u(small Byelorussian short u)。
- A5 D290:大写乌克兰软 G(capital Ukrainian soft G)。
- A8 D081:大写俄文字母 Ё(capital YO)。
- AA D084:大写乌克兰 YE(capital Ukrainian YE)。
- AF D087:大写乌克兰 YI(capital Ukrainian YI)。
其他符号和标点
- 91 E28098:左单引号(left single quotation mark)。
- 92 E28099:右单引号(right single quotation mark)。
- 93 E2809C:左双引号(left double quotation mark)。
- 94 E2809D:右双引号(right double quotation mark)。
- 95 E280A2:项目符号(bullet)。
- 96 E28093:短破折号(en dash)。
- 97 E28094:长破折号(em dash)。
特殊符号和货币符号
- 99 E284A2:商标符号(trade mark sign)。
- A0 C2A0:不断开空格(non-breaking space)。
- A4 C2A4:货币符号(currency sign)。
- A6 C2A6:破折号(broken bar)。
- A7 C2A7:节选符(section sign)。
- A9 C2A9:版权符号(copyright sign)。
- AE C2AE:注册商标符号(registered trademark sign)。
这些映射是在 Web 服务器和 Web 应用之间处理不同语言和符号时非常重要,确保正确显示和处理文本数据。