代码页437
外观
代码页437(Code page 437)是始祖IBM PC(个人电脑)或MS-DOS使用的字符编码。又名为CP437、OEM 437[1] PC-8[2]、或MS-DOS Latin US[3]。该字集包含ASCII由32–126的字码、附加符号、一些希腊字母、图标以及制图符号。其有时也称为“OEM字体”或“high ASCII”或“extended ASCII”[2](互不兼容的众多ASCII扩展字集之一)。
严格来说,此字符集并非打算用来做什么“代码页”;而只不过是在当时的IBM PC用来图像化的表现字形而已。此字符集仍然是所有EGA以及VGA兼容显卡核心的主要字体。当电脑开机时,在加载任何存储媒体之前所使用的就是此“代码页”。[4]。大多数在IBM PC时代开发的文件格式,例如.nfo,都是内定以此为默认编码。
显卡
[编辑]最初的IBM PC以每个字符9×14像素的形式存储在MDA显卡旳只读存储器,以及以每个字符8×8像素的形式存储在CGA显卡。EGA包含的是8×14像素的版本,而VGA包含的是9×16像素的版本。
此等显卡全都有文字模式,当中每个字符方块包含8位的字符码位,亦即提供一共256个字符。所有256个码位都分配予只读存储器中的图像字符,当中0至31的码位保留予ASCII用作非图像控制字符。
代码页
[编辑]代码页有两个主要功:
- 作为信息交换码(以文件和电讯形式),当中0至127码位担当的角式与ASCII的相同,而128至175码位代表国际文字字符(见下表);
- 作为用于屏幕和打印机的图像资源(该字符可用于显示或打印),整段256个码位范围都可用作图像字符。
字符
[编辑]以下字表显示代码页437的字符。每个字符同时显示其对应的Unicode码位及其十进制值。
1–31和127码位的解读
[编辑]1–31和127码位(00–1Fhex和7Fhex)可用作控制或图像字符,视情况而定。[5]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | ☺ 263A 1 |
☻ 263B 2 |
♥ 2665 3 |
♦ 2666 4 |
♣ 2663 5 |
♠ 2660 6 |
• 2022 7 |
◘ 25D8 8 |
○ 25CB 9 |
◙ 25D9 10 |
♂ 2642 11 |
♀ 2640 12 |
♪ 266A 13 |
♫ 266B 14 |
☼ 263C 15 | |
1_ | ► 25BA 16 |
◄ 25C4 17 |
↕ 2195 18 |
‼ 203C 19 |
¶ 00B6 20 |
§ 00A7 21 |
▬ 25AC 22 |
↨ 21A8 23 |
↑ 2191 24 |
↓ 2193 25 |
→ 2192 26 |
← 2190 27 |
∟ 221F 28 |
↔ 2194 29 |
▲ 25B2 30 |
▼ 25BC 31 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
7_ | ⌂ 2302 127 |
标准代码页
[编辑]_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 0 |
SOH 0001 1 |
STX 0002 2 |
ETX 0003 3 |
EOT 0004 4 |
ENQ 0005 5 |
ACK 0006 6 |
BEL 0007 7 |
BS 0008 8 |
HT 0009 9 |
LF 000A 10 |
VT 000B 11 |
FF 000C 12 |
CR 000D 13 |
SO 000E 14 |
SI 000F 15 |
1_ | DLE 0010 16 |
DC1 0011 17 |
DC2 0012 18 |
DC3 0013 19 |
DC4 0014 20 |
NAK 0015 21 |
SYN 0016 22 |
ETB 0017 23 |
CAN 0018 24 |
EM 0019 25 |
SUB 001A 26 |
ESC 001B 27 |
FS 001C 28 |
GS 001D 29 |
RS 001E 30 |
US 001F 31 |
2_ | SP 0020 32 |
! 0021 33 |
" 0022 34 |
# 0023 35 |
$ 0024 36 |
% 0025 37 |
& 0026 38 |
' 0027 39 |
( 0028 40 |
) 0029 41 |
* 002A 42 |
+ 002B 43 |
, 002C 44 |
- 002D 45 |
. 002E 46 |
/ 002F 47 |
3_ | 0 0030 48 |
1 0031 49 |
2 0032 50 |
3 0033 51 |
4 0034 52 |
5 0035 53 |
6 0036 54 |
7 0037 55 |
8 0038 56 |
9 0039 57 |
: 003A 58 |
; 003B 59 |
< 003C 60 |
= 003D 61 |
> 003E 62 |
? 003F 63 |
4_ | @ 0040 64 |
A 0041 65 |
B 0042 66 |
C 0043 67 |
D 0044 68 |
E 0045 69 |
F 0046 70 |
G 0047 71 |
H 0048 72 |
I 0049 73 |
J 004A 74 |
K 004B 75 |
L 004C 76 |
M 004D 77 |
N 004E 78 |
O 004F 79 |
5_ | P 0050 80 |
Q 0051 81 |
R 0052 82 |
S 0053 83 |
T 0054 84 |
U 0055 85 |
V 0056 86 |
W 0057 87 |
X 0058 88 |
Y 0059 89 |
Z 005A 90 |
[ 005B 91 |
\ 005C 92 |
] 005D 93 |
^ 005E 94 |
_ 005F 95 |
6_ | ` 0060 96 |
a 0061 97 |
b 0062 98 |
c 0063 99 |
d 0064 100 |
e 0065 101 |
f 0066 102 |
g 0067 103 |
h 0068 104 |
i 0069 105 |
j 006A 106 |
k 006B 107 |
l 006C 108 |
m 006D 109 |
n 006E 110 |
o 006F 111 |
7_ | p 0070 112 |
q 0071 113 |
r 0072 114 |
s 0073 115 |
t 0074 116 |
u 0075 117 |
v 0076 118 |
w 0077 119 |
x 0078 120 |
y 0079 121 |
z 007A 122 |
{ 007B 123 |
| 007C 124 |
} 007D 125 |
~ 007E 126 |
DEL 007F 127 |
8_ | Ç 00C7 128 |
ü 00FC 129 |
é 00E9 130 |
â 00E2 131 |
ä 00E4 132 |
à 00E0 133 |
å 00E5 134 |
ç 00E7 135 |
ê 00EA 136 |
ë 00EB 137 |
è 00E8 138 |
ï 00EF 139 |
î 00EE 140 |
ì 00EC 141 |
Ä 00C4 142 |
Å 00C5 143 |
9_ | É 00C9 144 |
æ 00E6 145 |
Æ 00C6 146 |
ô 00F4 147 |
ö 00F6 148 |
ò 00F2 149 |
û 00FB 150 |
ù 00F9 151 |
ÿ 00FF 152 |
Ö 00D6 153 |
Ü 00DC 154 |
¢ 00A2 155 |
£ 00A3 156 |
¥ 00A5 157 |
₧ 20A7 158 |
ƒ 0192 159 |
A_ | á 00E1 160 |
í 00ED 161 |
ó 00F3 162 |
ú 00FA 163 |
ñ 00F1 164 |
Ñ 00D1 165 |
ª 00AA 166 |
º 00BA 167 |
¿ 00BF 168 |
⌐ 2310 169 |
¬ 00AC 170 |
½ 00BD 171 |
¼ 00BC 172 |
¡ 00A1 173 |
« 00AB 174 |
» 00BB 175 |
B_ | ░ 2591 176 |
▒ 2592 177 |
▓ 2593 178 |
│ 2502 179 |
┤ 2524 180 |
╡ 2561 181 |
╢ 2562 182 |
╖ 2556 183 |
╕ 2555 184 |
╣ 2563 185 |
║ 2551 186 |
╗ 2557 187 |
╝ 255D 188 |
╜ 255C 189 |
╛ 255B 190 |
┐ 2510 191 |
C_ | └ 2514 192 |
┴ 2534 193 |
┬ 252C 194 |
├ 251C 195 |
─ 2500 196 |
┼ 253C 197 |
╞ 255E 198 |
╟ 255F 199 |
╚ 255A 200 |
╔ 2554 201 |
╩ 2569 202 |
╦ 2566 203 |
╠ 2560 204 |
═ 2550 205 |
╬ 256C 206 |
╧ 2567 207 |
D_ | ╨ 2568 208 |
╤ 2564 209 |
╥ 2565 210 |
╙ 2559 211 |
╘ 2558 212 |
╒ 2552 213 |
╓ 2553 214 |
╫ 256B 215 |
╪ 256A 216 |
┘ 2518 217 |
┌ 250C 218 |
█ 2588 219 |
▄ 2584 220 |
▌ 258C 221 |
▐ 2590 222 |
▀ 2580 223 |
E_ | α 03B1 224 |
ß 00DF 225 |
Γ 0393 226 |
π 03C0 227 |
Σ 03A3 228 |
σ 03C3 229 |
µ 00B5 230 |
τ 03C4 231 |
Φ 03A6 232 |
Θ 0398 233 |
Ω 03A9 234 |
δ 03B4 235 |
∞ 221E 236 |
φ 03C6 237 |
ε 03B5 238 |
∩ 2229 239 |
F_ | ≡ 2261 240 |
± 00B1 241 |
≥ 2265 242 |
≤ 2264 243 |
⌠ 2320 244 |
⌡ 2321 245 |
÷ 00F7 246 |
≈ 2248 247 |
° 00B0 248 |
∙ 2219 249 |
· 00B7 250 |
√ 221A 251 |
ⁿ 207F 252 |
² 00B2 253 |
■ 25A0 254 |
NBSP 00A0 255 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F |
除了0至31(00hex至1Fhex)可用作ASCII控制码及图像dingbat以外,某些字符也有多于一个意义。对应的Unicode有可能多于一个,视情况而定:
- 0和255(FFhex)都会产生空格;32(20hex)也是。将255用作U+00A0不换行空格(NBSP)在IBM PC时代的文字处理软件已有先例。
- 176至223(B0hex至DFhex)为方框绘制字符
- 225(E1hex)是德文的sharp S(U+00DF, ß),也是希腊文的小阶beta(U+03B2, β)。
- 227(E3hex)是希腊文小阶的pi(U+03C0, π),但早期的字体,例如Terminal使用的字体并不明确,有可能是希腊文大阶的pi(U+03A0, Π),也可以是“n次积符号”(U+220F, ∏)。
- 228(E4hex)是“n次叠加符号”(U+2211, ∑),也是希腊文大写的sigma(U+03A3, Σ)。
- 230(E6hex)是微的符号(U+00B5, µ),也是希腊文小写的mu(U+03BC, μ)。
- 234(EAhex)是欧姆符号(U+2126, Ω),也是希腊文大写的omega(U+03A9, Ω)。(Unicode将欧姆符号等同大写omega,并建议两种情况都用后者)[7]).
- 235(EBhex)是希腊文小写delta(U+03B4, δ),但也用作冰岛文小写的 eth(U+00F0, ð)和偏微分符号(U+2202, ∂)的替代品。
- 237(EDhex)应当用作希腊文小写的phi,但现在主要用作空集符号(U+2205, ),还用作用来表示角度的斜体希腊文phi符号(U+03D5, )、直径符号(U+2300, )以及拉丁文小写“带斜线的小写O”(U+00F8, ø)的替代品。
- 238(EEhex)既是希腊文小写的epsilon(U+03B5, ε),也是element-of符号(U+2208, ∈)。后来还用作欧元符号(U+20AC, €)。
另见
[编辑]参考资料
[编辑]- ^ 1.0 1.1 OEM 437. Go Global Developer Center. Microsoft. [22 Sep 2011]. (原始内容存档于2016-06-09).
- ^ 2.0 2.1 OEM font. Encyclopedia. PCmag.com. [15 Nov 2011]. (原始内容存档于2012-10-13).
- ^ Code Page 437 MS-DOS Latin US. Developing International Software. Microsoft. [14 Nov 2011]. (原始内容存档于2016-03-17).
- ^ 东欧、阿拉伯以及亚洲使用的电脑可能会用不同的字集。“OEM”,即“原始设备制造商(original equipment manufacturer)”代表该制造商在只读存储器(ROM)提供的“原生”硬件字符集,以符合不同市场的要求。
- ^ 00437. Code pages by CPGID. IBM. [14 Nov 2011]. (原始内容存档于2016-06-09).
- ^ cp437_DOSLatinUS to Unicode table (TXT). The Unicode Consortium. [14 Nov 2011]. (原始内容存档于2016-06-09).
- ^ The Unicode Consortium, The Unicode Standard 4.0, Chapter 7, "European Alphabetic Scripts", p176. PDF version (页面存档备份,存于互联网档案馆)
外部链接
[编辑]- IBM Code Page 437 reference chart[失效链接]
- IBM PC memory-mapped video graphics to Unicode(页面存档备份,存于互联网档案馆) on official Unicode site