中文资讯交换码

CCCII / EACC
	汉字圆在CCCII中的位置和字型，包含了正体字、简体字、异体字、日本汉字的写法
语言	汉语、日语、韩语
标准	MARC-8（英语：MARC-8）（机读编目格式标准）、ANSI/NISO Z39.64
现状	主要为图书馆系统使用
分类	基于ISO/IEC 2022结构用于中日韩文字的三字节字元集（TBCS）; 机读编目格式标准的日、阿拉伯、中、韩、波斯、希伯来、意第绪文字（JACKPHY ）
	查; 论; 编;

中文资讯交换码（Chinese Character Code for Information Interchange，简称CCCII），又名全汉字标准交换码^[1]，是由中华民国政府发展的字符集和编码方案，由获得中研院中美科学学术合作委员会与文建会（后升格为文化部）赞助的“国字整理小组”（全名为：资讯应用国字整理小组）所提出^[2]。开发目的是将其作为中文交换码，使中文资讯交换更加便利。

此交换码每个字用三个字节存储，在节约空间方面不如大五码，又不像中文标准交换码成为官方标准，所以未被电脑业界广泛采纳^[3]。香港各大学图书馆在2003年由旧有的CCCII系统换成UTF-8^[4]^[5]。故现仅台湾和美国仍在使用，且只用于大学图书馆的线上目录检索系统。

简介

1979年，加州斯坦福大学召开一场筹划东亚图书馆自动化的会议，希望订定中文交换码的标准作为自动化之根据，以解决使用电脑处理东亚语文资料的问题。那时的汉字码标准只有日本产业规格订定的JIS C6226，但由于日本汉字的数目、字型皆与中文有相当程度的差异，难以作为代表，经台湾和美国东亚图书馆华裔与会者强力反对后，决定先搁置决议，由台湾代表谢清俊在次年三月亚洲研究学会年会，提出台湾方面的汉字编码方案互作比较^[6]^[1]。

谢清俊教授返国后，上书政务委员李国鼎及国科会、中研院中美科学学术合作委员会（简称中美会）等单位，集合国内一批文字学家、图书馆学家及计算机科学家，组成“中文资讯处理研究用字小组”（1985年其国字整理组从中美会转至文建会，改名为资讯应用国字整理小组），共同整理中文文字，并解决中文资讯处理的技术问题。其中，字码编定的部分由谢清俊、张仲陶、杨键樵、黄克东教授负责，文字审查工作则有潘重规、周骏富、周何、何佑森、金祥恒等教授参与，并由王振鹄、张鼎锺等教授担任中文资讯交换码审查小组的成员^[7]。

台湾于次届亚洲学会年会上，提出共4,808字的“中文资讯交换码”；“中文资讯交换码”的架构为美方接受，但要求扩大编码字集。“国字整理小组”在1981年完成第二批，包括17,032个正体字、11,517个异体字；1987年再发表第三批，包括20,583个正体字。前后二次共计扩编至53,940个汉字字码，并完成64×64，32×32的机读字型；此外，为了方便电脑上的文字处理，又编制了“中国文字数据库”(Chinese Character Database，简称CCDB)，其中列出每个字属性如部首、笔画、读音以及各种对应和输入码^[6]。

CCCII后来获得美国国会图书馆认可，称为东亚文字码（East Asian Character Code，EACC），并于1989年纳入美国国家标准（编号：ANSI/NISO Z39.64）。CCCII并已被OCLC和RLIN（Research Libraries Information Network）用作中日韩文的书目字码标准^[8]。

“国字整理小组”从1979至1989十年间，共计整理、搜集了75,684个汉字（正体字44,167、异体字31,517）^[7]。随着张仲陶教授在1997年去世，以及谢清俊教授将发展方向转往汉字构形数据库，CCCII已停止维护、更新^[9]^[10]。

编码结构

该编码以三个字节来代表一个中文字，每字节为7位元，并根据ISO 2022规格以94×94×94的编码空间安放字符，最多可收纳830,584个。

一个94×94的编码空间称为面（Plane）。CCCII共有94个面。以6个面组合成为1个层（Layer）。因此CCCII共有16个层，除第16层仅含4面外，其余各层均含有6个面（即15×6+4=94）。这16个层相叠，形成一个向下延伸的三度空间，由此形成关联。

第1个层放置正体字（正体字按常用、备用、罕用的顺序分群并依序排列，各字群再按先部首、次笔画数、最后笔顺的次序排列）；第2至第13个层，放置异体字，其中第2层专放简体字，第13层放置日文汉字。这样的三度空间设计使检索某一汉字的异体字变得容易，如：強、强、彊三字的后两个字节是一样的^[11]。

另见

注释

^ ^1.0 ^1.1 中文字集字碼簡介/ 編目組 - 東吳大學圖書館 (PDF). [2022-12-18]. （原始内容存档 (PDF)于2022-12-26）.
^ 谢清俊; 黄克东. 國字整理小組十年. 资讯应用国字整理小组. 1989: 29-34.
^ 多管齊下，徹底解決罕用字問題. ithome. [2022-12-20]. （原始内容存档于2022-12-20）.
^ （英文） Unicode Project（Library, City University of Hong Kong）（页面存档备份，存于互联网档案馆）
^ （英文） Unicode Migration（Library, Chinese University of Hong Kong）（页面存档备份，存于互联网档案馆）
^ ^6.0 ^6.1 認識全字庫- 中文碼介紹. [2022-12-18]. （原始内容存档于2021-05-14）.
^ ^7.0 ^7.1 宋建成. 國家圖書館故事. 卷二, 館藏發展與整理. 2020: 113 [2022-12-18]. （原始内容存档于2022-12-18）.
^ 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange，簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-18]. （原始内容存档于2022-12-18）.
^ Ken Lunde. CJKV Information Processing. O'Reilly Media. 2009: 123 [2022-12-20]. （原始内容存档于2022-12-20）.
^ 中央研究院資訊科學研究所 20 週年慶特刊謝清俊先生之簡介與訪談簡要. [2022-12-20]. （原始内容存档于2020-10-20）.
^ 来源参考：（中文）中文资讯交换码，国字计划小组，主编人张仲陶

外部链接

[東吳大學圖書館-1] 1.0 ^1.1 中文字集字碼簡介/ 編目組 - 東吳大學圖書館 (PDF). [2022-12-18]. （原始内容存档 (PDF)于2022-12-26）.

[國字整理小組-2] 谢清俊; 黄克东. 國字整理小組十年. 资讯应用国字整理小组. 1989: 29-34.

[3] 多管齊下，徹底解決罕用字問題. ithome. [2022-12-20]. （原始内容存档于2022-12-20）.

[4] （英文） Unicode Project（Library, City University of Hong Kong）（页面存档备份，存于互联网档案馆）

[5] （英文） Unicode Migration（Library, Chinese University of Hong Kong）（页面存档备份，存于互联网档案馆）

[全字庫-6] 6.0 ^6.1 認識全字庫- 中文碼介紹. [2022-12-18]. （原始内容存档于2021-05-14）.

[宋建成-7] 7.0 ^7.1 宋建成. 國家圖書館故事. 卷二, 館藏發展與整理. 2020: 113 [2022-12-18]. （原始内容存档于2022-12-18）.

[曾世熊-8] 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange，簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-18]. （原始内容存档于2022-12-18）.

[9] Ken Lunde. CJKV Information Processing. O'Reilly Media. 2009: 123 [2022-12-20]. （原始内容存档于2022-12-20）.

[10] 中央研究院資訊科學研究所 20 週年慶特刊謝清俊先生之簡介與訪談簡要. [2022-12-20]. （原始内容存档于2020-10-20）.

[11] 来源参考：（中文）中文资讯交换码，国字计划小组，主编人张仲陶

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

查论编字符编码
早期电信	电报电码（英语：Telegraph code）库克与惠斯通（英语：Cooke and Wheatstone telegraph）摩斯非拉丁字母（英语：Morse code for non-Latin alphabets）日文（英语：Wabun code）中文西里尔字母（英语：Russian Morse code）韩文（英语：SKATS）博多与莫瑞 Fieldata（英语：Fieldata） ASCII ISO/IEC 646 BCDIC（英语：BCD (character encoding)）电传文讯（英语：Teletex）与电传视讯（英语：Videotex）／电视资讯 T.51/ISO/IEC 6937（英语：T.51/ISO/IEC 6937） ITU T.61（英语：ITU T.61） ITU T.101（英语：Videotex character set）世界系统电传文讯（英语：World System Teletext）字元集（英语：Teletext character set）
ISO/IEC 8859	现行 -1（西欧语言） -2（中欧语言） -3（马耳他文／世界文） -4（北欧语言） -5（西里尔字母） -6（阿拉伯文） -7（希腊文） -8（希伯来文） -9（土耳其文） -10（北日耳曼语支） -11（泰文） -13（波罗的语族） -14（凯尔特语族） -15（新西欧语言） -16（罗马尼亚文）废止 -12（梵文）提议 KOI-8西里尔字母（英语：ISO-IR-111）萨米文（英语：ISO-IR-197）改编威尔士文（英语：ISO-IR-182）巴伦支西里尔字母（英语：ISO-IR-200）爱沙尼亚文（英语：Code page 922）乌克兰西里尔字母（英语：Code page 1124）
书目	MARC-8（英语：MARC-8） ANSEL（英语：ANSEL）中文资讯交换码 ISO 5426（英语：ISO 5426） ISO 5427（英语：ISO 5427） ISO 5428（英语：ISO 5428） ISO 6438 ISO 6862（英语：ISO 6862）
国家标准	ArmSCII BraSCII（英语：BraSCII）中文标准交换码 DIN 66003（英语：DIN 66003） ELOT 927（英语：ELOT 927） GOST 10859（英语：GOST 10859） GB 2312 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212（英语：JIS X 0212） JIS X 0213（英语：JIS X 0213） KOI-7（英语：KOI-7） KPS 9566 KS X 1001 KS X 1002（英语：KS X 1002） LST 1564（英语：LST 1564） LST 1590-4（英语：LST 1590-4） PASCII Shift JIS SI 960（英语：SI 960） TIS-620（英语：Thai Industrial Standard 620-2533） TSCII VISCII（英语：VISCII） VSCII YUSCII（英语：YUSCII）
ISO/IEC 2022	ISO/IEC 8859 ISO/IEC 10367（英语：ISO/IEC 10367） EUC ISO-IR-165
macOS代码页	亚美尼亚文（英语：Mac OS Armenian）阿拉伯文巴伦支西里尔字母（英语：Mac OS Barents Cyrillic）凯尔特语族（英语：Mac OS Celtic）中欧语言克罗地亚文（英语：Mac OS Croatian encoding）西里尔字母（英语：Mac OS Cyrillic encoding）梵文波斯文（英语：MacFarsi encoding）字体X（英语：Macintosh Font X encoding）盖尔文（英语：Mac OS Gaelic）乔治亚文（英语：Mac OS Georgian）希腊文（英语：MacGreek encoding）古吉拉特文（英语：Mac OS Gujarati）古木基文（英语：Mac OS Gurmukhi）希伯来文（英语：Mac OS Hebrew）冰岛文（英语：Mac OS Icelandic encoding）因纽特文（英语：Mac OS Inuit）键盘（英语：Mac OS Keyboard encoding）拉丁文（英语：Macintosh Latin encoding）马耳他文／世界文（英语：Mac OS Maltese/Esperanto encoding）欧甘字母（英语：Mac OS Ogham）罗曼语族罗马尼亚文（英语：Mac OS Romanian encoding）萨米文（英语：Mac OS Sámi）土耳其文（英语：Mac OS Turkish encoding）土耳其西里尔字母（英语：Mac OS Turkic Cyrillic）乌克兰文（英语：Mac OS Ukrainian encoding） VT100（英语：VT100 encoding）
DOS代码页	437 668（英语：Code page 668） 708（英语：Code page 708） 720（英语：Code page 720） 737（英语：Code page 737） 770（英语：Code page 770） 773（英语：Code page 773） 775（英语：Code page 775） 776（英语：Code page 776） 777（英语：Code page 777） 778（英语：Code page 778） 850（英语：Code page 850） 851（英语：Code page 851） 852（英语：Code page 852） 853（英语：Code page 853） 855（英语：Code page 855） 856（英语：Code page 856） 857（英语：Code page 857） 858（英语：Code page 858） 859（英语：Code page 859） 860（英语：Code page 860） 861（英语：Code page 861） 862（英语：Code page 862） 863（英语：Code page 863） 864（英语：Code page 864） 865（英语：Code page 865） 866（英语：Code page 866） 867（英语：Code page 867） 868（英语：Code page 868） 869（英语：Code page 869） 897（英语：Code page 897） 899（英语：Code page 899） 903（英语：Code page 903） 904（英语：Code page 904） 932（英语：Code page 932 (IBM)） 936（英语：Code page 936 (IBM)） 942（英语：Code page 942） 949（英语：Code page 949 (IBM)） 950 951（英语：Code page 951） 1040（英语：Code page 1040） 1042（英语：Code page 1042） 1043（英语：Code page 1043） 1046（英语：Code page 1046） 1098（英语：Code page 1098） 1115（英语：Code page 1115） 1116（英语：Code page 1116） 1117（英语：Code page 1117） 1118（英语：Code page 1118） 1127（英语：Code page 1127） 3846（英语：Code page 3846） ABICOMP（英语：ABICOMP character set） CS Indic（英语：CS Indic character set） CSX Indic（英语：CSX Indic character set） CSX+ Indic（英语：CSX+ Indic character set） CWI-2（英语：CWI-2）伊朗系统（英语：Iran System encoding）卡梅尼茨（英语：Kamenický encoding）马索维亚（英语：Mazovia encoding） MIK（英语：MIK (character set)）
IBM AIX代码页	895（英语：Code page 895） 896（英语：Code page 896） 912（英语：Code page 912） 915（英语：Code page 915） 921（英语：Code page 921） 922（英语：Code page 922） 1006（英语：Code page 1006） 1008（英语：Code page 1008） 1009（英语：Code page 1009） 1010（英语：Code page 1010） 1012（英语：Code page 1012） 1013（英语：Code page 1013） 1014（英语：Code page 1014） 1015（英语：Code page 1015） 1016（英语：Code page 1016） 1017（英语：Code page 1017） 1018（英语：Code page 1018） 1019（英语：Code page 1019） 1124（英语：Code page 1124） 1133（英语：Code page 1133）
Microsoft Windows代码页（英语：Windows code page）	CER-GS（英语：CER-GS） 932（英语：Code page 932 (Microsoft Windows)） 936 GBK 950 1169（英语：Code page 1169） Extended Latin-8（英语：Extended Latin-8） 1250（英语：Windows-1250） 1251（英语：Windows-1251） 1252 1253（英语：Windows-1253） 1254（英语：Windows-1254） 1255（英语：Windows-1255） 1256（英语：Windows-1256） 1257（英语：Windows-1257） 1258（英语：Windows-1258） 1270（英语：Windows-1270）西里尔字母+芬兰文（英语：Windows Cyrillic + Finnish）西里尔字母+法文（英语：Windows Cyrillic + French）西里尔字母+德文（英语：Windows Cyrillic + German）希腊语变音符号（英语：Windows Polytonic Greek）
EBCDIC代码页	37（英语：Code page 37） EBCDIC中的日文（英语：Japanese language in EBCDIC） DKOI（英语：DKOI）
DEC终端机（VTx（英语：VT220））	MCS（英语：Multinational Character Set） NRCS（英语：National Replacement Character Set）加拿大法文（英语：Code page 1020）瑞士文（英语：Code page 1021）西班牙文（英语：Code page 1023）英国英文（英语：Code page 1101）荷兰文（英语：Code page 1102）芬兰文（英语：Code page 1103）法文（英语：Code page 1104）挪威文／丹麦文（英语：Code page 1105）瑞典文（英语：Code page 1106）挪威文／丹麦文（替代）（英语：Code page 1107） 8位元希腊文（英语：Code page 1287） 8位元土耳其文（英语：Code page 1288） SI 960（英语：SI 960）希伯来文（英语：DEC Hebrew）特殊图形（英语：DEC Special Graphics）技术（英语：DEC Technical Character Set）
特定平台	1057（英语：Code page 1057） Acorn（英语：RISC OS character set） Adobe标准（英语：PostScript Standard Encoding） Adobe Latin 1（英语：PostScript Latin 1 Encoding） Amstrad CPC（英语：Amstrad CPC character set） Apple II（英语：Apple II character set）雅达利资讯交换标准码（英语：ATASCII）雅达利ST（英语：Atari ST character set） BICS（英语：Bitstream International Character Set）卡西欧计算机（英语：Casio calculator character sets） CDC（英语：CDC display code） Compucolor II（英语：Compucolor II character set） CP/M+（英语：Amstrad CP/M Plus character set） DEC RADIX 50（英语：DEC RADIX 50） DEC MCS（英语：Multinational Character Set）/NRCS（英语：National Replacement Character Set） DG国际（英语：DG International） Fieldata（英语：Fieldata） GEM（英语：GEM character set） GSM 03.38（英语：GSM 03.38） HP Roman（英语：HP Roman） HP FOCAL（英语：FOCAL character set） HP RPL（英语：RPL character set） SQUOZE（英语：SQUOZE） LICS（英语：Lotus International Character Set） LMBCS（英语：Lotus Multi-Byte Character Set） MSX（英语：MSX character set） NEC APC（英语：NEC APC character set） NeXT（英语：NeXT character set） PETSCII（英语：PETSCII） SEGA SC-3000（英语：Sega SC-3000 character set）夏普计算机（英语：Sharp pocket computer character sets）夏普MZ（英语：Sharp MZ character set）辛克莱QL（英语：Sinclair QL character set）符号电传文讯（英语：Teletext character set）德州仪器计算机（英语：TI calculator character sets） TRS-80（英语：TRS-80 character set）文图拉国际（英语：Ventura International） WISCII（英语：Wang International Standard Code for Information Interchange） XCCS（英语：Xerox Character Code Standard） ZX80（英语：ZX80 character set） ZX81（英语：ZX81 character set） ZX Spectrum（英语：ZX Spectrum character set）
Unicode及通用字符集	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC（英语：UTF-EBCDIC） GB 18030 BOCU-1 CESU-8 SCSU TACE16（英语：Tamil All Character Encoding） Unicode编码比较（英语：Comparison of Unicode encodings）
TeX排版系统	科克（英语：Cork encoding） LY1（英语：LY1 encoding） OML（英语：OML encoding） OMS（英语：OMS encoding） OT1（英语：OT1 encoding）
其他代码页	ABICOMP（英语：ABICOMP character set） ASMO 449（英语：ASMO 449）大五码 APL符号数位编码（英语：Digital encoding of APL symbols） ISO-IR-68（英语：ISO-IR-68） ARIB STD-B24 HZ（英语：HZ (character encoding)） IEC-P27-1（英语：IEC-P27-1） INIS 7位元（英语：INIS character set） INIS-8（英语：8位元） ISO-IR-169（英语：ISO-IR-169） ISO 2033（英语：ISO 2033） KOI -R -RU（英语：KOI8-RU） -U 今昔文字镜 SEASCII（英语：Stanford Extended ASCII） Stanford/ITS（英语：Stanford/ITS character set） TRON（英语：TRON (encoding)）统合韩文代码（英语：Unified Hangul Code）
控制字符	摩斯电码专用代码（英语：Prosigns for Morse code） C0与C1控制字符 ISO/IEC 6429 JIS X 0211（英语：JIS X 0211） Unicode控制字符空白字元
相关条目	CCSID（英语：CCSID） HTML字符编码字符集探测中日韩统一表意文字硬件代码页（英语：Hardware code page）磁性墨水字元识别码（英语：Magnetic ink character recognition）乱码中文乱码可变宽度编码
字元集