表意文字描述字符

表意文字描述字符
Ideographic Description Characters
表意文字描述字符; Ideographic Description Characters
范围	U+2FF0..U+2FFF; （16个码位）
平面	基本多文种平面（BMP）
文字	通用（英语：Script (Unicode)#Special script property values）
已分配	16个码位
未分配	0个保留码位
来源标准	GBK
统一码版本历史
3.0	12 (+12)
15.1	16 (+4)
相关区块
	码表链接 ∣ 网页链接
	注释：

表意文字描述字符（英语：Ideographic Description Character，IDC）是一块收录描述表意文字（如汉字）结构的符号的Unicode区段，其中部分描述符号编码于其他区块。

目前大部分编码包含Unicode，处理汉字编码时大致是先搜集汉字，给予每个汉字一个数字编码。然而，汉字数量庞大，字集往往不完全；再加上汉字本身是开放组合，汉字的用户很可能自造新字，不可能有一个可以搜集到所有汉字的字集，所以用这些字符描述某“字”如何以较简单的部件组合起来。

码表

表意文字描述字符 Ideographic Description Characters ^[1]^[2] Unicode 联盟官方码表（PDF）
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+2FFx	⿰	⿱	⿲	⿳	⿴	⿵	⿶	⿷	⿸	⿹	⿺	⿻	⿼	⿽	⿾	⿿
注释 1. ^ 依据 Unicode 15.1

表意文字描述序列

表意文字描述序列（英语：Ideographic Description Sequence，IDS）是Unicode标准定义的汉字结构描述语法，描述序列由描述字符与两个以上特定字符（主要为汉字）组合而成，表示汉字的抽象结构。

Unicode定义了16种组合字符：

编码	字符	意义	例字	序列	例字	序列
U+2FF0	⿰	两部件由左至右组成	相	⿰木目	𠁢	⿰丨㇍
U+2FF1	⿱	两部件由上至下组成	杏	⿱木口	𠚤	⿱𠂊丶
U+2FF2	⿲	三部件由左至右组成	衍	⿲彳氵亍	𠂗	⿲丿夕乚
U+2FF3	⿳	三部件由上至下组成	京	⿳亠口小	𠋑	⿳亼目口
U+2FF4	⿴	两部件由外而内组成	回	⿴囗口	𠀬	⿴㐁人
U+2FF5	⿵	三面包围，下方开口	凰	⿵几皇	𧓉	⿵齊虫
U+2FF6	⿶	三面包围，上方开口	凶	⿶凵㐅	义	⿶乂丶
U+2FF7	⿷	三面包围，右方开口	匠	⿷匚斤	𧆬	⿷虎九
U+2FF8	⿸	两面包围，两部件由左上至右下组成	病	⿸疒丙	𤆯	⿸耂火
U+2FF9	⿹	两面包围，两部件由右上至左下组成	戒	⿹戈廾	𢧌	⿹或壬
U+2FFA	⿺	两面包围，两部件由左下至右上组成	超	⿺走召	𥘶	⿺礼分
U+2FFB	⿻	两部件重叠	巫	⿻工从	𣏃	⿻木⿻コ一
U+2FFC	⿼	三面包围，左方开口	㕚	⿼叉丶	𬺹	⿼コ二
U+2FFD	⿽	两面包围，两部件由右下至左上组成	氷	⿽水丶	斗	⿽⺀十
U+2FFE	⿾	水平翻转	卐	⿾卍	𣥄	⿾正
U+2FFF	⿿	旋转	𠕄	⿿凹	𠄔	⿿予

另有两个描述符号并不在此区块内：

编码	字符	区块	意义	例字	序列	例字	序列
U+303E	〾	中日韩符号和标点	形似但不相等	㬵 (U+3B35)	〾胶 (U+80F6)^[3]	𫜵	〾爫^[4]
U+31EF	㇯	中日韩笔画	减去笔画	乒	㇯兵丶	𧰨	㇯豕一

还有一个字符“⬚”，编码是U+2B1A，虽然名称只是“dotted square（点状虚线的正方形）”，但也常配合表意文字描述字符使用，指无法分割的整体字。

IDS的运算方式是前缀表示法，运算符在前，对应数量的操作数在后。这种方式不需使用括号等字符辅助即可无歧义地表示运算顺序。

统一码标准中，表意文字描述序列之定义如下：^[5]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3

按此，合规范的IDS必须由汉字、中日韩部首字符、中日韩笔画字符（U+31C0-U+31EF）、私人造字、全角问号字符（U+FF1F），以IDC连接而成。

限制

Unicode无定义汉字的唯一表述方式，依现行提案一汉字可用多种IDS表达，如“巫”可表示为“⿻工从”或“⿻工⿰人人”。
IDS主要目的在于表达汉字的抽象结构，而非像组合字符一样用于动态组字。现实绘制合体字字形时须考量许多复杂要素，光用IDS不足以绘出符合一般要求的合成字，例如合体字上下、左右比例往往并非1:1，而是按二部件的实际外形调整；左上－右下、三方包围等组合字的比例计算则更复杂；上下交叠的两部件也需要依赖对汉字的一般认识才能正确解读，例如“⿻工从”是将两个“人”放到“工”的左右两开口里，而非简单地将“工”和“从”上下叠合。

历史

以下文件记录了本区段中出现的字符的提议及定稿。

Unicode 版本	最终码位^[a]	码位数	UTC ID	L2 ID	WG2 ID	表意文字小组 ID	文档
3.0	U+2FF0..2FFB	12		X3L2/95-111	N1284		Ideographic Structure Symbol (additional request), 1995-11-07
					N1303 (html, doc （页面存档备份，存于互联网档案馆）)		Umamaheswaran, V. S.; Ksar, Mike, 8.13 Ideographic structure symbols, Minutes of Meeting 29, Tokyo, 1996-01-26
					N1348		Ideographic Components and Composition Scheme, 1996-02-05
					N1357		Revised Ideographic Structure Symbols, 1996-04-12
					N1353 （页面存档备份，存于互联网档案馆）		Umamaheswaran, V. S.; Ksar, Mike, 9, Draft minutes of WG2 Copenhagen Meeting # 30, 1996-06-25
				L2/97-026	N1494		IRG proposal: Ideographic structure character, 1996-06-27
					N1430	N365	Proposal Summary Form: Ideographic Structure Character, 1996-08-01
					N1453 （页面存档备份，存于互联网档案馆）		Ksar, Mike; Umamaheswaran, V. S., 9.6 Ideographic Structure Characters, WG 2 Minutes - Quebec Meeting 31, 1996-12-06
				L2/97-023	N1486	N437	IRG #8 Resolutions, 1997-01-16
					N1489		Supplement to Ideographic Components and Composition Schemes, 1997-01-16
					N1490	N436	Response to WG2 question on Ideographic Structure Characters, 1997-01-16
				L2/97-030	N1503 (pdf, doc （页面存档备份，存于互联网档案馆）)		Umamaheswaran, V. S.; Ksar, Mike, 9.6, Unconfirmed Minutes of WG 2 Meeting #32, Singapore; 1997-01-20--24, 1997-04-01
				L2/97-114	N1544 (html, doc （页面存档备份，存于互联网档案馆）)	N453	Sato, T. K., Questions on the "Han structure method" described in WG2 N1490 (IRG N436), 1997-04-08
				L2/97-255R			Aliprand, Joan, 4.B.2 Ideographic Structure Characters, Approved Minutes - UTC #73 & L2 #170 joint meeting, Palo Alto, CA - August 4-5, 1997, 1997-12-03
					N1680 （页面存档备份，存于互联网档案馆）		Project Sub-Division Proposal on Scheme of Ideograph Description Sequence, 1997-12-18
					N1782 （页面存档备份，存于互联网档案馆）		Clause X Ideographic Description Sequence (IDS) – IRG N575, 1998-05-06
				L2/98-158			Aliprand, Joan; Winkler, Arnold, SC2 SC2 Action re Ideographic Description Sequences, Draft Minutes - UTC #76 & NCITS Subgroup L2 #173 joint meeting, Tredyffrin, Pennsylvania, April 20-22, 1998, 1998-05-26
					N1842 （页面存档备份，存于互联网档案馆）		Proposed text for a Draft for amendment 28 - Ideographic Description Sequences, 1998-06-03
				L2/98-286	N1703 （页面存档备份，存于互联网档案馆）		Umamaheswaran, V. S.; Ksar, Mike, 9.5, Unconfirmed Meeting Minutes, WG 2 Meeting #34, Redmond, WA, USA; 1998-03-16--20, 1998-07-02, The original proposal was to use character composition. It has changed from being composition to description over its three year development.
				L2/98-317	N1892 (pdf, doc （页面存档备份，存于互联网档案馆）)		Combined CD registration and consideration ballot on WD for 10646-1/Amd. 28, AMENDMENT 28: Ideographic description characters, 1998-10-22
				L2/99-010	N1903 (pdf, html （页面存档备份，存于互联网档案馆）, doc （页面存档备份，存于互联网档案馆）)		Umamaheswaran, V. S., 10.3, Minutes of WG 2 meeting 35, London, U.K.; 1998-09-21--25, 1998-12-30
				L2/99-072.1	N1971 （页面存档备份，存于互联网档案馆）		Irish Comments on SC 2 N 3186, 1999-01-19
				L2/99-072	N1970 (html, doc （页面存档备份，存于互联网档案馆）)		Summary of Voting on SC 2 N 3186, PDAM ballot on WD for 10646-1/Amd. 28: Ideographic description characters, 1999-02-05
					N2023 （页面存档备份，存于互联网档案馆）		Paterson, Bruce, FPDAM 28 Text - Ideographic Description Characters, 1999-04-06
				L2/99-120			Text for FPDAM ballot of ISO/IEC 10646, Amd. 28 - Ideographic description characters, 1999-04-07
			UTC/1999-014				Jenkins, John, Recursion depth limit for IDC's, 1999-06-01
			UTC/1999-015				Whistler, Ken, Re: Brief note on length of ideograph descriptions, 1999-06-01
			UTC/1999-020				Jenkins, John, Diagram and language [for Ideograph Description Sequences], 1999-06-04
				L2/99-176R			Moore, Lisa, Recursion Limit for Ideographic Description Characters, Minutes from the joint UTC/L2 meeting in Seattle, June 8-10, 1999, 1999-11-04
				L2/99-232	N2003 （页面存档备份，存于互联网档案馆）		Umamaheswaran, V. S., 6.1.2 PDAM28 - Ideographic Description Characters, Minutes of WG 2 meeting 36, Fukuoka, Japan, 1999-03-09--15, 1999-08-03
				L2/99-253	N2067 （页面存档备份，存于互联网档案馆）		Summary of Voting on SC 2 N 3312, ISO 10646-1/FPDAM 28 - Ideographic description characters, 1999-08-19
				L2/99-301	N2123 （页面存档备份，存于互联网档案馆）		Disposition of Comments Report on SC 2 N 3312, ISO/IEC 10646-1/FPDAM 28, AMENDMENT 28: Ideographic description characters, 1999-09-20
				L2/99-302	N2124 （页面存档备份，存于互联网档案馆）		Paterson, Bruce, Revised Text for FDAM ballot of ISO/IEC 10646-1/FDAM 28, AMENDMENT 28: Ideographic description characters, 1999-09-24
				L2/00-010	N2103 （页面存档备份，存于互联网档案馆）		Umamaheswaran, V. S., 6.4.3, Minutes of WG 2 meeting 37, Copenhagen, Denmark: 1999-09-13--16, 2000-01-05
				L2/00-045			Summary of FDAM voting: ISO 10646 Amd. 28: Ideographic description characters, 2000-01-31
				L2/02-221	N2480 （页面存档备份，存于互联网档案馆）		Cook, Richard, Proposal to add Ideographic Description Characters (IDC) to the UCS, 2002-05-18
				L2/02-436	N2534 （页面存档备份，存于互联网档案馆）	N955	IRG Radical Classification, 2002-11-21
				L2/12-087			Proposed Changes to ISO/IEC 10646 Annex I, Ideographic Description Characters, 2012-02-09
				L2/12-007			Moore, Lisa, Consensus 130-C13, UTC #130 / L2 #227 Minutes, 2012-02-14, Submit L2/12-087 on extensions to ideographic description sequences to WG2.
				L2/15-065			Jenkins, John, Proposal to Add IDS Links to Online Unihan Database, 2015-02-02
				L2/15-070			Davis, Mark, IDS in Unihan, 2015-02-03
				L2/15-313			Lunde, Ken, Request for IDS Data, 2015-11-03
15.1	U+2FFC..2FFF	4		L2/17-386		N2273	Yang, Tao; Chan, Eiso; Wang, Yifan, Submission of 3 IDCes, 2017-10-13
				L2/17-379			Lunde, Ken, Proposed Ideographic Description Characters (IDCs), IRG #49 Liaison Report, 2017-10-20
				L2/18-012			Yang, Tao; Chan, Eiso; Wang, Yifan, Proposal of Four IDCs, 2018-01-05
				L2/18-168			Anderson, Deborah; Whistler, Ken; Pournader, Roozbeh; Moore, Lisa; Liang, Hai; Chapman, Chris; Cook, Richard, 22. IDCs, Recommendations to UTC #155 April-May 2018 on Script Proposals, 2018-04-28
				L2/21-118R		N2492	Lunde, Ken; Jenkins, John H., Preliminary proposal to add a new provisional kIDS property (Unihan), 2021-08-11
				L2/22-136			West, Andrew, Feedback on Proposals to Encode New Ideographic Description Characters, 2022-07-08
				L2/22-191		N2572	Lunde, Ken; Jenkins, John; West, Andrew, Proposal to encode five new Ideographic Description Characters, 2022-08-24
				L2/22-227			SAT Feedback to "Preliminary proposal to add a new provisional kIDS property (Unihan)" (IRGN2492) and "Proposal to encode five new Ideographic Description Characters" (IRGN2572), 2022-08-29
				L2/22-228			Fan, Ming, Feedback on IRGN2572 "Proposal to encode 5 new ideograph description characters", 2022-09-02
				L2/22-247			Lunde, Ken, 29, CJK & Unihan Group Recommendations for UTC #173 Meeting, 2022-11-01
				L2/22-241			Constable, Peter, E.1 29, Approved Minutes of UTC Meeting 173, 2022-11-09
^ 提案中建议的码位可能与最终码位不同。

另见

参考文献

^ Unicode character database. The Unicode Standard. [2016-07-09]. （原始内容存档于2017-09-25）.
^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. （原始内容存档于2016-06-29）.
^ 「㬵（U+3B35）」和「胶（U+80F6）」为什么在《康熙字典》收录了两次？ - 知乎. www.zhihu.com. [2023-09-21].
^ 基本集扩充字考（五・完结）附扩充块新增字考. 知乎专栏. [2023-09-21] （中文）.
^ The Unicode StandardVersion 6.0 – Core Specification (PDF). [2020-02-10]. （原始内容存档 (PDF)于2019-11-22）.

外部链接

Unicode的表意文字组合字符（页面存档备份，存于互联网档案馆）码位一览
Unicode的东亚文字处理（页面存档备份，存于互联网档案馆）
http://unicode.org/iuc/iuc18/papers/b16.ppt （页面存档备份，存于互联网档案馆）

[final-6] 提案中建议的码位可能与最终码位不同。

[1] Unicode character database. The Unicode Standard. [2016-07-09]. （原始内容存档于2017-09-25）.

[2] Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. （原始内容存档于2016-06-29）.

[3] 「㬵（U+3B35）」和「胶（U+80F6）」为什么在《康熙字典》收录了两次？ - 知乎. www.zhihu.com. [2023-09-21].

[4] 基本集扩充字考（五・完结）附扩充块新增字考. 知乎专栏. [2023-09-21] （中文）.

[5] The Unicode StandardVersion 6.0 – Core Specification (PDF). [2020-02-10]. （原始内容存档 (PDF)于2019-11-22）.

[cnote_a_grp_version] 统一码版本15.0

[cnote_b_grp_version] “〇”位于此区块，因而未统一化

[1]

[2]

[1]

[2]

[3]

[4]

[5]

[a]

[a]

[b]