泰米尔文字信息交换码
外观
维基百科,自由的百科全书
泰米尔文字信息交换码(英:Tamil Script Code for Information Interchange,TSCII),是一种针对泰米尔语的编码。当中开首的128个字符和ASCII一样;之后的128个字符使用来放置泰米尔字母的。
跟统一码不相同的地方在于:统一码的编码顺序是根据音节的逻辑顺序,和印度文字信息交换码一样;而此编码是根据实际的书写次序,以方便使用泰米尔文字打字机的用户,跟泰语的TIS 620标准一样。
现时泰米尔语的文字集合Project Madurai提供的免费文本都是采用泰米尔文字信息交换码,但最近已经开始把文本转为使用统一码编码。
编码表
[编辑]泰米尔文字信息交换码 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
8x | ௦ | ௧ | ஸ்ரீ | ஜ | ஷ | ஸ | ஹ | க்ஷ | ஜ் | ஷ் | ஸ் | ஹ் | க்ஷ் | ௨ | ௩ | ௪ |
9x | ௫ | ‘ | ’ | “ | ” | ௬ | ௭ | ௮ | ௯ | ஙு | ஞு | ஙூ | ஞூ | ௰ | ௱ | ௲ |
Ax | NBSP | ா | ி | ீ | ு | ூ | ெ | ே | ை | © | ௗ | அ | ஆ | ஈ | உ | |
Bx | ஊ | எ | ஏ | ஐ | ஒ | ஓ | ஔ | ஃ | க | ங | ச | ஞ | ட | ண | த | ந |
Cx | ப | ம | ய | ர | ல | வ | ழ | ள | ற | ன | டி | டீ | கு | சு | டு | ணு |
Dx | து | நு | பு | மு | யு | ரு | லு | வு | ழு | ளு | று | னு | கூ | சூ | டூ | ணூ |
Ex | தூ | நூ | பூ | மூ | யூ | ரூ | லூ | வூ | ழூ | ளூ | றூ | னூ | க் | ங் | ச் | ஞ் |
Fx | ட் | ண் | த் | ந் | ப் | ம் | ய் | ர் | ல் | வ் | ழ் | ள் | ற் | ன் | இ |
现时上表的位置80是U+0BE6 TAMIL DIGIT ZERO,在Unicode 4.1版本终已被收录;位置A0是NO-BREAK SPACE。位置AD和FF未有编码。
外部链接
[编辑]- TSCII主页 (页面存档备份,存于互联网档案馆)
- Unicode Technical Note #15 Text conversion From TSCII 1.7 to Unicode (页面存档备份,存于互联网档案馆)
- INFITT (International Forum for Information Technology in Tamil) (页面存档备份,存于互联网档案馆)