亚洲语言与字母支持C字符串变音符号和双向文本
C字符串预处理器是一个输入和输出文本字符串在IconEdit转换器。
输入处理器发现C字符串文本目录,使字体。
输出处理器修改C字符串使用正常的字体从左到右显示用最小的嵌入式处理器开销。
字体和转换后的C字符串可以直接使用从RAMTEX由编译器和显示驱动程序。
预处理程序C字符串可区别的,定向支持以下语言和字母:
- 阿拉伯语、阿萨姆邦的
- 孟加拉语,孟加拉语,BodoDogri Buginese
- 柬埔寨
- 达里语,梵文字母
- 波斯语
- 古吉拉特语,果鲁穆奇语
- 希伯来语、印地语
- Kusunda卡纳达语、克什米尔、高棉——刚卡尼语
- 老挝
- N 'Ko
- 迈蒂、马拉雅拉姆语、马拉地语、Meitei、缅甸
- 尼泊尔,Nihali
- Odia,奥里萨邦
- 波斯,旁遮普语
- 梵文、Santali信德语,僧伽罗语,叙利亚的
- Thaana泰米尔语、泰卢固语,泰国,西藏
- 乌尔都语
亚洲输入C字符串转换为十六进制字符,字母和经典8位文本
输入预处理器将C文本字符串转换为内部IconEdit 16位Unicode。
- utf - 8十六进制文本字符串转换为16位Unicode。
- utf - 16 16进制数字的字符串转换为16位Unicode。
- 转换为utf - 32十六进制数字高平面emoji Unicode替代字符字符串。
- 结合代理角色找到高平面emoji等字符。
- 高平面人物移动到16位Unicode的私人领域。
- 找到的字符组合、绑扎和附加符号组合字符。
- 查找和添加阿拉伯语表示字符。
- 经典的8位编码的文本字符串转换为16位Unicode。
输入转换后,IconEdit创建所有必要的字符作为一个字体的文本字符串。
在这个例子中IconEdit读取和转换一个C像伪代码文件只有两行:
wchar32 szSmile [] = {L”笑脸স্মাইলি\ U0001F603 !”};
wchar32 szCable [] = {L”缆车ಕೇಬಲ್ಕಾರು\ U0001F6A1 "};
输入转换器忽略了双引号外的东西。
由此产生的字体的文本字符串的优化:
输入转换器创建组合字符在私营领域E700 F8FF Unicode。
高平面Unicode字符如emoji可以称呼为16位或32位字符:
解决emoji 16位字符将会使你的文本占用更少的内存。
IconEdit总订单根据Unicode字符的字体按字母顺序。
新的Unicode字符值(代码点)所示每个字符。
自动显示了输入文本的字体:
只有内部的文本字符串的字体,其余为取向。
输出C字符串转换为变音符号和组合字符
基本特征和附加符号的组合输入字符串替换的字符在私营领域相结合。
- 查找和替换亚洲输入字符和附加符号组合字符。
- 显示亚洲字符仅仅与微控制器结合起来。
一个基本的角色+可区别的例子:
亚洲文本被编写为基本特征之后,没有一个或一些变音符号。
这就是亚洲文本存储在一个电脑:
基本特征的组合之后,变音符号被确定为组:
输出转换器的搜索匹配组合字符的字体:
然后文本转换的IconEdit正确显示输出转换器:
基本特征和附加符号的组合是一个字符组合。
转换后的文本字符串的输出文件是与字体和这两个应该是一起使用的编译器和显示。
C字符串输出变换器和双向文本提示字符
基本输入字符串中的字符替换表示字符的文本字符串和符号相反,如果必要的。
- 基本的阿拉伯语输入字符替换为表示字符。
- 解决中东双向字符和符号方向问题。
- 右到左字符串显示阿拉伯语表示字符。
一个双向的例子:
阿拉伯语的文本存储从左到右,但应该显示右到左:
文本分割的类型:
- 黑色是一位数,不采取行动是必要的。
- 红色是一个数学运算符,它应该反映。
- 蓝色是基本的阿拉伯语字符,他们应该在相反的顺序。
- 蓝色是基本的阿拉伯语字符,应该与表示字符替换根据他们的位置在这个词。
- 绿色是一种多位数,数字应该保持他们的订单。
与右到左的文本字符串字符从左到右显示的是相反的:
阿拉伯语的文本和数字显示右到左:
这就是输出转换器商店最终字符串。
输出C字符串转换为十六进制字符
IconEdit可以转换输入文本笑脸স্মাইলি\ U0001F603 !的以下输出格式:
- 笑脸\ xE700ই\ xE701 \ xE706 !纯Unicode与私人16位十六进制字符。这使得更容易阅读文本字符串人类但编译器没有区别。
- 笑脸\ xE700 \ x0987 \ xE701 \ xE706 !不能读Unicode utf - 16老十六进制编辑器。这仍然是Unicode编译器。
- 笑脸\ xEE \ x9C \ x80 \ xE0 \ xA6 \ x87 \ xEE \ x9C \ x81 \ xEE \ x9C \ x86 !utf - 8十六进制老8位编译器不能理解Unicode字符串。编译器,这是一个8位的经典文本。使用utf - 8选项RAMTEX驱动程序库来显示文本是Unicode。这种方式可以使用16位Unicode文本和字体由一个8位编译器。
内存消耗不同的字符串格式
utf - 16十六进制和Unicode使用2.0为正常的语言和字节每字符ROM空间4.0字节emoji和罕见的中国人和日本人的名字。
utf - 8十六进制每个字符占用不同数量的ROM空间取决于语言和字母:
- 1.0字节每字符:美式英语。
- 1.1 - 1.3字节每字符:其他语言用拉丁字母。
- 2.0 - 2.2字节每字符:其他欧洲和中东语言除了阿拉伯语。
- 2.6 - 2.9字节每字符:阿拉伯语和南亚洲语言。
- 3.0字节每字符:中国、日本、和韩国。
- 4.0字节每字符:Emoji和罕见的中国人和日本人的名字
C字符串格式之间的联系和文本文件格式
窗户可以保存纯文本在4个不同文件格式:
- ANSI 8位一个字节的经典8位编码256个字符一个字符数的语言。文本只是移植到数量有限的国家。
- Unicode小端字节16位先用最低有效字节2字节/字符的Unicode编码65536个字符的所有生活语言。文本是可移植的。
- Unicode大端字节16位两个字节每字符最低有效字节去年65536个字符的Unicode编码的生活语言。文本是可移植的。
- Unicode utf - 8日到24日一点每一至三字节字符的Unicode编码65536个字符的所有活着的语言。文本是可移植的。
IconEdit可以节省在4个不同的c源文本字符串字符串格式:
- Unicode 16位字符串文本和评论保持16位Unicode字符和保存Unicode文本文件。两个字符串和注释是可移植的。
- Unicode 16位十六进制文本字符串转换为16位十六进制字符和注释转换为一个典型的8位Windows或iso - 8859编码你的选择。字符串文本仍然是Unicode编译器,但封装在7位ASCII。字符串是可移植的。
- Unicode utf - 8日到24日十六进制文本字符串转换为utf - 8 8位十六进制字符和注释转换为一个典型的8位Windows或iso - 8859编码你的选择。字符串文本仍然是Unicode编译器,但封装在7位ASCII。字符串是可移植的。
- 经典的8位字符串文本和评论都转换为一个典型的8位DOS,窗户,或iso - 8859编码你的选择和保存为8位文本文件。字符串、字体和评论文本只是移植到数量有限的国家。
跟踪角色通过过程用鼠标帮助和蓝色的标志
蓝色标志可以设置鼠标并遵循角色通过所有窗户。
使用鼠标帮助在所有窗口看到如何创建和使用的字符。
字体用蓝色高亮选中的字符:
文本周围有蓝色框选中的字符。鼠标帮助有一个附加的文本长度指标可以看到文本是否符合目标显示:
输出文本与私人16位十六进制字符:
utf - 8十六进制输出文本,选定的字符占用3字节:
鼠标帮助和蓝色标志可以关闭,在任何时候。