字符集和字符编码 有的认为就按效率特异化编码,有的认为应标准化 摩斯码 长短组合 博多码 5位一字符,先通知字符种类 EDSAC 5位一字符,shift切换,内容和博多码不同。用5孔纸带 ASCII 7位 EBCDIC IBM,8位 ISO-xxx 区域化 魔术注释符 告诉语言处理器编码,特殊记号事先写明 Unicode 统一 字符串 C语言一字符8位,定义字符为ASCII或EBCDIC。字符串不知长度,nul字符终止,没nul时可能内存中越界读取 Pascal一字符8位,带长度 Java一字符16位, 定义字符为Unicode Python2 ASCII码环境下,字符当作ASCII码,可以自动转换成Unicode Python3中""是Unicode码, b""是字节列串,要显示转换类型,否则报错 Ruby一字符8位,追加编码信息