• 字符集和字符编码
    • 有的认为就按效率特异化编码,有的认为应标准化
    • 摩斯码
      • 长短组合
    • 博多码
      • 5位一字符,先通知字符种类
    • EDSAC
      • 5位一字符,shift切换,内容和博多码不同。用5孔纸带
    • ASCII
    • ISO-xxx
      • 区域化
      • 魔术注释符
        • 告诉语言处理器编码,特殊记号事先写明
    • Unicode
      • 统一
  • 字符串
    • C语言一字符8位,定义字符为ASCII或EBCDIC。字符串不知长度,nul字符终止,没nul时可能内存中越界读取
    • Pascal一字符8位,带长度
    • Java一字符16位, 定义字符为Unicode
    • Python2 ASCII码环境下,字符当作ASCII码,可以自动转换成Unicode
    • Python3中""是Unicode码, b""是字节列串,要显示转换类型,否则报错
    • Ruby一字符8位,追加编码信息