• 作为Hadoop的子项目2009年开始
  • 模式语言
    • Avro IDL
      • 用于人工编辑
    • 另一个基于JSON
      • 机器读取
  • 二进制编码
    • 比较紧凑
  • 模式演变
    • 作者模式和读者模式兼容
      • 顺序不同没问题,用字段名匹配
      • 字段缺少
        • 读者模式缺少,忽略
        • 读者模式多出,填充读者模式默认值
      • 改类型兼容
      • 改字段名
        • 向后兼容,读者模式包含别名,匹配旧作者模式名
        • 不向前兼容,读者模式不能匹配新作者模式名
  • 模式加载
    • 全部加载太大
    • 分情况处理
      • 批量处理记录时,模式只加载一次
      • 记录独立写入
      • 一个连接中,模式只加载一次
  • 动态生成模式更友善
    • 没有标签号