统计学对比验证方法

Posted by Shen Chaoran on January 17, 2019

数据处理

时间范围和频率

模型 start time end time interval year number
IBIS 1982 2014 1天 32
Biome-BGC 1982 2014 1天 32
LPJ 1982 2014 1天 32
MOD17 A2 2000 2016 8天 16
MOD17 A3 2000 2016 1年 16
Fluxdata 根据站点不等 根据站点不等 1天 根据站点不等,3-8年

现在的解决方法是:取最长公共时间区间,时间频率取最大公共频率

missing_value/invalid_value 值的处理

如下所示,第一行全部 mask 掉

A, B, C, D 
1,-999,12,3                 <- 全部 mask 掉
1234,2,3213,234
13,1234,23,334
...

对比

单站点级

图:

  • 折线图
  • 泰勒图
  • 箱图
  • 散点图、线性回归拟合
  • 超级集合方法:模型预测值和观测值之间建立加权回归

表:

  • ROC
  • 均方根误差RMSE
  • 相关性
  • R方、
  • 按PFT分类统计NEP、GPP值,并与文献资料中的值相对比

多站点级

将多个站点的数据组合在一起,对比方法同单站点

全球范围区域级

  • 偏差等值线图:将模型模拟结果融合成 nc 文件,和 MODIS 遥感数据对比
  • 超级集合方法

Biome-BGC
CO2(起始年份或者模拟时间范围的序列) 气象 PFT 站点物理常量 沙粒、黏粒、粉粒 高程 短波辐射率 有效土壤深度 -p 干+湿大气氮沉降 -p 共生+非共生氮固定量 -p 工业革命前水状态 -p 工业革命前碳状态 -p 工业革命前氮状态 IBIS 气象 PFT 站点 沙粒、黏粒、粉粒 LPJ 气象:温度、降水、辐射、云量 经纬度 土壤类型编码

假设: 格点和观测站点PFT相同、土壤类型相同