标准数据集


from:http://www.360doc.com/content/16/1229/22/35686997\_618768163.shtml

下面是本文将介绍的 10 个数据集的列表。每个数据集都不大,能够适应内存或使用电子表格查看。所有数据集都由表格数据组成,并且没有(显式的)缺失值。

  1. 瑞典汽车保险数据集

  2. 葡萄酒质量数据集

  3. 比马印第安人糖尿病数据集

  4. 声纳数据集

  5. 钞票数据集

  6. 鸢尾花卉数据集

  7. 鲍鱼数据集

  8. 电离层数据集

  9. 小麦种子数据集

  10. 波士顿房价数据集


瑞典汽车保险数据集:

瑞典汽车保险数据集( Swedish Auto Insurance Dataset)包含了对所有索赔要求的总赔付预测,以千瑞典克朗计,给定的条件是索赔要求总数。

这是一个回归问题。它由 63 个观察值组成,包括1个输入变量和1个输出变量。变量名分别是:索赔要求数量、对所有索赔的总赔付,以千瑞典克朗计。

预测平均值的基准性能的均方根误差(RMSE)约为 72.251 千克朗。

前5行的示例如下:

results matching ""

    No results matching ""