博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《BI那点儿事》数据流转换——聚合
阅读量:5304 次
发布时间:2019-06-14

本文共 801 字,大约阅读时间需要 2 分钟。

聚合转换可以像T-SQL中的函数GROUP BY, Average, Minimum, Maximum, 和 Count一样对数据进行聚合运算。在图中可以看到数据以SampleID分组,对TotalSugar做Average、Maximum、Minimum、Count操作。这样产生了4列新的数据,供其他操作。

在聚合操作编辑器Aggregate Transformation Editor,首先选择需要进行聚合操作的列,然后选中的列将会出现在下面的一个表里面在Output Alias列里面输入输出列的别名。最重要的以个设置是在Operation这一列选择聚合操作。它有一些选项。

  •  Group By:将数据按照某列分组
  •  Average:对数据列求和操作
  •  Count:对一组数据中非空行计算行数
  •  Count Distinct:对一组数据中的非空行计算非重复的行数
  •  Minimum:对一组数据中的数字列求最小值
  •  Maximum:对一组数据中的数字列求最大值
  •  Sum:对一组数据中的数字列求和

点击Advanced标签界面,在这个界面可以编辑转换输出。在Advanced界面可以输入聚合计算的名字,产生一个新的列。在Advanced标签界面,最关键的选择项是设置转换时的缓存,使它在一个合适的水平。例如较低水平设置为500000条,中等水平设置为5000000条,较高水平设置为25000000条。也可以使用Number of Keys属性设置具体数值。Auto Extend Factor属性设置转换可以使用的内存量,默认的值是25%,也可以设置其他选项保证RAM占用量。Warn On Division by Zero单选框用来处理求平均值时被除数是0,如果没有选择,转换失败将不会给出任何提示。

 

转载于:https://www.cnblogs.com/Bobby0322/p/4053827.html

你可能感兴趣的文章
PHP大小写:函数名和类名不区分,变量名区分
查看>>
php 跨域请求
查看>>
八大排序算法
查看>>
day57 手写socket、路由系统、响应一个动态内容、链接数据库、django配置、及应用、DNS服务器...
查看>>
CentOS7 下 yum 安装 Docker CE
查看>>
SDUT 识别浮点常量问题 编译原理作业
查看>>
pku 3280 Cheapest Palindrome DP
查看>>
c++11/0x多线程编译
查看>>
链接到底干了什么
查看>>
Android学习笔记(1):环境搭建
查看>>
LCID应用2
查看>>
[译]Javascript timing事件
查看>>
cscope
查看>>
Navicat for SQL Server V10.0.10
查看>>
Android基本组件TextView和EditView
查看>>
Xamarin.Forms教程开发Xamarin.Forms应用程序需要的工具
查看>>
web测试——完结感言
查看>>
Linux系统内核驱动之位操作
查看>>
oracle 按每天,每周,每月,每季度,每年查询统计数据
查看>>
Laravel 5.2 教程 - 文件上传
查看>>