- 이 문서는 PENTAHO의 공식 document를 참고하였습니다.
- 버전은 가장 최신인 9.1 CE 기준으로 작성하였습니다.
- 저도 공부 중입니다.. 틀리거나 이상한 부분이 있으면 댓글 달아주셔요..^^
GROUP BY STEP
[1] 설명
- 이 스텝은 일반적인 GROUP BY와 동일한 역할을 수행하는 STEP입니다. 이외에도 동일한 역할을 수행하는 MEMORY GROUP BY도 존재합니다.
- GROUP BY와 MEMORY GROUP BY의 차이점
[2] 사용 용도
테이블의 GROUP BY를 수행한다.
[3] 사용법 예제
우선 가장 먼저 데이터를 가지고 와 보도록 하겠습니다.
EMPNO,NAME,DEP,SALARY
1001,Park,Sales,8000
1002,Selle,IT,7000
1003,Joe,Marketing,4500
1004,Robert,Marketing,7800
1005,Janet,Sales,6600
1006,Jung,Marketing,6200
1007,Gully,Sales,9000
1008,Selen,Marketing,3200
1009,Kim,IT,11500
위 데이터는 txt 파일로 사원번호, 이름, 부서명, 연봉 순으로 칼럼을 가지고 있습니다. 이 데이터의 부서별 연봉 평균을 구해보도록 하겠습니다. 부서별 연봉이므로, 일단 부서별로 GROUP BY를 해야 할 것 같고 그러고 나서 그 값들을 평균을 내어야 하겠습니다. FLOW는 아래와 같습니다.
로직은 다음과 같습니다.
- text file input STEP으로 데이터를 입력
- Sort rows STEP으로 부서명을 정렬
- Group by STEP으로 부서명으로 group 지었고, 부서 별로 평균값 계산
- dummy STEP으로 결과 확인
text file input STEP
- 이 STEP은 txt 파일을 입력하는 역할을 합니다.
- 파일 또는 디렉터리 칸에 찾아보기를 눌러, 원하는 데이터를 입력하신 후, 그다음에 추가를 누르시면 그림과 같이 선택한 파일로 파일의 주소명이 옮게 가게 됩니다.
Sort Rows
- 이 STEP은 데이터를 정렬하는 역할을 수행합니다.
- 맨 아래의 필드 가져오기를 클릭하시면, txt 파일에 있는 모든 칼럼(필드)들이 올라오게 됩니다. 현재 저희는 DEP(부서명)을 GROUP BY 할 것이므로, 다른 필드는 제거하고 DEPT만 정렬하도록 합니다.
GROUP BY
- 이 STEP은 GROUP BY를 수행하는 역할입니다.
- 그룹을 만들 필드라는 곳에 내가 GROUPING을 할 칼럼을 넣어주시고, 집계라는 곳에 새롭게 집계해서 나오는 데이터들의 칼럼명을 이름에, 계산을 수행할 칼럼명을 대상에, 원하는 계산을 데이터형에 기입해 주시면 되겠습니다.
- 저는 DEPT(부서)를 GROUP BY 할 것이므로, 그룹 필드에 DEPT를 넣었고(필드 가져오기를 선택하시면 이전 STEP에서 나오는 모든 필드들이 들어오게 됩니다), 이름은 SALARY_AVG로 대상은 SALARY(연봉) 그리고 마지막으로 평균값을 구해야 하므로 데이터형에 평균을 기입하였습니다.
DUMMY
- 이 STEP은 결과를 보기 위해 넣은 STEP입니다. 결과는 다음과 같습니다.
감사합니다.
'PENTAHO > STEP' 카테고리의 다른 글
[PENTAHO] Memory GROUP BY STEP (0) | 2021.07.19 |
---|---|
[PENTAHO] FILTER ROWS STEP (0) | 2021.07.15 |
[PENTAHO] DATA GRID STEP (0) | 2021.07.15 |
[PENTAHO] DUMMY STEP (0) | 2021.07.15 |
댓글