Contents 0. 여는말 1. Data Set 2. Data 분석 상세내용 3. 닫는말 0. 여는말 현재 Youtube는 동영상 플랫폼을 넘어 광고, 마케팅 측면에서 간과할 수 없는 독보적이며 세계적인 매체입니다. Youtube 내에서 Trending(인기 급상승 동영상) 영역 - 현재 '인기'로 이름 변경 - 은 PC/Mobile 모두 접근성이 높은 부분에 위치하고 있으며, 기본적인 Youtube의 노출/검색 로직인 유저의 관심/컨텐츠 이용 빈도와 무관하게 Google에서 선정한 다양한 요소의 합산점수를 통해 노출됩니다. 즉, 어떤 기업의 상품이나 컨텐츠가 Trending(인기 급상승 동영상) 영역에 노출된다면 추가적인 비용을 들이지 않고 전 세계 유저에게 당사의 컨텐츠를 홍보할 수 ..
블로그 내 흩어져있는 프로젝트 결과물(포트폴리오)을 편의를 위해 하나의 글에 모아 관리하겠습니다. 기존에 완료한 결과물들도 정리 후 지속적으로 업로드할 예정입니다. 언어 주제 설명 링크 SQL Youtube의 인기급상승 동영상의 제목에서 최빈도 단어 확인 인기급상승 동영상에 올라가는 패턴이 있는지 확인하기 위해 Data Set 분석확인 R Kormap 패키지를 통한 2016년 지역별 범죄유형별 분포 시각화 Data Set 정제, 가공 작업을 거쳐 Interactive map으로 시각화 확인 Shiny와 Leaflet을 이용한 2016년 지역별 범죄유형별 분포 시각화 위의 프로젝트에 interactive graph를 추가하여 Shiny로 시각화 강화 구현 확인 Python Python과 Graphviz를 ..
10. 집합 연산자 집합 연산자는 두 가지 이상 쿼리(query) 명령문의 결과를 한 번에 보여주는 기능을 한다. ORACLE 집합 연산자는 union all, union, intersect, minus 등이 있다. 예제로 확인해보자. 예제) emp테이블의 직업(job)별 월급(sal) 총 합을 나타내시오! select job, sum(sal) from emp group by job ; 만약 이 쿼리 맨 밑에 월급의 총 합을 나타내려면 어떻게할까? 우선 총 합을 출력해보자. select '총 합:', sum(sal) from emp ; 첫번째 쿼리와 두번째 쿼리가 합쳐서 결과가 출력되기를 원할 때, 대표적인 집합 연산자인 union all을 통해 이를 구현할 수 있다. 집합 연산자 사용방법..
Contents 0. 여는말 1. Shiny에 대한 이해 2. Data Set 및 상세내용 3. 닫는말 0. 여는말 앞서 작성된 R 포트폴리오에서 아래와 같은 아쉬움이 있었다. 더불어 R을 다루는 사람이라면 필수 패키지중 하나인 Shiny에 대하여 더 알아보고자, 기존의 interactive graph를 web상에서 구현하는 Shiny App을 만들어보았다. 1. Shiny에 대한 이해 Shiny는 R의 패키지 중 하나로서, R에서 구현한 기능을 Web으로 보여줄 때 사용한다. 개인적으로 처음 Shiny를 보았을 때 "실무에서 강력한 기능"이라고 느꼈다. 비록 무료인 상태에서는 24시간만 사용할 수 있다는 단점이 있지만, 매출 자료나, 시각화할 수 있는 데이터를 Web상에서 보여주는 것은 그 활용성이 매..
9. 서브쿼리 데이터 분석함수의 pivot에서 잠깐 다뤄봤던 서브쿼리에 대해 알아보도록 하겠다. 서브쿼리(Subquery) 란 단어의 뜻 그대로 "쿼리안의 쿼리" 를 의미하며, 일반적인 쿼리로는 원하는 출력값을 얻을 수 없는 경우 사용한다. 예제) emp테이블에 있는 JONES보다 더 많은 월급을 받는 사원들의 이름과 월급을 출력하시오! 이 경우 JONES의 월급을 미리 알고 있지 않다면, 아래의 두 가지 쿼리를 순서대로 진행해야 확인할 수 있다. select sal from emp where ename = 'JONES'; # 첫번째 쿼리 ↓ JONES의 월급 확인 select ename, sal from emp where sal > 2975 ; # 두번째 쿼리 이때,..
8. Join 이번에는 데이터를 다루는 사람이라면 꼭 하면서 어려워하는 부분인 join에 대하여 알아보자. Join이란? 여러 개의 테이블의 컬럼의 결과를 하나의 결과값으로 출력할때 사용하는 함수이다. join은 Oracle Join / 1999 ANSI Join 두가지가 있으며, Oracle SQL에 이미 있는 Data Set인 emp 테이블과 dept 테이블을 사용할 것이다. Oracle Join Oracle Join은 equi join, non equi join, outer join, self join으로 나눌 수 있다. 간단히 정리하면 라고 할 수 있다. equi join 위 emp, dept 테이블을 보면 deptno가 공통으로 있는 것을 볼 수 있다..
Decision_Tree_html Python과 Graphviz를 활용한 Decision-Tree 라이브러리 제작 Contents¶ 0. 여는말 1. Decision-Tree에 대한 이해 2. Decision-Tree의 장/단점 3. 기존 Decision-Tree Package/Module 4. Decision-Tree 구현 목표 및 상세내용 5. 닫는말 0. 여는말¶ "마음대로 Visual Customizing이 가능한 Machine Learning Library를 내가 직접 만들어볼 수 있을까?" ↓ "나도 만들 수 있다!" 1. Decision-Tree에 대한 이해¶ Decision-Tree(이하 의사결정나무)란 어떤 항목에 대한 관측값들을(Variables) 목표값(Target)에 연결시켜주는 분..
7. 데이터 분석함수 앞서 어떤 조건에 해당하는 데이터를 뽑아내는 작업을 해봤는데, 이번에는 분석을 위해 사용되는 좀 더 높은 수준의 함수인 데이터 분석함수에 대해 알아보자. 데이터 분석함수에는 크게 listagg, rank, pivot, ntile, lag, lead가 있다. listagg listagg함수는 Group by문과 함께 사용하는 함수로, 그룹별로 구분한 데이터를 한 컬럼(변수)안에 넣어주는 기능을 한다. 사용 방법은 listagg(나열할 데이터, 기준 구분자) within group ( order by 정렬 기준의 변수) 이다. 예제로 먼저 알아보자. 예) 부서번호와 부서번호 별로 속한 사원들의 이름을 가로로 출력하시오! select deptno, listagg(ename, ',&..
6. 그룹함수(복수행함수) 사실 데이터를 다루는 직업의 기본은 평균, 최대, 최소값을 구하는 것이라고 생각한다. 세상 사람들이 가장 관심 가지는 것도 위 세가지며, 데이터 분석가로서 ORACLE SQL을 사용할때에도 기본적으로 능숙하게 구할줄 알아야하는 값이다. (개인적인 생각일뿐이다.) 이제 그룹함수를 배워보자. 그룹함수에는 max, min, avg, sum, count 등이 있으며 함수의 기능은 이름에서 쉽게 유추해볼 수 있다. 또한, 그룹함수의 특징으로는 크게 2가지가 있다. 1.수 일치가 필요 2.NULL 값을 무시(제외)하고 함수 실행 하나씩 차례대로 살펴보도록 하자. max, min max와 min함수는 이름 그대로 최대, 최소값을 출력하는 함수이다. 예) 직업이 SALESMAN인 사원들 중에..
5. 일반함수 오늘은 ORACLE SQL에서 가장 많이 쓰이며, 유용한 함수인 nvl, decode, case에 대하여 알아보자! nvl null이 있다면 출력값을 변경해주는 함수 기존 데이터셋 select ename, comm from emp; ↓ null값을 숫자로 변경하자! select ename, nvl(comm, 0) from emp; 만약 'no comm', '값 없음'등의 문자형 데이터로 변경하려면 현재 숫자형 데이터인 comm을 to_char를 통해 문자형으로 변경한 후, 바꿀 문자형 데이터를 입력해야 오류가 발생하지 않는다. ↓ 숫자형 데이터를 문자형 데이터로 바꿔주자! select ename, nvl(to_char(comm), '없음') fro..
- Total
- Today
- Yesterday
- 하둡
- Data Analysis
- 하둡 설치 가이드
- hadoop install
- hadoop setup
- hadoop2.7
- 하둡설치
- Big Data
- data
- hadoop 2.7 install
- 하둡2.7
- 데이터 분석
- 하둡설치가이드
- hadoop
- 빅데이터
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |