18. 정규식 함수 오늘은 정규식 함수에 대해 알아보자. 정규식 함수는 표준 구문 규칙을 사용하여 문자열 데이터의 간단한 패턴 및 복잡한 패턴을 검색하고 조작할 수 있으며, 특히 데이터 정제 시 자연어 처리에 큰 효율을 발휘하는 함수이다. 또한, 정규식 함수의 메타문자는 SQL을 넘어 R, Python 등 많은 언어에서 유사하게 사용되고 있어, 정성적 빅데이터를 다루는 사람, 분석가라면 필히 알아두어야 하겠다. ORACLE SQL에서 많이 쓰이는 정규식 함수로는 아래의 5가지가 있다. 메타 문자 정규식 함수는 메타 문자와 함께 사용되는데, 메타 문자란 일련의 문자와 같이 특별한 의미를 지닌 특수문자이다. 이를 활용해 더욱 간단하게 문자형 데이터를 검색/조작할 수 있다. 메타문자를 정리한 표를 참고하고, ..
17. index 이제 ORACLE SQL의 데이터베이스 객체 중 마지막인 index를 알아보겠다. index의 개념 (1) index는 목차를 나타낸다. 그래서 보통 튜너들이 많이 사용하며, index를 생성한 후 query에서는 order by를 쓰지 않아도 정렬된 결과로 출력된다. 보통 대용량의 데이터에서 query 속도를 빠르게 하기 위해 index를 이용한다고 알고 있다. 반은 맞고, 반은 틀린 이야기이다. 우선 query 속도를 빠르게 하는 것은 맞다. 그러나 대용량의 데이터에 index가 있다고 해서 query 속도가 빨라지는 것은 아니다. → 만약 index가 있는 테이블에 DML 작업이 진행되며 모든 index가 갱신되어야 함을 의미한다. 따라서, 아래와 같은 상황에서 index를 생성하..
16. Sequence, Synonym 앞에서 살펴본 ORACLE SQL의 데이터베이스 객체 중 남은 Sequence, Synonym를 알아보겠다.(Index는 양이 많아 별도로 정리) Sequence Sequence란 간단히 일련번호 생성기로 말할 수 있으며, 번호를 중복하지 않고 순서대로 생성하는 DB Object이다. 일반적으로 각 행에 고유해야 하는 Primary key값을 생성하는 경우에 Sequence를 생성한다. Sequence를 생성하는 코드는 아래와 같다. create sequence 시퀀스명; start with 시작숫자 increment by 증가숫자 maxvalue 최대숫자 minvalue 최소숫자 cache 캐쉬에 올려놓을 데이터숫자 예제) 사원번호(empono)와 사원이름(ena..
- Total
- Today
- Yesterday
- hadoop install
- 하둡
- 하둡2.7
- 빅데이터
- hadoop
- 데이터 분석
- Big Data
- 하둡 설치 가이드
- hadoop 2.7 install
- hadoop2.7
- Data Analysis
- hadoop setup
- 하둡설치
- data
- 하둡설치가이드
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |