데이터분석

    [Oracle] SQL developer 유용한 환경설정/단축키

    라인번호 표시 가장 기본적이면서 확인이 필요한 '라인번호'. 대부분 오류 코드가 '00열 00행' 이런식으로 표현되기 때문에 라인번호를 모르면 어느 부분인지 매번 세야하는 번거로움이 있다. 도구 -> 환경설정 -> 코드 편집기 -> 행 여백 -> 행 번호 표시: 체크 결과는 아래처럼 보이게 된다. 키워드 대문자로 표시하기 키워드/식별자를 자동으로 대소문자로 만들어준다.(개인적으로 오히려 번거롭다고 생각함) 도구 -> 환경설정 -> 코드 편집기 -> 완성 인사이트 -> 입력할 때 대소문자 변경: 체크 배경색을 사용하여 널(null)값 표시하기 널(null)값에 하이라이트를 주는 설정 도구 -> 환경설정 -> 데이터베이스 -> 고급 -> 배경색을 사용하여 널 표시: 색 지정 SQL 결과 갯수 제한하기 SQL..

    R로 Oracle DB에 연동 후 분석하기

    R로 Oracle DB에 연동하여 분석하기 Jupyter notebook에서 R커널을 사용, Oracle DB에 접속하기 위해 RJDBC,RJava Library를 사용했다. R에서 제공하는 라이브러리로 데이터 전처리를 할 수 있으나, 데이터 양이 클수록 쿼리문을 통해 데이터 전처리 작업을 하는것이 훨씬 효율적이다. #모듈 로드 library(rJava) library(DBI) library(RJDBC) library(ggplot2) library(dplyr) #오라클 DB 접속을 위한 conn 생성 drv

    Code Book(데이터 정의서) 제작과 중요성

    Code Book이란? 코드 북을 검색해보면 '코딩 작업을 할 때의 안내서로서 코드의 관리 및 정보 처리 시스템의 효율성을 위하여 필요한 안내서의 일종' 이라고 나온다. 분석시 코드북은 수집한 데이터에 대한 데이터 정의서와 같다. 데이터 정의서가 잘 정리되어 있어야지 모델링 작업 혹은 분석시 필요한 데이터가 무엇인지 보다 더 직관적이고 확실히 확인할 수 있다. ​ 코드북에 들어가는 정보는 때에 따라 다르지만 이정도가 적당하다고 생각한다. ​ 1. 테이블 이름 2. 변수명/설명 3. 데이터 타입 4. Null 값 유무 5. 코드값 여부 6. 코드 테이블 7. 테이블 차원 8. 비고 ​ 데이터 정의서 활용법 이번 해커톤을 계획하면서 내가 처음 한일이 코드북을 제작한 것이다. 팀원도 안 모인 상태에서 조금이나..