취뽀 기록

#열심히 살자 #취업 #공부

분류 전체보기 221

[python] 문자열 변환_함수 format( )

함수 format( ) : 값을 순차적으로 할당해줌 -> 중괄호 { } 를 큰 따옴표 " " 로 묶어준 다음 마침표로 연결시켜 사용 가능 ex) str = “{}”.format(23); print(str); print(type(str)) 실행결과: 23 ※ format( ) 유의점 format 함수 안에 있는 값이 중괄호 안으로 들어감 ■ 정수형 숫자를 문자열로 변환 a = "{:d}".format(23) # 정수 b = "{:5d}".format(23) # 자리수 & 남은 자리를 빈칸으로 채움 c = "{:05d}".format(23) # 자리수 & 남은 자리를 0으로 채움 d = "{:05d}".format(-23) # -는 자리 수를 차지한다. print(a) 결과값:23 / print(b) 결과값..

Python 2023.06.12

[Python][한국복지패널데이터] 주제 1_성별에 따른 월급 차이

데이터 분석 준비 # 한글 폰트 설치 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf # 메뉴 - 런타임 - 런타임 다시 시작 # 라이브러리 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') # 한글 폰트 설정 plt.rc("font", family = "NanumGothic") # 데이터 준비 raw_welfare = pd.read_csv('/content/drive/MyDrive/hana1..

Python 2023.06.08

[SQL] 테이블 생성, 데이터 입력, 데이터 조회, 테이블 삭제

테이블 생성 # 라이브러리 불러오기 import cx_Oracle as oci # 디비 연결 # "ID/PW@localhost:1521/orcl" con = oci.connect("scott/tiger@localhost:1521/orcl") # 커서 생성 cur = con.cursor() # create table # sql 실행 - DDL = 자동 커밋 sql = "CREATE TABLE TEST (ID NUMBER(2), NAME VARCHAR2(10))" cur.execute(sql) # print(cur.execute("SELECT * FROM TEST").fetchall()) # 디비 연결 종료 con.close() 데이터 입력 # 라이브러리 불러오기 import cx_Oracle as oci ..

SQL 2023.06.08

[Python] 데이터 전처리

데이터 전처리 자료형 변환 데이터 타입 확인 # 숫자가 문자열로 저장되어 있다면 숫자로 변환 => 수치형 변수 # 데이터 자료형 df.dtypes 문자열 고유값 확인 # 어떤 문자열이 들어갔는지 확인하는 방법 df['horsepower'].unique() 문자열 NaN으로 변경 import numpy as np # ? => NaN df['horsepower'].replace("?", np.nan, inplace = True) # ? 문자열을 nan으로 변경 df['horsepower'].unique() NaN 행 삭제 - dropna # NaN 행 삭제 df.dropna(subset = 'horsepower', axis = 0, inplace = True) df['horsepower'].unique() ..

Python 2023.06.04

[python] 데이터 전처리 - 널값 처리

6. 데이터 전처리 ✔️ 널값 # = 비어 있는 데이터(값) = 누락 데이터 df = sns.load_dataset('titanic') df.info() # Non-Null Count # 전체 행 개수가 891개 이므로 Non-Null Count도 891개 되어야 널값이 없는 것 # 891개보다 적으면 널값이 있으니 확인할 것 # 빈도표 = 해당 열 고유값 & NaN 미포함 df['deck'].value_counts() # 빈도표 = 해당 열 고유값 & NaN 포함 df['deck'].value_counts(dropna = False) # 널값을 직접 확인 # isnull()의 결과가 True = 널값, False = 널값이 아님 df.head().isnull() # isnull()의 결과가 True =..

Python 2023.06.01

[SQLD] 2과목_요약

2과목 part1. SQL 기본 ✔️ DB 특정 기업이나 조직 또는 개인이 필요에 의해 데이터를 일정한 형태로 저장해 놓은 것 ✔️ DBMS 효율적인 데이터 관리 뿐만 아니라 예기치 못한 사건으로 인한 데이터 손상을 피하고, 필요시 필요한 데이터를 복구하기 위한 강력한 기능의 SW ✔️ SQL 관계형 DB에서 데이터 정의, 조작, 제어를 위해 사용하는 언어 ✔️ SQL 문장들의 종류 DML : SELECT, INSERT, UPDATE, DELETE 등 데이터 조작어 DDL : CREATE, ALTER, DROP, RENAME 등 데이터 정의어 DCL : GRANT, REVOKE 등 데이터 제어어 TCL : COMMIT, ROLLBACK 등 트랜잭션 제어어 ✔️ 테이블 데이터를 저장하는 객체 로우와 칼럼으..

SQL/[SQLD] 2023.05.30

[SQLD] 1과목 요약

1과목 part1. 데이터 모델링의 이해 ✔️ 모델링의 특징 추상화 : 현실세계를 일정한 형식에 맞추어 표현 단순화 : 복잡한 현실세계를 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 함 명확화 : 누구나 이해하기 쉽게 하기 위해 대상에 대한 애매모호함을 제거하고 정확하게 현상을 기술하는 것 ✔️ 데이터 모델링의 중요성 및 유의점 중복 : 같은 시간 같은 데이터 제공 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변경되면 안됨 비일관성 : 신용 상태에 대한 갱신 없이 고객의 납부 이력 정보 갱신 안됨 ✔️ 데이터 모델링 개념적 모델링 추상화 수준이 높다. 업무중심적 포괄적인 수준의 모델링 진행 전사적 데이터 모델링 EA 수립 시 많이 이용 논리적 모델링 시스템으로 구축하고자 하는 업무에 ..

SQL/[SQLD] 2023.05.30