분류 전체보기(32)
-
Week 11 - Data Storage Structure
File Organization MySQL → InnoDB : Function calls InnoDB → Linux : System call Linux → File System : Ext4_file_Write_iter File System → HDD : SATA_commands Database 는 파일 collection 으로 저장 각 파일은 레코드들의 sequence 각 File 은 하나 이상의 Page 로 구성 각 Page 는 하나 이상의 Record 로 구성 Record 는 Field 의 sequence [!note] Data Size 일반적으로 레코드 - 페이지 - 파일 순으로 크기가 커집니다. 레코드는 데이터베이스에서 가장 작은 단위 레코드는 데이터베이스 테이블의 한 행 페이지는 레코드가 저장되..
2024.02.02 -
Week 14 - Normalization
Normalization Creating Good relation design Instructor 와 Department 테이블을 In_dep 으로 합치면서 data 의 repetition 이 발생 Need to use null values (if we add a new department with no instructors) Decomposition 반복 문제를 피하는 방법 : 스키마를 두개로 나누느 것 하지만 모든 분해가 좋은 것은 아니다 해당 방식으로 분해한다고 가정하면 원본의 직원 관계를 복원할 수 없음 → 이것이 Lossy Decomposition Level of Normalization 데이터베이스에서 중복이 얼마나 일어나는지에 따라서 레벨이 달라짐 First Normal Form (1NF) ..
2023.12.10 -
Week 10 - Physical Storage Systems
Database 는 essentially Data storage system Classfication of Physical Storage Media Storage Volatile (휘발성) : 전원이 꺼지면 콘텐츠 소실 Non-Volatile (비휘발성) : 전원이 꺼져도 콘텐츠 유지 보조 나 이차 저장소 포함, 전원 유지된 메인메모리 Storage 선택에 미치는 영향 데이터 접근 속도 데이터 단위 당 비용 신뢰성 (Reliability) Primary : 가장 빠르지만 휘발성이다 (cache, main memory) Secondary : 비휘발성이고 중간 정도의 access 시간 (on-line storage : flash memory, magnetic disks) Teriary : 최하위 수준, 비휘..
2023.12.10 -
Week 8 - Database Design Using E-R Model
Design Phase Initial Phase 잠재적으로 해당 데이터베이스 사용자의 요구사항을 파악하는 단계 ex : 도서관 데이터베이스 구축 → 사서,도서관 이용자 → 필요 데이터 : 책 관련 데이터 도서관에 있는 모든 책(제목, 저자, 장르, ISBN, 이용 가능 여부)을 추적합니다. 고객 정보(이름, 연락처, 도서관 카드 번호)를 관리합니다. 거래(도서 대출, 반납, 기한, 벌금)를 기록합니다. → 도서관 데이터에 시장 데이터가 필요없는 것처럼 필요한 데이터와 그에 대한 관계를 정립 Second Phase 데이터 모델 선택 및 데이터 모델 개념 적용 ex : 관계형 모델 개념을 적용하여 테이블과 관계를 정의하겠습니다: 1.도서 테이블: 도서 정보를 포함합니다. 2. 후원자 테이블: 후원자 정보를 ..
2023.12.10 -
Contrastive Chain of Thought
0. background Chain of Thought 에 대한 간단한 설명 Chain of Thought : LLM 이 질문에 대한 답을 예측할 때, 답을 추론해가는 과정을 생각할 수 있도록 Prompt 를 구성하는 방법 Few-shot 의 경우에는 정답을 풀이하는 과정을 답변과 함께 넣어주어 LLM 이 해당방식으로 문제를 풀이할 수 있도록 만듦 Zero-shot 의 경우에는 정답대신 Let’s Think step by step 과 같이 문제에 대한 정답을 추론해가며 풀 수 있도록 Prompting 을 진행 본 논문에서는 Few-shot Setting 에 집중 1. Introduction 많은 LLM 모델들이 등장한 가운데 Complex reasoning 과 같이 어려운 Task 에 대해서는 성능이 빠..
2023.12.01 -
WHERE-HAVING 절 차이
기능 둘 다 데이터셋 검색을 필터링할 때 사용하는 절이다 Two clauses are used for filtering when you search the dataset to get the data what you want Having 절 그룹을 나타내는 결과 집합의 행에만 적용 → 그룹을 필터링하는데 사용 Where 절 개별 행에 적용 → 행을 필터링하는데 사용 동작 Having 절 Group by 절 뒤에 사용 → 그룹화 또는 집계 함수가 발생한 후 레코드를 필터링한다 SELECT NAME, COUNT(NAME) AS "Count" FROM ANIMAL_INS GROUP BY NAME HAVING COUNT(NAME) > 1; → 내가 갖고 있는 ANIMAL_INS 테이블을 GROUP BY 로 NAM..
2023.10.25 -
Week 5 - Introduction to SQL (1)
SQL Parts Week 2 - Introduction#Summary For Language DDL DML DCL TCL DDL Data Definition Language a syntax similar to a computer programming language for defining data structures, especially database schemas Create, Modify, and Remove Database objects such as tables, indexes, and Users CREATE, ALTER, DROP DML Provide the ability to query information from the database Integrity View Definition Tr..
2023.10.24 -
[프로그래머스] SELECT 문제풀이
Programmers SQL Hackerrank 0. 1. 재구매가 일어난 상품과 회원 리스트 구하기 SELECT USER_ID, PRODUCT_ID FROM ONLINE_SALE GROUP BY USER_ID, PRODUCT_ID Where 절은 굳이 쓰지 않음 ONLINE_SALE 테이블에서 → FROM ONLINE_SALE 동일한 회원이 동일한 상품을 재구매한 데이터를 구하여, WHERE절 사용하지 않는다 GROUP BY USER_ID, PRODUCT_ID 로 그룹 묶은 다음 GROUP BY GROUP BY USER_ID, PRODUCT_ID HAVING count(*) > 1` 재구매한 회원 ID와 재구매한 상품 ID를 출력 SELECT USER_ID, PRODUCT_ID 하는 SQL문을 작성해주..
2023.10.23 -
Week 7 - Intermediate SQL
Joined Relations Takes two relations and returns as a result another relation 두 relation 의 tuple 이 일치하는 Cartesian 곱 두 테이블에 공통된 값을 사용하여 두 테이블의 열을 결합하는 데 사용 Natural Join 모든 common attributes 에 대해서 동일한 값을 가진 tuple 을 일치시킨다 각 공통 열의 복사본을 하나만 유지 → 두 쿼리는 동일한 작동 연결된 테이블 의 동일하거나 일치하는 열 값에 대한 JOIN 을 수행 연결된 테이블의 이름이 같은 columns 는 한번만 나타난다 열은 동일한 data type 이어야 한다! Join Condition ON 조건은 조인되는 관계에 대한 general pre..
2023.10.21