목록공부중 .../데이터처리와활용 (7)
여정의 기록

데이터를 전처리할 때 데이터 값들을 다듬는 전처리과정으로 정규화를 사용했었는데 데이터를 설계할 때도 정규화가 필요하다보다. 정규화가 필요할 때 삭제이상 전체 중 하나의 테이블에만 학생의 이름이 저장되어 있을 때 삽입이상 전체 속성 중 일부분의 정보만 채워서 삽입하려는 경우 갱신이상 특정 한 학생의 이름 값만 바꾸려하는데 같은 이름의 값이 여러개 존재할 때 -> 정규화가 필요하다 함수적 종속성 함수 관계가 되지 않는 경우 : 한 사람이 두 행의 값을 가질 때 , 예를 들어 같은 값이 두 번, 세 번 중복되어 적히는 것 테이블 T에서 X 값 각각에 대응되는 Y값은 하나만 가진다. 정규화란? 테이블을 설계할 때는 기본키를 중심으로, 연관성이 높은 애트리뷰트들만을 모아 테이블을 구성하는 기법이다. 기본키란? 어..
Create table department (Name varchar(10), Dean varchar(10), primary key (dname)); create table student (sno numeric, same varchar(20) not null, eyear numeric, name varchar(!0), primary key (son) # 기본키는 여기 테이블의 sno으로 foreign key (dname) references department # 외래키는 dname으로 , 그게 department 테이블에서 함 take_course 에서 학생별 sno과 각 학생들이 들은 con 개수를 투영한 테이블을 take_course_number 뷰로 정의하시오. create view take_cou..
부질의를 이용한 경우 2020년에 개설된 강좌에 대하여 학과, 교수명, 과목명을 검색하시오. table alias 사용하여 정확한 테이블 지칭 가능 select dname, (select pname from professor p where p.pno = t.pno) from teach_course t where eyear=2020 select dname, (select pname from professor p where p.pno = t.pno) pname, (select cname from course c where c.cno = t.cno) cname from teach_course t shere eyear = 2020 '확률론'에 대한 강좌가 개설되었는지 확인하는 질의를 작성하시오 # 정보자체를 조..
select dname, count(*) from teach)course where eyear=2020 group by dname having count(*) > 1 특정학과에 종속적이지 않은 필수 과목 2과목을 입력하시오 값을 넣어주지 않으면 자동으로 null값이 들어간다. insert into course(cno, cname) values (1001,'도덕') insert into course values (1002,'한국사',null) 교과목중 필수 과목을 검색하시오. null 값인 것을 찾고자 하면 in null로 해야한다. select * from course where dname = null # error select * from course where dname is null 교과목중 필수 ..
데이터 정의문 (테이블 생성문) 테이블 생성, 컬럼명과 타입 정의, 기본키와 외래키 설정 # 테이블 생성하는 방법 # create table 테이블명 create table department # 컬럼명과 타입 설정 (dname varchar(10), dean varchar(10), # 기본키 설정 primary key (dname)); create table student (sno numeric, sname varchar(20) not null, eyear numeric, dname varchar(10), primary key (sno), # 기본키는 여기 테이블의 sno으로하고 foreign key (dname) references department # 외래키는 dname으로 하는데 그게 depar..

개체 관계 모델 E-R모델이란? 실세계를 개체와 개체들간의 연관성을 나타내는 관계, 성(relationship)으로 모델링 E-R 도. E-R 모델의 표기법 타원형은 Attribute를 뜻한다. 밑줄 그어진 속성은 기본키이다. 데이터 추상화 - 일반화/특수화 generalization/Specialization : 유사한 개체 타입들간의 공통적인 애트리뷰트를 추출해서 이들을 대표하는 상위 개체 타입으로 추상화 - 집성화 Aggregation : 여러 개체 타입들간에 존재하는 관계성을 이들을 대신하는 상위 개체 타입으로 추상화 E-R도 기반 관계 스키마 생성 공통으로 가진 attribute를 기본키로 설정해두고 해당 기본키를 포함한 정보를 삭제하면 다른 tuple(entity)에서도 해당 정보가 삭제된다...
데이터베이스란? 서로 연관되어 있는 방대한 양의 그리고 변화하는(은행, 학교의 계속해서 생성되는 데이터) 데이터 저장소 데이터베이스 관리 시스템이란? 데이터베이스를 편리하고 효율적으로(사용자의 측면에서 원하는 데이터를 자신의 관점에서 원하는 방향에서 볼 수 있는, 방대한 양을 빠르게 접근할 수 있는) 관리하는 소프트웨어 데이터베이스 역사 파일 시스템(단점: 통합되지 않아서 파일이 중복되어 저장됨-중복성, 저장위치 물리적 위치변화와 구조변화-데이터 종속성 문제) -> 계층형 데이터베이스 -> 망형 데이터베이스 -> 관계형 데이터베이스(1970년대 말) 관계형 데이터모델 데이터 모델이란? 실제를 모형화 -> 물리적 데이터모형(모형 명세서) 데이터 추상화란? 데이터 표현 기법_ 사용자 관심 데이터 부분은 강조..