공부중 .../데이터과학개론

Git , GitHub , R 알아보기

Chelsey 2022. 12. 1. 17:35
728x90

Git

체계적으로 소스코드를 관리하기 위한 분산 버전 관리 시스템
윈도우 운영체제의 명령 프롬프트, Git Bash, SourceTree 등 GUI를 이용하여 명령 수행 가능

GitHub

깃에서 다룬 소스코드들을 공유할 수 있는 웹 공간을 제공해 줌으로써 프로그래밍이나 소프트웨어 개발 및 협업이 용이하도록 돕는 서비스
 - 코드를 업로드하고 조회하거나 버그 관리를 하는 한편, 개인이 올린 정보 공유

커밋 commit : 파일을 새롭게 추가하거나 변경하여 저장하는 작업
 - 커밋시 새로운 버전의 파일이 저장(단, 적당한 규모의 커밋 필요)

푸쉬 push : 파일을 추가하거나 변경하여 원격 저장소에 업로드하는 작업

작업영역 -add-> Staging 영역(파일을 인덱스에 추가한다) -commit-> Local 저장소 -push-> 원격 저장소

브랜치 branch : 버전관리를 위한 구조를 생성한다
 - 소프트웨어 등의 개발에 있어서 유지와 보수, 개선 작업이 진행되면서 버전이 바뀌게 되는데 이러한 버전관리가 필요하므로
 - 새로운 기능 추가, 디버깅 등 작업이 병렬적으로 진행될 때

 

R

- mode() : 해당 변수가 어떤 자료형인지 알려줌
- seq(3, -3, -2) : 3, 1, -1, -3 결과
- rep(2, 3) : 2, 2, 2 결과 

행렬 : 행과 열의 데이터 구조, 벡터의 확장
- dim(data) <- c(2,2) : 2x2 행과 열의 구조를 가진 metrix로 생성
- t() : transpose. 행이 열로, 열이 행으로 구조를 바꿔준다.
- %*% : 행렬의 연산 
- solve() : 역행렬 함수
- apply() : 어떤 변수에 어떤 함수를 적용한다는 뜻
숫자형, 문자형, 논리형 - 중 자료형은 한가지로만 이루어진다.

배열 : vector, metrix의 확장으로서 한 개 이상의 벡터 또는 행렬로 이루어짐
- array()
- dim() : 차원 지정 가능

리스트 : 다양한 자료형으로도 이루어질 수 있는 데이터 구조.

데이터 프레임 : 열 방향으로 변수가, 행 방향으로 관측치 기록인 데이터 구조, 일반화된 행렬
- as.data.frame() : 행렬을 데이터 프레임 구조로 간단하게 전환
- data.frame() : 행렬이 아닌 객체를 결합해서 데이터 프레임 데이터 구조를 생성

- cbind(), rbind() : 데이터 프레임을 병합, 편집

 

 

 

728x90