여정의 기록
텍스트 데이터 수집에 대해서 본문
728x90
디지털 데이터
전자적 방법으로 저장
네트워크 및 유선, 무선 통신 등을 통해 전송
IT 기술의 지속적인 발전
디지털 데이터 - 비정형 데이터(소셜데이터)의 증가세 가속화
아래의 사이트에서 데이터를 사용할 수 있다고 한다. 딥러닝 교육을 받을때 사용했던 기억이 있다.
https://archive.ics.uci.edu/ml/index.php
UCI Machine Learning Repository
Welcome to the UC Irvine Machine Learning Repository! We currently maintain 622 data sets as a service to the machine learning community. You may view all data sets through our searchable interface. For a general overview of the Repository, please visit ou
archive.ics.uci.edu
텍스트 데이터 분석
다양한 인접 학문들의 종합적인 시각에서 분석
도구적인면에서도 여러 분야의 기법들이 적절히 조화를 이루어 적용되어야 함
텍스트 데이터의 수집 방법
1. 데이터 저장소를 통한 텍스트 데이터 수집
2. API를 통한 텍스트 데이터 수집
3. 웹문서 데이터의 수집
728x90
'공부중 ... > 비정형데이터분석' 카테고리의 다른 글
토큰화란? (0) | 2022.12.11 |
---|---|
텍스트 데이터 통계 분석을 위한 가설 (0) | 2022.12.11 |
[비정형데이터분석] 비정형 데이터의 분석 및 도구 (0) | 2022.09.29 |
[비정형데이터분석] 데이터 활용의 제도적 장치 및 유의점 (0) | 2022.09.12 |
[비정형데이터분석] 데이터 개념 및 환경변화 (0) | 2022.08.25 |