-
데이터 과학 이란?
정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고 리즘, 시스템을 동원하는 융합분야
데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다.
보통 큰 데이터셋에 대해 어노테이션, 클리닝, 핸들링, 저장, 분석을 하여 그로부터 유용한 지식을 추출하는 것을 말한다.
데이터 과학은 데이터를 연구하는 분야이고, 데이터 자체가 가장 중요한 자원이다.
실제로 데이터 분석 업무의 80~90%는 데이터를 수집하고 정리하는 일이 차지하며,
나머지는 알고리즘을 선택하고, 모델링 결과를 분석하여
데이터로부터 유용한 정보를 얻어내는 분석 프로세스의 몫이다.
데이터 과학자가 하는 가장 기초적이고 중요한 일은 데이터를 수집하고 분석이 가능한 형태로 정리하는 것이다.
'개발 > Python' 카테고리의 다른 글
Numpy_ 개념 및 정의, 배열 생성, 기본 작업, 유니버셜 함수 (0) 2021.11.18 Python_ 쥬피터 노트북 사용법 단축키, Jupyter notebook (0) 2021.11.18 AWS_ Web server failed to start. Port 8080 was already in use 문제 해결 (0) 2021.11.17 Git Bash_ 깃과 AWS로 서비스 배포 (3) (AWS 사용) (0) 2021.11.16 Git Bash_ 깃과 AWS로 서비스 배포 (2) (AWS 사용) (0) 2021.11.16 댓글 (비로그인 댓글 허용하지 않습니다.)