I. 서론
II. 본론
1. 빅데이터의 정의와 특징, 그리고 사회적 중요성
2. 빅데이터 수집을 위한 5단계와 핵심 단계에 대한 판단 근거
III. 결론
IV. 참고문헌
I. 서론
휴대전화, 교통카드, 각종 센서, 온라인 서비스 같은 생활 속 도구는 매일 새로운 기록을 만든다. 예전에도 통계 자료는 존재했지만, 최근에는 생성량이 급격히 늘고 형식도 훨씬 다양해졌다. 글, 사진, 동영상, 위치 정보, 기기 상태 값처럼 서로 다른 형태가 동시에 쌓인다. 이런 변화는 정보를 모으고 활용하는 방식까지 바꾸었다. 과거에는 표본조사나 설문처럼 정해진 질문에 답을 받는 방식이 중심이었다. 지금은 일상에서 자동으로 생긴 기록이 자료가 된다. 그래서 데이터를 다루는 방법, 자료의 품질을 지키는 방법, 개인정보를 보호하는 방법이 함께 중요해졌다.
빅데이터는 양이 많다는 말로만 설명하기 어렵다. 무엇을 위해 어떤 자료를 모을지 정하는 과정에서부터, 수집과 저장, 품질 확인, 보호 조치, 활용까지 연결된 흐름으로 이해할 필요가 있다. 본 글에서는 빅데이터의 개념과 특징을 정리한 뒤, 수집을 위한 5단계를 구체적으로 설명한다. 또한 5단계 중에서 무엇이 가장 큰 비중을 차지한다고 생각하는지도 이유와 함께 제시한다.
과학기술정보통신부. (2024). 2023 데이터산업 현황조사. 세종: 과학기술정보통신부.
김성우, 정건섭. (2014). 빅데이터의 정책적 활용과 과제: 빅데이터 추진 현황과 정책적 적용 쟁점을 중심으로. 한국비교정부학보, 18(3), 309-324.
성욱준. (2017). 데이터 생애주기 관점에서 본 공공부문 빅데이터 활성화 방안. 한국지역정보화학회지, 20(2), 25-41.
조영임. (2013). 빅데이터의 이해와 주요 이슈들. 한국지역정보화학회지, 16(3), 31-52.
정용찬. (2016). 빅데이터의 국가통계 활용 전략. 통계연구, 특별호, 1-16.
한국지능정보사회진흥원. (2022). 인공지능 학습용 데이터 품질관리 가이드라인 v2.0. 대구: 한국지능정보사회진흥원.
한국정보화진흥원. (2015). 알기쉬운 빅데이터 분석·활용 가이드 v1.2. 서울: 한국정보화진흥원.
행정안전부. (2018). 공공데이터 품질관리 매뉴얼 ver 2.1. 세종: 행정안전부.
한국사회보장정보원. (2016). 개인정보 비식별 조치 가이드라인. 서울: 한국사회보장정보원.
보건복지부. (2024). 보건의료데이터 활용 가이드라인. 세종: 보건복지부.

분야