security_login_new.png
cs_new_10.pngside_bottom_02.png
문화&라이프

구글의 빅데이터, 어디까지 알 수 있을까?

by 7기신온유기자 posted Jan 23, 2018 Views 16098
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
Extra Form

 정하웅 KAIST 물리학과 교수님의 강연을 들은 적이 있다복잡계 및 통계물리 연구실에서 계셨던 교수님께서는구글 신은 모든 것을 알고 있다.’는 흥미로운 주제를 가지고 강연을 진행하셨다강연을 들은 후교수님의 저서인 구글 신은 모든 것을 알고 있다.’를 읽었으며 그 뒤 직접 실제 우리나라에서 있었던 일들을 검색해 그 결과를 비교해봤다.

 핵심은구글이 방대한 양의 빅데이터를 가지고 있다는 점이었다.

 가장 먼저구글 트렌드에 촛불집회를 검색했다이 방법으로 사람들이 촛불집회를 어느 시기에 가장 많이 검색했는지를 확인할 수 있었는데그 기간은 10.23~10.29 이었다놀라운 점은, 10.29일이 바로 첫 대규모 촛불집회가 열린 날이라는 것이다이로써 촛불집회라는 단어를 검색한 빈도수와 실제 처음으로 대규모 촛불집회가 열린 기간이 일치함을 확인할 수 있다.

 두 번째로 확인한 것은 안희정 충남지사의 지지율 변화이다한국일보의 2017년 2월 13일자 기사에 따르면 안희정 충남지사의 지지율이 1주 만에 10%에서 19%로 크게 상승했다고 한다구글 트렌드에 안희정을 검색해 본 결과 역시 동일했다안희정 검색 빈도수의 최고점이 찍힌 기간은 2.12~2.18 사이였다검색 빈도수의 최고점이 실제 지지율이 상승했던 기간과 일치하는 것을 확인한 것이다.

 세 번째로 조사한 것은 대선 후보자들의 지지율 순위였다구글에 문재인안희정이제명 등 더불어민주당 후보들과 황교안홍준표이인제 등 자유한국당의 후보들을 모두 검색한 결과 검색결과 수는 민주당에서 문재인후보가 41,600,000건이며 지지율 순위 1안희정 후보가 21,500,000건이며 2이제명 후보가 20,800,000건이며 3위였다실제 지지율 순위와 검색 건수가 동일한 경향을 보였다.

 한국당도 마찬가지였다황교안 후보가 19,200,000홍준표 후보가 6,050,000이인제 후보가 1,320,000건으로 실제 순위 역시 각각 1, 2, 3위를 차지했다.

 마지막으로 각 후보의 지지율 변동을 구글 트렌드에서 알아보았다안희정 후보의 지지율이 3월 2주차가 1주차에 비해 0.3% 높아졌다고 보도된 바 있다트렌드 검색 결과 역시 안희정 후보의 검색 빈도수가 3월 1주차 29 보다 2주차가 48로 더 컸다황교안 후보의 지지율은 3월 1주차에 비해 2주차가 0.7% 하락했다고 보도되었는데실제로 트렌드에서 검색한 결과 1주차 52의 빈도수에서 48로 하락한 것을 확인할 수 있었다.

최종 사용본.PNG


[이미지 제작=대한민국청소년기자단 4기 신온유기자]


 위의 과정을 통해 사람들의 검색 빈도수와 건수 같은 빅데이터들이 실제 생활과 밀접하게 연관됨을 직접 확인할 수 있다이는 결론적으로 데이터들의 축적과 이렇게 형성된 방대한 빅데이터들을 이용하면 실제 일어나는 일까지 추측할 수 있다는 것을 의미하기도 한다.

 이런 일이 가능한 이유는 사람들이 검색할 때 거짓말을 하지 않기 때문으로 설명된다구글 트렌드에 다이어트를 검색하면 검색 건수는 매년 1월 1일마다 최고점을 반복하여 찍는다사람들이 다이어트를 새해 목표로 삼고관련 내용을 검색하기 때문이다독감이 유행했을 당시 독감의 증상 및 예방법과 같은 독감 관련 검색 빈도수가 증가하는 것 또한 하나의 예이다.

 물론 빅데이터가 가리키는 지표가 항상 맞는 것은 아니다그 예로구글에서 해당 년도의 독감 환자 수를 실시간으로 예측하는 프로젝트를 진행한 적이 있다현재 얼마나 많은 독감 환자가 있을까하는 것을 독감 관련 검색어의 검색 횟수 급증 경향을 가지고 파악하고자 한 것이다. 2003년부터 2007년까지 기존 데이터를 활용하여 독감 환자수와 가장 잘 맞는 키워드 50개를 선정구글 검색엔진을 이용한 독감 예측에 나섰다이 결과는 실제 독감 환자 증가 치와 매우 일치했다그러나 2013프로젝트는 실패하고 만다. 2013년 일본에서 백신 부족 사태가 일어나 관련 뉴스들이 넘쳐났기 때문이다이로서 실제 독감 환자들과 관련이 없는 사람들도 백신 부족에 관심을 가지고 검색을 하는 바람에 데이터 값이 실제 독감 환자와 다르게 무척 큰 수치를 띄게 됐다당시 상황과 맥락내용 검토 없이 숫자만 맹신하는 것은 금물이라는 교훈을 남겨준다.


 우리 사회는 정보화 사회를 넘어 4차 산업혁명이라는 단어까지 등장하는 시대에 극면 해있다데이터의 양은 갈수록 많아질 것이고빅데이터의 중요성 또한 더욱 강조될 것이다구글의 빅데이터를 이용한 실제 상황에 대한 예측은 빅데이터의 강점을 더욱 부각시켜준다사람의 필요와 선택에 의해 검색되는 정보들이 한데 모여 사람 사이에 일어나는 일들을 추측해낸다사람조차 이라 정의하며 예측하지 못 하는 결과들을 사람이 모은 데이터가 안다는 것이다데이터가 쌓이는 과정은 의외로 간단하지만데이터의 쓰임은 무궁무진하며 때로는 사람도 하지 못하는 일을 이뤄내기도 한다우리는 앞으로 빅데이터를 현명하게 모으고 활용하는 방법을 익혀 우리의 한계를 극복해냄과 동시에 인류의 편익과 공익을 일궈내야 할 것이다.


[대한민국청소년기자단 IT·과학부=4기 신온유기자]




Copyright ⓒ 대한민국청소년기자단(www.youthpress.net), 무단 전재 및 재배포 금지


kltw_kyp_adbanner5.png

TAG •

List of Articles
제목 날짜 이름 조회 수
리움미술관, 마우리치오 카텔란의 국내 첫 개인전 file 2023.03.30 박우진 461321
[포토] 일본 야마구치현 우베시 초요컨트리클럽(CC) file 2023.03.22 조영채 458780
[PICK] 요즘 떠오르는 힐링수업, ‘플라워 클래스’ 2 file 2021.08.27 조민주 881995
국립대구박물관 2016년 설맞이 문화행사,성공적으로 막을 내려... 11 file 2016.02.10 김윤지 15211
국립낙동강생물자원관에서 '키즈 바이오 사이언스 페스티벌' 열려 2017.05.20 박은서 12188
국립나주병원, 정신건강 문화 조성 위한 2022 ‘코로나 우울 백신 마음 건강 작품 공모전’ 개최 file 2022.08.09 이지원 6986
국립김제청소년농업생명체험센터 청소년운영위원회 4기의 첫걸음 3 file 2017.02.16 최희주 12500
국립광주과학관, 2030 미래도시 강연 개최 file 2017.08.28 오경찬 12958
국립 중앙 박물관에 자리 잡은 세 나라의 호랑이들 1 file 2018.02.20 이시현 13278
국내 최대 자동차 전시 '2023 서울모빌리티쇼' 킨텍스서 개최 file 2023.04.03 조영채 8645
국내 최대 규모의 건축박람회, MBC 건축박람회 file 2017.08.31 최나연 15694
국내 바다가 지겹다면 대마도 미우다 해변으로! 1 file 2017.09.05 이지원 19194
국내 도시재생의 성공 사례, <인천 개항로> 2 file 2022.02.28 김다희 9906
국가란 무엇인가 - 유시민 file 2017.09.26 홍도현 13141
국가간 청소년 교류를 통한 민간외교관 되어보기 file 2016.07.22 변지원 12462
구한말 개화기로 돌아가다, 논산 선샤인랜드 file 2018.12.19 정호일 22177
구일고등학교의 아이돌 'KD'를 소개합니다 file 2017.03.25 임수윤 18547
구영회, NFC 우승팀과의 경기에서 맹활약...팀은 완패 file 2021.09.28 윤형선 8003
구석기시대가 살아 숨쉬는 연천, 구석기축제 성공적 마무리 1 file 2017.05.19 이태양 11665
구민들을 위한 "2017 중랑 북 페스티벌" 1 file 2017.10.27 이지현 13992
구립증산정보도서관 '도서관 길 위의 인문학', 옛이야기에 담겨있는 인문학 만나기 file 2022.05.17 이지원 8079
구립 은뜨락도서관, 북한산 인문포럼 : ‘나는 북한산 아래 산다’ 프로그램 운영 file 2022.05.30 이지원 7631
구리시 사랑의 도시락, 소외된 이웃들에게 사랑을 전해요. 6 file 2017.08.20 오경서 12165
구름의 생성과정 4 2017.07.04 장민경 15293
구름도 떨어지고 있다! file 2021.05.26 윤수정 11670
구글이 바라는 이상적인 통신사 Made by Google 통신사 : Google Fi file 2019.02.28 정성원 19981
구글의 빅데이터, 어디까지 알 수 있을까? file 2018.01.23 신온유 16098
구글, 차기 안드로이드 블루투스 고음질 'LDAC' 코덱 기본 탑재! file 2017.05.22 김지훈 21828
구구단 첫 팬미팅, <9원 9일의 구구단짝> file 2017.11.06 이지나 13746
교통카드에 선불결제까지... 청소년증 발급하고 할인혜택 받으세요. 15 file 2017.01.22 오경서 24309
교토의 랜드마크라고 불리는 청수사, 알고 보면 백제의 죽마고우(竹馬故友)? 6 file 2016.02.23 안민 21651
교토, 일본 본연의 도시 7 file 2018.08.20 이승철 16603
교육체제가 아닌 교육 제재 2021.04.01 박지은 10682
교육봉사? "선생님이 꿈인 친구들 여기여기 모여라~!" 2 file 2017.08.25 이승연 13261
교육, 뭐시 중헌디? (교육 받을 권리 고려해봐야.) 1 file 2016.08.01 오성용 17745
교육 기술의 모든 것을 한곳에서! 2017교육박람회(EDUTEC) 9 file 2017.01.21 노유진 19216
교보교육재단, 창의적 인재육성프로그램 체인지 프로그램 성공적 개최 1 file 2017.07.11 이태양 14090
교보교육재단, ‘백년을 잇는 포용의 리더십’ 성공적 마무리 file 2017.10.10 이태양 13505
광주시 이웃사랑 걷기캠페인 성황리에 마쳐 file 2017.06.23 전은지 11855
광주광역시의 대표하천, 광주천 file 2022.02.14 채원희 7691
광주, 3.1절 100주년 기념행사 '그날의 함성이 울려퍼지다' 1 file 2019.03.06 조햇살 15703
광주 프린지 페스티벌, 그 멋과 열정 속으로 1 file 2017.09.22 김서영 14970
광주 트라우마센터 치유의 인문학 시인 박준, "슬픔은 자랑이 될 수 있다" 1 file 2017.09.25 이세림 14259
광주 기아 챔피언스필드에 가보다 2 file 2017.09.07 장세인 13565
광주 국립아시아문화전당 하늘마당, 빛과 그림자 file 2017.06.25 이세림 19251
광정동청소년문화의집, '코딩과 인공지능' 주제로 스마트한 생활과학교실 운영 file 2022.07.13 이지원 9164
광운대 아이스하키팀, 96년 만에 환호성 질러 2 file 2017.02.19 김연수 15692
광복절, 안성에서 그들을 기억하다 1 file 2018.08.27 안정섭 12535
광복의 환희와 되찾은 조국의 상징인 서대문형무소역사관을 방문해보는 것은 어떨까? 1 file 2019.01.08 이채린 12887
광복72주년???빗속에서 열린 겨례의 '2017 서대문독립민주축제' 2017.08.30 문성환 12906
광복 72주년 기념 해방 거리 재현 행사 '사람의 나라' file 2017.08.17 박규리 11547
목록
Board Pagination Prev 1 ... 67 68 69 70 71 72 73 74 75 76 ... 97 Next
/ 97
new_side_09.png
new_side_10.png
new_side_11.png