익_3t29ms
14k
19.09.09

pgr21에서 나온 글임
원래는 이걸 다른 정보를 찾다가 알게된건데
여기서 말하는 검색어가 좀 그런 소재라서 다른걸로 비유해서 설명함

네이마르를 검색한다고 치자
,지난 일주일간 뜬 기사가 251건이나 된다고 한다
그렇다면 이제 이걸 하루 단위로 쪼개서 세어보자

9월 8일 24건

9월 7일 23건

9월 6일 27건

9월 5일 19건

9월 4일 18건

9월 3일 15건

9월 2일 10건
9월 1일 10건

9월 1일부터 8일까지 하루단위로 찾아낸 기사량 : 146건
9월 1일부터 8일까지 일주일 단위로 찾아낸 기사량 : 251건
딱봐도 뭔가 이상하지 않은가?
이런 오차는 기사가 많이 나오는 다른 검색어를 적용하면 차이가 심하게 난다
이번에 최근 핫했던 그 태풍을 검색해보자

9월 1일부터 8일까지 약 2만 6천건이 넘게 나왔다고 소개하고 있다
(9일 찍히는건 이글쓰는 도중에 자정이 넘어가서 그럼)
이것도 하루 단위로 쪼개보면 오차가 심하게 난다



1일부터 3일까지 대략 1000건

4일 반올림 해서 약 2000건

5일 반올림 해서 약 3000건

6일 약 4000건

7일 약 5000건

8일 약 2000건

어림잡아 계산해도 도합 17000건
26000여건이었던 일주일 결과랑 비교하면 약 35%정도 뻥튀기된다
이게 어떤 알고리즘으로 결과가 나오는지는 모르겠는데 적어도 지금 날짜별검색 필터가 맛이 간건 확실한듯
요약 : 뉴스검색은 Daum





