Table of contents
Request
MVP 목적 및 검증 가설
1.1. 목적
동아닷컴 메인 화면 기사의 성과를 실시간 모니터링하여 유지 또는 교체 여부를 신속히 결정하기 위함
1.2 검증 가설
메인 기사 성과를 실시간으로 확인할 수 있는 대시보드를 제공할 경우 편집 운영 시간동안 해당 대시보드의 접속 빈도가 증가, 성과가 부진한 메인 기사의 평균 노출 시간이 감소할 것
MVP 검증 지표
•
대시보드 체류 시간 및 접속 빈도 : 운영 시간 중 평균 접속 횟수 (동아닷컴 조회수 기능 도입 전/후 비교)
•
부진 기사 노출 시간 : 성과 기준 이하 기사들의 평균 메인 노출 시간 (동아닷컴 조회수 기능 도입 전/후 비교)
•
핵심 데이터 매칭률 : 대시보드 확인 후 실제 기사 교체, 조정 발생 비율 (데이터 수집 난이도로 인한 대안 지표 추출)
Task
1. DB Table 확인
daily_view_count
daum_article
donga_article
issue_analysis
issue_cluster
live_list
naver_article
naver_article_reader_analysis
naver_article_referrer
naver_article_referrer_url
naver_article_view
naver_dandok_sokbo
naver_main_articles
naver_main_articles_view_count
top_articles
transcript_chunks
transcript_summary
2. 내부 데이터 확인
•
대시보드 체류 시간 및 접속 빈도 → 확인 불가. 추후 내부 메트릭 저장 및 분석 기능을 도입한다면 가능
◦
내부 오퍼레이터를 연결해둔게 없음.
그냥 접속자 IP, 기기에 대한 로그 뿐이라 해당 접속자의 나이, 성별, 어떤 기능을 주로 이용했는지 등의 내용은 파악이 불가능.
◦
AccessLogMiddleware에서 접속 로그를 수집하고 있음. 그런데 따로 저장해두진 않음. 이 로그 데이터를 정규화 해서 db에 저장해보면 대시보드 사용 현황, 월별 접속률 등을 알 수 있음.
◦
지금은 대시보드 내부 데이터에 대해서는 아무것도 얻을 수 있는게 없음. 대시보드가 외부에서 데이터를 수집하고 있는 기능만 존재.
•
부진 기사 노출 시간 → view_count 데이터를 통해 기준 이하 기사들 노출 시간 수집 가능 (대시보드 전 후 데이터는 대시보드 서비스가 언제부터 올라갔는지에 대한 기간을 살펴봐야함, 중간에 DB 이관 작업도 있어서 전체 수집 기간을 가져오기엔 어느정도 한계가 있을 듯)
•
핵심 데이터 매칭률 → “대시보드 확인 후” 실제 기사 교체, 조정 비율은 대시보드를 확인한 순간의 데이터가 필요한데, 데이터 수집이 불가능함.
3. 관련 지표 추출
•
부진 기사 노출 시간 : naver_main_articles + naver_main_articles_view_count
◦
메인 노출 시간 → naver_main_articles : updated_at - created_at
◦
조회수 증가 속도 → 연속 view_count 레코드 간 차이 / 시간 간격 naver_main_articles_view_count
◦
초기 반응 (첫 30분) → created_at 이후 30분 이내 view_count 합산
naver_main_articles_view_count
◦
정체 감지 → 최근 N개 스냅샷에서 view_count 증가량이 임계값 미만
naver_main_articles_view_count
◦
부진 기사 판별 기준 예시 : 메인 배치 후 30분 경과 && 조회수 증가 속도 < 같은 시간대 평균의 50%
•
핵심 데이터 매칭률 → 대시보드 확인 후 기사 조정 등은 사용자 본인이 직접 기록하는거 이외에는 데이터화 되어 있는게 없음..
◦
대안 지표 (간접적으로 연관되는)
▪
메인 기사 평균 수명
▪
부진 기사 평균 수명 ← 이게 MVP 검증용으로는 제일 써먹을 만 한 것 같음.
▪
메인 기사 교체 빈도
▪
부진 기사 이탈 시점 조회수
▪
메인 기사 조회수 하위 비율
•
추가 지표
부진 기사 이탈 시점 조회 수 → 마지막 view_count 기준으로 조회.
메인 기사 조회수 하위 비율 → 메인 기사 조회수 하위 20%의 비중 변화 naver_main_articles_view_count 분위 수 분석해서 하위 추출
결론
현재 대시보드 내부 데이터 수집 파이프라인이 존재하지 않아서, 대시보드를 사용함으로써 뭔가 좋아지고 나빠지고 한 부분을 직접적으로(대시보드 사용량, 대시보드 접속량 증가 추세, 대시보드 사용자 정보, 대시보드 조회 이후 기사 교체, 조정 비율 등) 알 수는 없음.
대신 대시보드를 사용하기 시작한 시점 전 후 데이터를 비교해보며 대시보드 사용이 전반적인 데이터에 어떤 영향을 미쳤는지에 대한 큰 흐름은 분석이 가능할 것으로 보임.
그래서 대시보드 도입일을 기준으로,
1.
부진 기사 메인 노출 시간 변화 (핵심 가설 검증)
2.
조회수 하위 기사의 노출 시간 변화
3.
메인 기사 교체 빈도 변화
4.
전체 조회수 추이 변화
5.
메인 기사 초기 반응 속도 변화 (메인 배치 이후 첫 30분 조회수. 편집자가 좋은 기사를 고르는 눈이 좋아졌는지?)
6.
운영 시간대 vs 비운영 시간대 메인 기사 성과 차이
정도의 지표 추출을 해서 정량적 비교가 가능할 것 같음.