🧩 BE

동아일보 대시보드 효용성 검증 지표 추출

Assigned To
Date
2026/02/13
Status
Done
Type
Document
DB
Table of contents

Request

MVP 목적 및 검증 가설

1.1. 목적
동아닷컴 메인 화면 기사의 성과를 실시간 모니터링하여 유지 또는 교체 여부를 신속히 결정하기 위함
1.2 검증 가설
메인 기사 성과를 실시간으로 확인할 수 있는 대시보드를 제공할 경우 편집 운영 시간동안 해당 대시보드의 접속 빈도가 증가, 성과가 부진한 메인 기사의 평균 노출 시간이 감소할 것

MVP 검증 지표

대시보드 체류 시간 및 접속 빈도 : 운영 시간 중 평균 접속 횟수 (동아닷컴 조회수 기능 도입 전/후 비교)
부진 기사 노출 시간 : 성과 기준 이하 기사들의 평균 메인 노출 시간 (동아닷컴 조회수 기능 도입 전/후 비교)
핵심 데이터 매칭률 : 대시보드 확인 후 실제 기사 교체, 조정 발생 비율 (데이터 수집 난이도로 인한 대안 지표 추출)

Task

1. DB Table 확인

daily_view_count daum_article donga_article issue_analysis issue_cluster live_list naver_article naver_article_reader_analysis naver_article_referrer naver_article_referrer_url naver_article_view naver_dandok_sokbo naver_main_articles naver_main_articles_view_count top_articles transcript_chunks transcript_summary

2. 내부 데이터 확인

대시보드 체류 시간 및 접속 빈도 → 확인 불가. 추후 내부 메트릭 저장 및 분석 기능을 도입한다면 가능
내부 오퍼레이터를 연결해둔게 없음. 그냥 접속자 IP, 기기에 대한 로그 뿐이라 해당 접속자의 나이, 성별, 어떤 기능을 주로 이용했는지 등의 내용은 파악이 불가능.
AccessLogMiddleware에서 접속 로그를 수집하고 있음. 그런데 따로 저장해두진 않음. 이 로그 데이터를 정규화 해서 db에 저장해보면 대시보드 사용 현황, 월별 접속률 등을 알 수 있음.
지금은 대시보드 내부 데이터에 대해서는 아무것도 얻을 수 있는게 없음. 대시보드가 외부에서 데이터를 수집하고 있는 기능만 존재.
부진 기사 노출 시간view_count 데이터를 통해 기준 이하 기사들 노출 시간 수집 가능 (대시보드 전 후 데이터는 대시보드 서비스가 언제부터 올라갔는지에 대한 기간을 살펴봐야함, 중간에 DB 이관 작업도 있어서 전체 수집 기간을 가져오기엔 어느정도 한계가 있을 듯)
핵심 데이터 매칭률 → “대시보드 확인 후” 실제 기사 교체, 조정 비율은 대시보드를 확인한 순간의 데이터가 필요한데, 데이터 수집이 불가능함.

3. 관련 지표 추출

부진 기사 노출 시간 : naver_main_articles + naver_main_articles_view_count
메인 노출 시간 → naver_main_articles : updated_at - created_at
조회수 증가 속도 → 연속 view_count 레코드 간 차이 / 시간 간격 naver_main_articles_view_count
초기 반응 (첫 30분) → created_at 이후 30분 이내 view_count 합산 naver_main_articles_view_count
정체 감지 → 최근 N개 스냅샷에서 view_count 증가량이 임계값 미만 naver_main_articles_view_count
부진 기사 판별 기준 예시 : 메인 배치 후 30분 경과 && 조회수 증가 속도 < 같은 시간대 평균의 50%
핵심 데이터 매칭률 → 대시보드 확인 후 기사 조정 등은 사용자 본인이 직접 기록하는거 이외에는 데이터화 되어 있는게 없음..
대안 지표 (간접적으로 연관되는)
메인 기사 평균 수명
부진 기사 평균 수명 ← 이게 MVP 검증용으로는 제일 써먹을 만 한 것 같음.
메인 기사 교체 빈도
부진 기사 이탈 시점 조회수
메인 기사 조회수 하위 비율
추가 지표
부진 기사 이탈 시점 조회 수 → 마지막 view_count 기준으로 조회.
메인 기사 조회수 하위 비율 → 메인 기사 조회수 하위 20%의 비중 변화 naver_main_articles_view_count 분위 수 분석해서 하위 추출

결론

현재 대시보드 내부 데이터 수집 파이프라인이 존재하지 않아서, 대시보드를 사용함으로써 뭔가 좋아지고 나빠지고 한 부분을 직접적으로(대시보드 사용량, 대시보드 접속량 증가 추세, 대시보드 사용자 정보, 대시보드 조회 이후 기사 교체, 조정 비율 등) 알 수는 없음.
대신 대시보드를 사용하기 시작한 시점 전 후 데이터를 비교해보며 대시보드 사용이 전반적인 데이터에 어떤 영향을 미쳤는지에 대한 큰 흐름은 분석이 가능할 것으로 보임.
그래서 대시보드 도입일을 기준으로,
1.
부진 기사 메인 노출 시간 변화 (핵심 가설 검증)
2.
조회수 하위 기사의 노출 시간 변화
3.
메인 기사 교체 빈도 변화
4.
전체 조회수 추이 변화
5.
메인 기사 초기 반응 속도 변화 (메인 배치 이후 첫 30분 조회수. 편집자가 좋은 기사를 고르는 눈이 좋아졌는지?)
6.
운영 시간대 vs 비운영 시간대 메인 기사 성과 차이
정도의 지표 추출을 해서 정량적 비교가 가능할 것 같음.