수행 업무 목록
업무 | 일자 | 세부 사항 |
다음 로그인 이슈 해결 | 2026년 1월 26일 | |
인턴 인수인계 문서 확인 및 코드 구조 파악 | 2026년 1월 26일 → 2026년 1월 28일 | - |
D리포트 일자별 조회 로직 개선 | 2026년 1월 29일 | |
D리포트 데이터 수동 머지 | 2026년 1월 30일 | |
D리포트 파이프라인 스케줄링 활성화 | 2026년 2월 2일 | |
동아 AWS 비용 최적화 보고서 작성 | 2026년 2월 3일 | |
레거시 인스턴스(donga_kit_1) 백업 및 인스턴스 다운 | 2026년 2월 4일 | |
동아닷컴 크롤링 데이터 확장 | 2026년 2월 5일 | |
DB 및 서버 가용성 최적화 | 2026년 2월 5일 → 2026년 2월 9일 | |
내부 DB 접속 가이드라인 작성 | 2026년 2월 9일 | |
공통 스키마 및 예외 처리 모듈 구현 | 2026년 2월 10일 | |
개별 기사 데이터 분석 조회수 오차 개선 | 2026년 2월 11일 → 2026년 2월 20일 | |
회사 기사 수집용 서버 인터넷 끊김 현상 해결 | 2026년 2월 12일 | |
네이버 로그인 이슈 해결 | 2026년 2월 12일 | |
동아일보 대시보드 효용성 검증 지표 추출 | 2026년 2월 12일 → 2026년 2월 13일 | |
분석 조회수 모니터링, 동시성 최적화 이슈 | 2026년 2월 13일 | |
시스템 내 GA4 토큰 소비 분석 | 2026년 2월 23일 | |
대시보드 현행 기능 개선 및 추가 기능 분석 | 2026년 2월 22일 → 2026년 2월 24일 | |
AWS 비용 모니터링 결과 보고 | 2026년 2월 24일 | |
OpenAI 시스템 내부 사용 현황 파악 | 2026년 2월 24일 | |
대시보드 수집 데이터 추가 | 2026년 2월 26일 | |
대시보드 효용성 검증 1차 보고서 | 2026년 2월 27일 | |
대시보드 인증/인가 기능 도입 관련 필요 기능 정의 | 2026년 2월 27일 |
업무 요약
•
네이버, 다음 기사 수집 이슈 해결
•
D리포트 데이터 누락 분량 재수집 및 파이프라인 정상화
•
동아닷컴 데이터 크롤링 범위 확장
•
AWS 인프라 최적화를 통한 서버 비용 절감
•
서버 및 DB 데이터 저장 로직 최적화를 통한 유지보수 비용 절감
•
전체 API 응답 형식 통일
•
수집 파이프라인 추가로 대시보드 - GA 데이터 오차 개선
•
대시보드 운영 전 후 PV 데이터를 분석하여 현행 대시보드 효용성 검증
주요 성과
성과 항목 | 결과 |
서버 재배포시 콜드스타트 제거 | DB 커넥션 풀 최적화로, 기능 수정 후 다시 서버 실행 시 최대 3초간 응답 지연되는 현상 제거 |
예외처리 관련 중복 코드 통합 | 라우터들에 흩어져 있던 try-except 코드 공통 모듈로 통합, retry 데코레이터 추가 |
대시보드 및 국회 서버 빌드 속도 개선 | setuptools → hatching 으로 배포 방식 변경. 전체 빌드 처리 속도 약 40% 감소 (평균 2분 15초 → 1분 22초) |
AWS 서버 인프라 비용 감축 | 레거시 ec2 인스턴스 다운 → 비용 70% 감소 (월별 122$ → 41$) |
GA4 데이터 수집 파이프라인 개선 | 동일 토큰으로 한 번에 5개 기사 → 100개 기사 수집이 가능하도록 알고리즘 개선 (처리 속도 약 18배 증가) |
월별 조회수 데이터 정확도 개선 | Lambda, SQS 추가를 통해 8-14 / 15-22 / 22-30 기간을 배치 수집하는 파이프라인 신규 구축
기존 7일치 데이터만 업데이트 → 당일 기준 30일치 데이터 조회수 업데이트 (뒤늦게 조회수가 상승한 데이터도 집계) |
대시보드 효용성 지표 분석 | 기존 버전 대비 부진 기사 노출 시간 29% 감소, 기사 교체 빈도 10% 증가, 비운영 시간대 조회수 17% 향상 |
시스템 아키텍처 개선 | 하단 이미지 첨부 |

