🧩 BE

2026 2월 업무보고

인원
윤건우
기간
2026/01/26 → 2026/02/28

수행 업무 목록

업무
일자
세부 사항
다음 로그인 이슈 해결
2026년 1월 26일
인턴 인수인계 문서 확인 및 코드 구조 파악
2026년 1월 26일 → 2026년 1월 28일
-
D리포트 일자별 조회 로직 개선
2026년 1월 29일
D리포트 데이터 수동 머지
2026년 1월 30일
D리포트 파이프라인 스케줄링 활성화
2026년 2월 2일
동아 AWS 비용 최적화 보고서 작성
2026년 2월 3일
레거시 인스턴스(donga_kit_1) 백업 및 인스턴스 다운
2026년 2월 4일
동아닷컴 크롤링 데이터 확장
2026년 2월 5일
DB 및 서버 가용성 최적화
2026년 2월 5일 → 2026년 2월 9일
내부 DB 접속 가이드라인 작성
2026년 2월 9일
공통 스키마 및 예외 처리 모듈 구현
2026년 2월 10일
개별 기사 데이터 분석 조회수 오차 개선
2026년 2월 11일 → 2026년 2월 20일
회사 기사 수집용 서버 인터넷 끊김 현상 해결
2026년 2월 12일
네이버 로그인 이슈 해결
2026년 2월 12일
동아일보 대시보드 효용성 검증 지표 추출
2026년 2월 12일 → 2026년 2월 13일
분석 조회수 모니터링, 동시성 최적화 이슈
2026년 2월 13일
시스템 내 GA4 토큰 소비 분석
2026년 2월 23일
대시보드 현행 기능 개선 및 추가 기능 분석
2026년 2월 22일 → 2026년 2월 24일
AWS 비용 모니터링 결과 보고
2026년 2월 24일
OpenAI 시스템 내부 사용 현황 파악
2026년 2월 24일
대시보드 수집 데이터 추가
2026년 2월 26일
대시보드 효용성 검증 1차 보고서
2026년 2월 27일
대시보드 인증/인가 기능 도입 관련 필요 기능 정의
2026년 2월 27일

업무 요약

네이버, 다음 기사 수집 이슈 해결
D리포트 데이터 누락 분량 재수집 및 파이프라인 정상화
동아닷컴 데이터 크롤링 범위 확장
AWS 인프라 최적화를 통한 서버 비용 절감
서버 및 DB 데이터 저장 로직 최적화를 통한 유지보수 비용 절감
전체 API 응답 형식 통일
수집 파이프라인 추가로 대시보드 - GA 데이터 오차 개선
대시보드 운영 전 후 PV 데이터를 분석하여 현행 대시보드 효용성 검증

주요 성과

성과 항목
결과
서버 재배포시 콜드스타트 제거
DB 커넥션 풀 최적화로, 기능 수정 후 다시 서버 실행 시 최대 3초간 응답 지연되는 현상 제거
예외처리 관련 중복 코드 통합
라우터들에 흩어져 있던 try-except 코드 공통 모듈로 통합, retry 데코레이터 추가
대시보드 및 국회 서버 빌드 속도 개선
setuptoolshatching 으로 배포 방식 변경. 전체 빌드 처리 속도 약 40% 감소 (평균 2분 15초 → 1분 22초)
AWS 서버 인프라 비용 감축
레거시 ec2 인스턴스 다운 → 비용 70% 감소 (월별 122$ → 41$)
GA4 데이터 수집 파이프라인 개선
동일 토큰으로 한 번에 5개 기사 → 100개 기사 수집이 가능하도록 알고리즘 개선 (처리 속도 약 18배 증가)
월별 조회수 데이터 정확도 개선
Lambda, SQS 추가를 통해 8-14 / 15-22 / 22-30 기간을 배치 수집하는 파이프라인 신규 구축 기존 7일치 데이터만 업데이트 → 당일 기준 30일치 데이터 조회수 업데이트 (뒤늦게 조회수가 상승한 데이터도 집계)
대시보드 효용성 지표 분석
기존 버전 대비 부진 기사 노출 시간 29% 감소, 기사 교체 빈도 10% 증가, 비운영 시간대 조회수 17% 향상
시스템 아키텍처 개선
하단 이미지 첨부

기존 아키텍처

변경 아키텍처