AI · Automation
데이터 정리 · 자동화
역할
AI 자동화 · 데이터 정리
연도
2025
카테고리
AI · Automation
기술 스택
Python, ChatGPT API, Google Sheets, n8n
Madeybridge Workflow
대기
1
📧
이메일 수신
Gmail Trigger
2
📄
데이터 추출
AI Parser
3
🔗
거래처 매칭
DB Lookup
4
📊
엑셀 저장
Google Sheets
5
🔔
알림 전송
Slack / Email
프로젝트 소개
여러 소스에 흩어진 대량의 비정형 데이터를 체계적으로 정리하고 구조화한 프로젝트입니다. ChatGPT API와 Python을 활용하여 데이터 클렌징, 카테고리 분류, 포맷 통일 등의 반복 작업을 자동화했습니다. n8n 워크플로우와 Google Sheets 연동으로 지속적인 데이터 관리 파이프라인을 구축했습니다.
madeybridge — automate.pybash
Last login: Mon Apr 12 09:14:22 on ttys001
$ python automate.py --source ./data/raw --batch 100000
[09:14:25] 소스 스캔 중... 12개 파일 감지 (xlsx, csv, pdf)
[09:14:25] 배치 사이즈: 100,000건 | 병렬 워커: 4개
── Phase 1: 데이터 수집 ──────────────────────────
[✓] invoice_2024.xlsx 38,420건 로드 (2.1s)
[✓] clients_master.csv 4,312건 로드 (0.3s)
[✓] receipts_q1-q4.pdf 12,847건 OCR 추출 (8.4s)
[✓] shipping_log.xlsx 91,203건 로드 (4.7s)
[09:14:41] 총 146,782건 수집 완료
── Phase 2: AI 매칭 & 분류 ───────────────────────
[✓] 거래처 매칭 146,782건 → 99.1% 매칭
[✓] 카테고리 자동 분류 8개 카테고리 분류 완료
[!] 미매칭 1,314건 → fallback_review.xlsx 저장
── Phase 3: 출력 생성 ────────────────────────────
[✓] 월별 정산 리포트 12건 생성 (PDF)
[✓] 거래처별 요약 시트 생성 (Excel)
[✓] 자동 메일 발송 대기열 등록 — 47건
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
완료 | 146,782건 처리 | 소요 시간: 1분 47초
수작업 예상: 약 18시간 → 자동화: 1분 47초 (600x)
Task Monitor
4/6 완료
작업
상태
처리량
소요
정확도
인보이스 자동 분류
● 완료38,420
2.1s
99.4%
거래처 데이터 매칭
● 완료91,203
4.7s
99.1%
PDF OCR 추출
● 완료12,847
8.4s
97.8%
카테고리 자동 분류
● 완료146,782
12.3s
98.7%
월별 리포트 생성
◐ 진행중12
—
—
메일 발송 대기열
○ 대기47
—
—
총 처리: 146,782건 | 평균 정확도: 98.8%수작업 18h → 자동 1m 47s