AI · Automation

데이터 정리 · 자동화

역할

AI 자동화 · 데이터 정리

연도

2025

카테고리

AI · Automation

기술 스택

Python, ChatGPT API, Google Sheets, n8n

Madeybridge Workflow
대기
1
📧

이메일 수신

Gmail Trigger

2
📄

데이터 추출

AI Parser

3
🔗

거래처 매칭

DB Lookup

4
📊

엑셀 저장

Google Sheets

5
🔔

알림 전송

Slack / Email

프로젝트 소개

여러 소스에 흩어진 대량의 비정형 데이터를 체계적으로 정리하고 구조화한 프로젝트입니다. ChatGPT API와 Python을 활용하여 데이터 클렌징, 카테고리 분류, 포맷 통일 등의 반복 작업을 자동화했습니다. n8n 워크플로우와 Google Sheets 연동으로 지속적인 데이터 관리 파이프라인을 구축했습니다.

madeybridge — automate.pybash
Last login: Mon Apr 12 09:14:22 on ttys001
$ python automate.py --source ./data/raw --batch 100000
[09:14:25] 소스 스캔 중... 12개 파일 감지 (xlsx, csv, pdf)
[09:14:25] 배치 사이즈: 100,000건 | 병렬 워커: 4개
── Phase 1: 데이터 수집 ──────────────────────────
[✓] invoice_2024.xlsx 38,420건 로드 (2.1s)
[✓] clients_master.csv 4,312건 로드 (0.3s)
[✓] receipts_q1-q4.pdf 12,847건 OCR 추출 (8.4s)
[✓] shipping_log.xlsx 91,203건 로드 (4.7s)
[09:14:41] 총 146,782건 수집 완료
── Phase 2: AI 매칭 & 분류 ───────────────────────
[✓] 거래처 매칭 146,782건 → 99.1% 매칭
[✓] 카테고리 자동 분류 8개 카테고리 분류 완료
[!] 미매칭 1,314건 → fallback_review.xlsx 저장
── Phase 3: 출력 생성 ────────────────────────────
[✓] 월별 정산 리포트 12건 생성 (PDF)
[✓] 거래처별 요약 시트 생성 (Excel)
[✓] 자동 메일 발송 대기열 등록 — 47건
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
완료 | 146,782건 처리 | 소요 시간: 1분 47초
수작업 예상: 약 18시간 → 자동화: 1분 47초 (600x)
Task Monitor
4/6 완료

작업

상태

처리량

소요

정확도

인보이스 자동 분류

● 완료

38,420

2.1s

99.4%

거래처 데이터 매칭

● 완료

91,203

4.7s

99.1%

PDF OCR 추출

● 완료

12,847

8.4s

97.8%

카테고리 자동 분류

● 완료

146,782

12.3s

98.7%

월별 리포트 생성

◐ 진행중

12

메일 발송 대기열

○ 대기

47

총 처리: 146,782건 | 평균 정확도: 98.8%수작업 18h → 자동 1m 47s