Portfolio
SIGMOID AI
이노디스AX
생성형 LLM과 Semantic Search를 결합한 RAG 기반 AI 검색 시스템 설계 및 개발
프로젝트 소개
도메인 문서, 로그, 구조화/비구조화 데이터를 통합하여 정확도 중심의 검색 품질 향상을 목표
담당 업무
- 범용 파일 인덱싱 시스템 개발
- 텍스트, 수식, 도표, 이미지가 포함된 PDF 지원
- VLM 기반 문서 파싱 후 Markdown 형태로 구조화
- Semantic Search 파이프라인 설계
- Dense Embedding 기반 Retrieval 구조 설계
- 도메인 특성에 맞춘 Chunking 전략 및 문서 전처리 파이프라인 구현
- Vector DB 기반 Top-K 후보군 추출 및 검색 latency 최적화
- Agent 기반 RAG 시스템
- LangChain, LangGraph 기반 Agent 설계
- Function Calling을 활용한 DB 검색 → Reranker → 응답 생성 파이프라인 구현
- Hallucination 감소 전략
- 응답 생성 과정에 reasoning(thinking) 단계 추가
- Context 검증 로직을 통한 응답 신뢰도 향상
- 대용량 데이터 처리
- 문서/쿼리 로그 기반 데이터셋 구축
- 배치 임베딩 파이프라인 및 재색인 자동화
SIGMOID LLM Manager
이노디스AX
도메인·상태 기반 LLM API 라우팅 및 서빙 최적화 시스템
프로젝트 소개
요청 도메인, 트래픽 상태, 모델 성능을 고려하여 최적의 LLM을 동적으로 선택하는 시스템
담당 업무
- LLM 라우팅 로직 설계
- 도메인별 모델 정책 정의 (예: 검색 특화 / 요약 특화 / 비용 최적화)
- 모델 상태(응답 지연, 오류율)에 따른 Failover 및 우선순위 라우팅 구현
- 서빙 안정성 강화
- 모델 헬스 체크 및 상태 모니터링 로직 구현
- 장애 상황에서 자동 대체 모델 전환 구조 설계
- API 통계 및 시각화
- 프로메테우스 및 그라파나를 이용한 통계 및 시각화
Code2Chart
슈어소프트테크(주)
C 언어 기반 Mermaid chart 생성 LLM
프로젝트 소개
C 언어 코드의 함수 구조 및 로직을 분석하여 Mermaid 문법의 Flowchart로 변환하는 도메인 특화 sLLM 개발
담당 업무
- LLM 파인튜닝 파이프라인 구축
- llama 3.1-8B 모델 기반
- Continual Pretraining(CPT), Instruction Tuning, Supervised Fine-tuning(SFT) 단계별 수행
- CUDA, PyTorch, Transformers 기반 학습 환경 구성
- 데이터 및 실험 관리
- WandB, MLflow, DVC를 활용한 데이터·모델·실험 이력 관리
- 재현 가능한 학습 파이프라인 구축
- 정량 성능 개선
- 자체 구축 벤치마크 기준
- Base Model 33점 → Fine-tuned Model 67점으로 성능 향상
- 모델 서빙 및 배포
- sgLang 기반 LLM 서빙 환경 구성
- 사내 배포 및 QA를 통한 실사용 검증
LLM Benchmark
슈어소프트테크(주)
도메인 특화 sLLM 정량 평가를 위한 LLM-as-a-Judge 벤치마크
프로젝트 소개
도메인 특화 sLLM 정량 평가를 위한 LLM-as-a-Judge 벤치마크
담당 업무
- 평가 프레임워크 설계
- Chain-of-Thought 기반 평가 템플릿 설계
- Mermaid Flowchart 품질 평가를 위한 10개 세부 평가 항목 정의
- 자동화된 평가 시스템 구축
- LLM-as-a-Judge 방식으로 대규모 평가 자동화
- 모델 반복 개선에 적합한 평가 파이프라인 구현
- 신뢰도 검증
- Ground Truth 데이터 100개 구축
- 평가 결과 신뢰도 89.5% 달성
Distributed Human Activity Recognition System for Scalable Wi-Fi Sensing
INC Lab.
확장 가능한 Wi-Fi 센싱을 위한 분산형 인체 활동 인식 시스템
프로젝트 소개
기존 Wi-Fi based Human Activity Recognition (HAR) 연구의 취약점 보완
담당 업무
- 기존 대비 데이터 사용량 1/N로 감소
- 분산 센싱 시스템 적용 및 센싱 데이터 랜덤 셔플링을 통한 도청 데이터 효용성 저하
- 결과적으로 1/N 데이터로 90% 행동 분석 정확도 달성
- 도청자 모델 정확도 평균 30% 미만 달성으로 도청 방지
GuardianWatch
졸업작품
다중 객체 추적 기술을 활용한 어린이집 안전 모니터링 시스템
프로젝트 소개
비전 AI 기반 어린이집 CCTV 분석 및 안전 모니터링 시스템 — 어린이집 CCTV 영상을 분석하여 아동의 위치, 행동, 활동량 정보를 추출하고, 학부모 앱에 알림 및 분석 정보를 제공하는 비전 AI 프로젝트
담당 업무
- 다중 객체 탐지 및 추적 시스템 구축
- YOLOX 기반 인원 탐지 및 ByteTrack 기반 다중 객체 추적 파이프라인 구현
- 다수 인원이 밀집된 CCTV 환경에서도 안정적인 ID 유지 성능 확보
- 행동 인식 및 활동 분석
- SlowR50 모델을 활용한 행동 분류 및 활동 상태 분석
- 객체 위치 정보를 기반으로 이동 경로, 체류 히트맵, 소비 칼로리 추정 기능 구현
- Re-ID 문제 완화 알고리즘 개발
- CCTV 영상 내 객체 ID 스위칭 문제 분석
- Bluetooth RSSI 기반 위치 정보를 결합한 멀티모달 보정 알고리즘 설계
- ID 유지 정확도 향상 및 장기 추적 안정성 개선
- 프라이버시 보호 및 서비스 적용
- Bird-Eye-View(BEV) 변환을 통한 영상 비식별화 처리
🏆 [은상] K-디지털 챌린지 : NET 챌린지 캠프 시즌10 (과학기술정보통신부 주최)
Skills & Tools
| 구분 | 많이 해봤어요 | 해본 적 있어요 |
|---|---|---|
| Language | Python | C#C/C++LuaRustTypeScript |
| Backend | DjangoFastAPIFlaskREST API | SpringBoot |
| Frontend | CSS3GradioHTML5Streamlit | JavaScriptTypeScript |
| Database | ElasticSearchFirebaseMySQLNoSQLOpensearch | PostgreSQL |
| DevOps | DockerGitGitHub | K8S |
| MLOps | PyTorchWandB | MLflow |
| LLM Serving | TGIsgLangvLLM | |
| Fine-tuning | LLama-factoryLoRAQLoRASFT | |
| LLMOps | AgentLangChainRAGRerankVectorDB | CrewAI |
| CI/CD | GitHub Actions | Jenkins |
| Tools | FigmaJiraSlack | Miro |