Portfolio

SIGMOID AI

이노디스AX

생성형 LLM과 Semantic Search를 결합한 RAG 기반 AI 검색 시스템 설계 및 개발

DjangoLangChainLangGraphRAGElasticsearchOpensearchDockerMySQLPython

프로젝트 소개
도메인 문서, 로그, 구조화/비구조화 데이터를 통합하여 정확도 중심의 검색 품질 향상을 목표

담당 업무

  • 범용 파일 인덱싱 시스템 개발
    • 텍스트, 수식, 도표, 이미지가 포함된 PDF 지원
    • VLM 기반 문서 파싱 후 Markdown 형태로 구조화
  • Semantic Search 파이프라인 설계
    • Dense Embedding 기반 Retrieval 구조 설계
    • 도메인 특성에 맞춘 Chunking 전략 및 문서 전처리 파이프라인 구현
    • Vector DB 기반 Top-K 후보군 추출 및 검색 latency 최적화
  • Agent 기반 RAG 시스템
    • LangChain, LangGraph 기반 Agent 설계
    • Function Calling을 활용한 DB 검색 → Reranker → 응답 생성 파이프라인 구현
  • Hallucination 감소 전략
    • 응답 생성 과정에 reasoning(thinking) 단계 추가
    • Context 검증 로직을 통한 응답 신뢰도 향상
  • 대용량 데이터 처리
    • 문서/쿼리 로그 기반 데이터셋 구축
    • 배치 임베딩 파이프라인 및 재색인 자동화

SIGMOID LLM Manager

이노디스AX

도메인·상태 기반 LLM API 라우팅 및 서빙 최적화 시스템

FastAPIPythonPrometheusGrafana

프로젝트 소개
요청 도메인, 트래픽 상태, 모델 성능을 고려하여 최적의 LLM을 동적으로 선택하는 시스템

담당 업무

  • LLM 라우팅 로직 설계
    • 도메인별 모델 정책 정의 (예: 검색 특화 / 요약 특화 / 비용 최적화)
    • 모델 상태(응답 지연, 오류율)에 따른 Failover 및 우선순위 라우팅 구현
  • 서빙 안정성 강화
    • 모델 헬스 체크 및 상태 모니터링 로직 구현
    • 장애 상황에서 자동 대체 모델 전환 구조 설계
    • API 통계 및 시각화
    • 프로메테우스 및 그라파나를 이용한 통계 및 시각화

Code2Chart

슈어소프트테크(주)

C 언어 기반 Mermaid chart 생성 LLM

Python 3.11PyTorch 2.4.0CUDA 12.1TransformersFlashAttentionFlashInferDeepspeedDockerWandBMLflowDVCsgLangLLama-factoryLinux

프로젝트 소개
C 언어 코드의 함수 구조 및 로직을 분석하여 Mermaid 문법의 Flowchart로 변환하는 도메인 특화 sLLM 개발

담당 업무

  • LLM 파인튜닝 파이프라인 구축
    • llama 3.1-8B 모델 기반
    • Continual Pretraining(CPT), Instruction Tuning, Supervised Fine-tuning(SFT) 단계별 수행
    • CUDA, PyTorch, Transformers 기반 학습 환경 구성
  • 데이터 및 실험 관리
    • WandB, MLflow, DVC를 활용한 데이터·모델·실험 이력 관리
    • 재현 가능한 학습 파이프라인 구축
  • 정량 성능 개선
    • 자체 구축 벤치마크 기준
    • Base Model 33점 → Fine-tuned Model 67점으로 성능 향상
  • 모델 서빙 및 배포
    • sgLang 기반 LLM 서빙 환경 구성
    • 사내 배포 및 QA를 통한 실사용 검증

LLM Benchmark

슈어소프트테크(주)

도메인 특화 sLLM 정량 평가를 위한 LLM-as-a-Judge 벤치마크

Python 3.11TransformersPyTorchCUDALinux

프로젝트 소개
도메인 특화 sLLM 정량 평가를 위한 LLM-as-a-Judge 벤치마크

담당 업무

  • 평가 프레임워크 설계
    • Chain-of-Thought 기반 평가 템플릿 설계
    • Mermaid Flowchart 품질 평가를 위한 10개 세부 평가 항목 정의
  • 자동화된 평가 시스템 구축
    • LLM-as-a-Judge 방식으로 대규모 평가 자동화
    • 모델 반복 개선에 적합한 평가 파이프라인 구현
  • 신뢰도 검증
    • Ground Truth 데이터 100개 구축
    • 평가 결과 신뢰도 89.5% 달성

Distributed Human Activity Recognition System for Scalable Wi-Fi Sensing

INC Lab.

확장 가능한 Wi-Fi 센싱을 위한 분산형 인체 활동 인식 시스템

Python 3.11CUDALinuxTransformersPyTorchRaspberry 4BNexmon CSI

프로젝트 소개
기존 Wi-Fi based Human Activity Recognition (HAR) 연구의 취약점 보완

담당 업무

  • 기존 대비 데이터 사용량 1/N로 감소
  • 분산 센싱 시스템 적용 및 센싱 데이터 랜덤 셔플링을 통한 도청 데이터 효용성 저하
  • 결과적으로 1/N 데이터로 90% 행동 분석 정확도 달성
  • 도청자 모델 정확도 평균 30% 미만 달성으로 도청 방지

GuardianWatch

졸업작품

다중 객체 추적 기술을 활용한 어린이집 안전 모니터링 시스템

Python 3.11FlaskWatchDogMySQLCUDALinuxJavaAndroidBluetooth

프로젝트 소개
비전 AI 기반 어린이집 CCTV 분석 및 안전 모니터링 시스템 — 어린이집 CCTV 영상을 분석하여 아동의 위치, 행동, 활동량 정보를 추출하고, 학부모 앱에 알림 및 분석 정보를 제공하는 비전 AI 프로젝트

담당 업무

  • 다중 객체 탐지 및 추적 시스템 구축
    • YOLOX 기반 인원 탐지 및 ByteTrack 기반 다중 객체 추적 파이프라인 구현
    • 다수 인원이 밀집된 CCTV 환경에서도 안정적인 ID 유지 성능 확보
  • 행동 인식 및 활동 분석
    • SlowR50 모델을 활용한 행동 분류 및 활동 상태 분석
    • 객체 위치 정보를 기반으로 이동 경로, 체류 히트맵, 소비 칼로리 추정 기능 구현
  • Re-ID 문제 완화 알고리즘 개발
    • CCTV 영상 내 객체 ID 스위칭 문제 분석
    • Bluetooth RSSI 기반 위치 정보를 결합한 멀티모달 보정 알고리즘 설계
    • ID 유지 정확도 향상 및 장기 추적 안정성 개선
  • 프라이버시 보호 및 서비스 적용
    • Bird-Eye-View(BEV) 변환을 통한 영상 비식별화 처리

🏆 [은상] K-디지털 챌린지 : NET 챌린지 캠프 시즌10 (과학기술정보통신부 주최)

Skills & Tools

구분많이 해봤어요해본 적 있어요
Language Python C#C/C++LuaRustTypeScript
Backend DjangoFastAPIFlaskREST API SpringBoot
Frontend CSS3GradioHTML5Streamlit JavaScriptTypeScript
Database ElasticSearchFirebaseMySQLNoSQLOpensearch PostgreSQL
DevOps DockerGitGitHub K8S
MLOps PyTorchWandB MLflow
LLM Serving TGIsgLangvLLM
Fine-tuning LLama-factoryLoRAQLoRASFT
LLMOps AgentLangChainRAGRerankVectorDB CrewAI
CI/CD GitHub Actions Jenkins
Tools FigmaJiraSlack Miro