inquiry
DIVISION · 영상 AI · VLM

사람의 눈이
놓치는 1초를,
AI는 봅니다.

포테이토넷은 CCTV 영상과 언어 모델을 결합한 VLM(Vision-Language Model) 기반의 지능형 영상 분석 시스템을 개발합니다. 연기·불꽃·열·행인을 24시간 자동 감지하고, 맥락을 이해하여 오탐을 줄입니다.

ACCURACY
94%
전기 사전예측 공인 성능평가
FALSE ALARM
-70%
VLM 맥락 분석 오탐 감소
TRL LEVEL
07/9
기술 성숙도 (실증 단계)
MONITORING
24·365
무중단 자동 감시 체계

CCTV를 넘어,
이해하는 시선으로

영상·언어·센서 데이터를 하나의 흐름으로 통합 분석합니다. 불꽃과 연기를 찾는 데서 끝나지 않고, 행위의 맥락을 해석하여 진짜 위험만을 골라내는 것이 포테이토넷 비전 AI의 차별점입니다.

01 / 화재 감지

영상 기반 화재 감시

연기·불꽃·온도 상승을 24/365 자동 탐지. Faster R-CNN, YOLOv7 + CvT 기반 객체 탐지로 화재 초기 징후를 실시간 식별합니다.

02 / 맥락 이해

VLM 맥락 분석

비전-언어 모델이 "차량 하부에서 연기 발생" 같은 상황적 맥락을 이해하여 단순 패턴 매칭 대비 오탐률을 70% 이상 감소시킵니다.

03 / 행인 추적

행인 식별 · 검색

동일인 인식 모델이 track_id 부여, 외형 키워드(빨간 셔츠 등)로 영상 내 인물 검색 및 야간 방범·배회 탐지를 지원합니다.

04 / 행동 인식

행동 인식 알고리즘

LSTM·3D CNN(PoseC3D) 기반 시계열 모델로 쓰러짐·싸움·배회 등 비정상 행동을 인식합니다.

05 / 자동 보고

분석 보고서 자동 생성

50여종 센서 데이터를 LLM이 종합 분석하여 상황 식별·조치 가이드 보고서를 자동 생성합니다.

06 / 통합 관제

실시간 알람 · 자동 신고

화재 감지 즉시 관제센터·모바일에 알람 전송. 상인회·소방청·경찰서로 자동 연락 발송 체계를 제공합니다.

실시간
탐지 결과

연기·불꽃 객체 탐지부터 행인 식별까지. 실제 CCTV 환경에서 작동하는 탐지 모델의 결과를 확인하세요.

▸ MODEL: YOLOv7+CvT
▸ FRAME: 1247 / 60fps
REC 14:22:01 CAM-A12
smoke 0.27
SEOUL · 종로 재래시장 SIGNAL ▸ EARLY WARNING
연기 탐지 — 초기 단계
CASE 01

화재 초기 단계의 미세한 연기를 감지. VLM이 주변 맥락(점포 위치, 시간대)을 함께 분석하여 1차 경보를 발령합니다.

▸ MODEL: YOLOv7+CvT
▸ ALERT LEVEL: HIGH
REC 14:16:09 CAM-C03
smoke 0.69
fire 0.83
DAEGU · 물류센터 SIGNAL ▸ CRITICAL · 119 NOTIFIED
연기 + 불꽃 동시 탐지
CASE 02

화염과 연기의 복합 탐지. AI가 화재 가능성 영역을 식별하고 VLM이 화재 유형·확산 경로를 예측하여 위험 등급을 분류합니다.

▸ MODEL: track_id v2
▸ DETECTED: 3 persons
REC 22:48:17 CAM-B07
track_001
track_002
track_003
INCHEON · 야간 공원 SIGNAL ▸ PATROL MODE
행인 식별 · 동일인 추적
CASE 03

개별 track_id 부여 후 frame 단위로 인물을 추적. 외형 키워드 검색과 Rank-k 유사도 분석으로 동일인을 식별합니다.

▸ MODEL: ReID + track_id
▸ KEYWORD: "검정 양복"
REC 02:14:33 CAM-D11
track_047
track_048 · 0.91
실내 복도 · 키워드 검색 SIGNAL ▸ MATCH FOUND
키워드 기반 인물 검색
CASE 04

자연어 키워드("검정 양복", "빨간 셔츠")로 영상 내 인물을 검색. Rank-k 유사도 결과로 후보군을 정렬하여 빠른 추적이 가능합니다.

전통시장의
골든 타임
16배 짧습니다

밀집된 점포, 가연성 가림막, 좁은 소방차 진입로. 전통시장 화재는 일반 화재 대비 16배의 피해를 남기며, 심야시간대는 47배에 달합니다. 사후 대응이 아닌 사전 예측이 필요한 이유입니다.

16×
평균 피해액 (일반 화재 대비)

전통시장 화재 1건당 평균 피해액 약 2억 7천만 원. 노후 시설과 밀집 구조가 초기 진화를 어렵게 합니다.

47×
심야 시간대 피해 규모

자정~오전 4시 화재 1건당 약 13억 원의 재산 피해. 무인 시간대 자동 감지의 가치가 가장 큰 구간입니다.

44–50%
전기적 요인 화재 비중

누전·과부하·전선 노후화 등 전기적 원인이 절반에 육박. CCTV와 전기 데이터 융합 분석이 필요한 핵심 근거.

멀티모달
학습 구조

영상과 텍스트를 별도의 인코더로 벡터화한 뒤, Retriever가 외부 지식을 검색하고 LLM이 최종 태깅을 생성하는 RAG 기반 멀티모달 파이프라인. Cross-Modality Fusion으로 객체와 상황을 정밀하게 결합합니다.

01 / VISION
Vision Encoder
CCTV 영상에서 객체 및 특징을 감지. 화염·연기·인물 경계박스(Bounding Box) 추출.
YOLO · ResNet · ViT
02 / LANGUAGE
Language Encoder
Transformer 기반으로 영상 내 텍스트(OCR) 및 설명을 벡터 임베딩으로 변환.
BERT · T5 · Sentence-T
03 / RETRIEVER
Retriever Module
감지된 객체·행동을 키로 보안 DB·사건 기록에서 관련 정보를 검색.
RAG · Vector DB
04 / GENERATOR
Generator (LLM)
검색 정보를 바탕으로 상황을 설명하는 태그·리포트를 자동 생성.
LLM · sLM · CLIP
Cross-Modality Fusion
이미지·텍스트 데이터를 교차 주의 메커니즘(Cross-Attention)으로 결합. 객체의 행동과 상황을 정밀하게 통합 태깅합니다.
-70%
FALSE ALARM RATE

검증된
기술 스택

멀티모달 도메인 특화 학습으로 재조정. 화재 감시·행인 추적·맥락 분석에 최적화된 모델 조합을 운영합니다.

VLM Foundation
VISION-LANGUAGE

이미지와 자연어 텍스트를 통합 처리. 같은 벡터 공간에서 학습하여 검색·분류·캡셔닝까지 단일 모델로 수행.

CLIP Flamingo BLIP SimVLM VisualGPT
Object Detection
SPATIAL

영상 프레임 단위로 화염·연기·인물·차량의 경계박스를 추출. 실시간 추론에 최적화된 경량 모델 운영.

YOLOv7 Faster R-CNN CvT ResNet ViT
Behavior Recognition
TEMPORAL

시계열 모델로 쓰러짐·싸움·배회 등 행동 패턴 인식. HRNet 키포인트 + LSTM/3D CNN 조합.

LSTM Bi-LSTM PoseC3D HRNet 3D CNN
Learning Strategy
TRAINING

멀티모달 정렬 학습 전략. 대조 학습·Prefix LM·Cross-Attention 융합을 도메인별로 선택 적용.

Contrastive PrefixLM Cross-Attention RAG
XAI · Interpretability
EXPLAINABLE

모델 판단 근거를 시각화하여 오탐 원인을 분석. 피처 영향력·이상치 분포·클러스터링으로 모델 고도화.

SHAP PDP LIME GRAD-CAM
Thermal IoT
SENSOR

열화상 IoT 카메라로 야간·역광 환경에서도 화염·발열점을 식별. VLM과 결합하여 다중 위험 요소 동시 감지.

160×120 px -10°C ~ 400°C <50 mK LWIR

실증으로
입증된 성능

KOIST 공인 시험성적서로 검증된 94% 정확도와, 행정안전부·KT·중부발전 등 실제 현장에서의 R&D 수행 이력을 보유하고 있습니다.

94%
ACCURACY
전기사고 지능형 사전예측 시스템 v1.0
한국정보보안기술원(KOIST) 시험성적서 SW-2025-086 · 2025.12.31
TRL LEVEL
Level 7 · 실증 단계
시험 방법
12개 모델 · 4개 상황 · 96개 옵션
통과 기준
정확도 93% 이상
시험 결과
94.70% · 적합
R&D HISTORY
현장 검증 이력
  • 행안부 재난안전 지능형 사전예측 R&D · 2024.09~2026.05
  • KT 시화지구 전력 데이터 모델 개발
  • 중부발전 데이터 활용 모델 개발 · 2025.09~12
  • 고려대 세종 프라이버시 영상 기술 납품 · 2026.02
IP · PATENT
지식재산권
  • AI 기반 분·배전반 시계열 데이터를 기반으로 한 전기화재 및 전기설비 이상작동 사전예측 시스템 및 방법
  • 출원번호 10-2025-0068930 · ㈜포테이토넷

육안 감시에서
지능형 자동화

관제 인력의 집중력에 의존하던 기존 CCTV 운영 방식이 가진 한계를 넘어, AI가 먼저 보고 먼저 알리는 자동화된 감시 체계로 전환합니다.

▸ BEFORE · AS-IS

관리인의 CCTV 감시에 의존

  • 모니터를 항상 집중해서 봐야 하는 구조
  • 사고 발생이 눈에 띄지 않을 수도 있음
  • 전화·무전기로 경비원에게 연락 → 119 신고
  • NVR 저장된 영상은 사후 확인용에 그침
  • 야간·심야 시간대 인력 부재로 대응 공백
▸ AFTER · TO-BE

VLM AI 자동 감지 · 즉시 대응

  • 딥러닝 AI가 화재 초기 징후를 자동 감지
  • VLM이 상황 맥락을 이해해 오탐을 70% 감소
  • 관제센터·모바일·소방청에 자동 알림 발송
  • 정형/비정형 모든 데이터 통합 분석
  • IoT·열화상·전기 센서까지 연동 가능

현장에 적용된
활용 시나리오

전통시장의 화재 사전 예측부터 건물의 통합 보안, 야간 방범, 군중 밀집 모니터링까지. 하나의 플랫폼이 여러 도메인을 커버합니다.

01

전통시장 화재 예측

밀집 점포·노후 시설에서의 화재 사전 예측. 뚝도시장·금남시장 등 실증 진행 중.

02

건물 통합 보안

대형 건물·산업단지의 CCTV+센서 통합 관제. 화재·범죄·안전사고를 단일 시스템으로 감시.

03

야간 방범 · 배회 탐지

자정~새벽 무인 시간대 자율방범 보조. 행인 식별·이상행동 탐지로 치안 강화.

04

군중 밀집 · 행동 인식

에스컬레이터·집회·축제 등 다중밀집 환경에서 쓰러짐·싸움·압사 위험을 사전 감지.

▸ MISSION · 01

육안 감시의
사각지대 제거

관제 인력의 집중력에 의존하던 기존 감시 체계를 AI 자동 감지 체계로 전환. 24/365 깜빡이지 않는 시선으로 화재 골든타임을 확보합니다.

▸ MISSION · 02

VLM 기반
지능형 자동화 (AX)

단순 영상 기록을 넘어, 상황을 이해하고 보고서를 자동 생성하는 인텔리전스 단계로. 전통시장과 건물 관리 방식의 패러다임을 전환합니다.