potatonet

01 · CORE CAPABILITIES

CCTV를 넘어,
이해하는 시선으로

영상·언어·센서 데이터를 하나의 흐름으로 통합 분석합니다. 불꽃과 연기를 찾는 데서 끝나지 않고, 행위의 맥락을 해석하여 진짜 위험만을 골라내는 것이 포테이토넷 비전 AI의 차별점입니다.

01 / 화재 감지

영상 기반 화재 감시

연기·불꽃·온도 상승을 24/365 자동 탐지. Faster R-CNN, YOLOv7 + CvT 기반 객체 탐지로 화재 초기 징후를 실시간 식별합니다.

02 / 맥락 이해

VLM 맥락 분석

비전-언어 모델이 "차량 하부에서 연기 발생" 같은 상황적 맥락을 이해하여 단순 패턴 매칭 대비 오탐률을 70% 이상 감소시킵니다.

03 / 행인 추적

행인 식별 · 검색

동일인 인식 모델이 track_id 부여, 외형 키워드(빨간 셔츠 등)로 영상 내 인물 검색 및 야간 방범·배회 탐지를 지원합니다.

04 / 행동 인식

행동 인식 알고리즘

LSTM·3D CNN(PoseC3D) 기반 시계열 모델로 쓰러짐·싸움·배회 등 비정상 행동을 인식합니다.

05 / 자동 보고

분석 보고서 자동 생성

50여종 센서 데이터를 LLM이 종합 분석하여 상황 식별·조치 가이드 보고서를 자동 생성합니다.

06 / 통합 관제

실시간 알람 · 자동 신고

화재 감지 즉시 관제센터·모바일에 알람 전송. 상인회·소방청·경찰서로 자동 연락 발송 체계를 제공합니다.

02 · DETECTION SHOWCASE

실시간
탐지 결과

연기·불꽃 객체 탐지부터 행인 식별까지. 실제 CCTV 환경에서 작동하는 탐지 모델의 결과를 확인하세요.

▸ MODEL: YOLOv7+CvT

▸ FRAME: 1247 / 60fps

REC 14:22:01 CAM-A12

smoke 0.27

SEOUL · 종로 재래시장 SIGNAL ▸ EARLY WARNING

연기 탐지 — 초기 단계

CASE 01

화재 초기 단계의 미세한 연기를 감지. VLM이 주변 맥락(점포 위치, 시간대)을 함께 분석하여 1차 경보를 발령합니다.

▸ MODEL: YOLOv7+CvT

▸ ALERT LEVEL: HIGH

REC 14:16:09 CAM-C03

smoke 0.69

fire 0.83

DAEGU · 물류센터 SIGNAL ▸ CRITICAL · 119 NOTIFIED

연기 + 불꽃 동시 탐지

CASE 02

화염과 연기의 복합 탐지. AI가 화재 가능성 영역을 식별하고 VLM이 화재 유형·확산 경로를 예측하여 위험 등급을 분류합니다.

▸ MODEL: track_id v2

▸ DETECTED: 3 persons

REC 22:48:17 CAM-B07

track_001

track_002

track_003

INCHEON · 야간 공원 SIGNAL ▸ PATROL MODE

행인 식별 · 동일인 추적

CASE 03

개별 track_id 부여 후 frame 단위로 인물을 추적. 외형 키워드 검색과 Rank-k 유사도 분석으로 동일인을 식별합니다.

▸ MODEL: ReID + track_id

▸ KEYWORD: "검정 양복"

REC 02:14:33 CAM-D11

track_047

track_048 · 0.91

실내 복도 · 키워드 검색 SIGNAL ▸ MATCH FOUND

키워드 기반 인물 검색

CASE 04

자연어 키워드("검정 양복", "빨간 셔츠")로 영상 내 인물을 검색. Rank-k 유사도 결과로 후보군을 정렬하여 빠른 추적이 가능합니다.

03 · WHY IT MATTERS

전통시장의
골든 타임은
16배 짧습니다

밀집된 점포, 가연성 가림막, 좁은 소방차 진입로. 전통시장 화재는 일반 화재 대비 16배의 피해를 남기며, 심야시간대는 47배에 달합니다. 사후 대응이 아닌 사전 예측이 필요한 이유입니다.

16^×

평균 피해액 (일반 화재 대비)

전통시장 화재 1건당 평균 피해액 약 2억 7천만 원. 노후 시설과 밀집 구조가 초기 진화를 어렵게 합니다.

47^×

심야 시간대 피해 규모

자정~오전 4시 화재 1건당 약 13억 원의 재산 피해. 무인 시간대 자동 감지의 가치가 가장 큰 구간입니다.

44–50^%

전기적 요인 화재 비중

누전·과부하·전선 노후화 등 전기적 원인이 절반에 육박. CCTV와 전기 데이터 융합 분석이 필요한 핵심 근거.

04 · VLM PIPELINE

멀티모달
학습 구조

영상과 텍스트를 별도의 인코더로 벡터화한 뒤, Retriever가 외부 지식을 검색하고 LLM이 최종 태깅을 생성하는 RAG 기반 멀티모달 파이프라인. Cross-Modality Fusion으로 객체와 상황을 정밀하게 결합합니다.

01 / VISION

Vision Encoder

CCTV 영상에서 객체 및 특징을 감지. 화염·연기·인물 경계박스(Bounding Box) 추출.

YOLO · ResNet · ViT

02 / LANGUAGE

Language Encoder

Transformer 기반으로 영상 내 텍스트(OCR) 및 설명을 벡터 임베딩으로 변환.

BERT · T5 · Sentence-T

03 / RETRIEVER

Retriever Module

감지된 객체·행동을 키로 보안 DB·사건 기록에서 관련 정보를 검색.

RAG · Vector DB

04 / GENERATOR

Generator (LLM)

검색 정보를 바탕으로 상황을 설명하는 태그·리포트를 자동 생성.

LLM · sLM · CLIP

Cross-Modality Fusion

이미지·텍스트 데이터를 교차 주의 메커니즘(Cross-Attention)으로 결합. 객체의 행동과 상황을 정밀하게 통합 태깅합니다.

-70%

FALSE ALARM RATE

05 · MODEL STACK

검증된
기술 스택

멀티모달 도메인 특화 학습으로 재조정. 화재 감시·행인 추적·맥락 분석에 최적화된 모델 조합을 운영합니다.

VLM Foundation

VISION-LANGUAGE

이미지와 자연어 텍스트를 통합 처리. 같은 벡터 공간에서 학습하여 검색·분류·캡셔닝까지 단일 모델로 수행.

CLIP Flamingo BLIP SimVLM VisualGPT

Object Detection

SPATIAL

영상 프레임 단위로 화염·연기·인물·차량의 경계박스를 추출. 실시간 추론에 최적화된 경량 모델 운영.

YOLOv7 Faster R-CNN CvT ResNet ViT

Behavior Recognition

TEMPORAL

시계열 모델로 쓰러짐·싸움·배회 등 행동 패턴 인식. HRNet 키포인트 + LSTM/3D CNN 조합.

LSTM Bi-LSTM PoseC3D HRNet 3D CNN

Learning Strategy

TRAINING

멀티모달 정렬 학습 전략. 대조 학습·Prefix LM·Cross-Attention 융합을 도메인별로 선택 적용.

Contrastive PrefixLM Cross-Attention RAG

XAI · Interpretability

EXPLAINABLE

모델 판단 근거를 시각화하여 오탐 원인을 분석. 피처 영향력·이상치 분포·클러스터링으로 모델 고도화.

SHAP PDP LIME GRAD-CAM

Thermal IoT

SENSOR

열화상 IoT 카메라로 야간·역광 환경에서도 화염·발열점을 식별. VLM과 결합하여 다중 위험 요소 동시 감지.

160×120 px -10°C ~ 400°C <50 mK LWIR

06 · VALIDATION

실증으로
입증된 성능

KOIST 공인 시험성적서로 검증된 94% 정확도와, 행정안전부·KT·중부발전 등 실제 현장에서의 R&D 수행 이력을 보유하고 있습니다.

94^%

ACCURACY

전기사고 지능형 사전예측 시스템 v1.0

한국정보보안기술원(KOIST) 시험성적서 SW-2025-086 · 2025.12.31

TRL LEVEL

Level 7 · 실증 단계

시험 방법

12개 모델 · 4개 상황 · 96개 옵션

통과 기준

정확도 93% 이상

시험 결과

94.70% · 적합

R&D HISTORY

현장 검증 이력

행안부 재난안전 지능형 사전예측 R&D · 2024.09~2026.05
KT 시화지구 전력 데이터 모델 개발
중부발전 데이터 활용 모델 개발 · 2025.09~12
고려대 세종 프라이버시 영상 기술 납품 · 2026.02

IP · PATENT

지식재산권

AI 기반 분·배전반 시계열 데이터를 기반으로 한 전기화재 및 전기설비 이상작동 사전예측 시스템 및 방법
출원번호 10-2025-0068930 · ㈜포테이토넷

07 · TRANSFORMATION

육안 감시에서
지능형 자동화로

관제 인력의 집중력에 의존하던 기존 CCTV 운영 방식이 가진 한계를 넘어, AI가 먼저 보고 먼저 알리는 자동화된 감시 체계로 전환합니다.

▸ BEFORE · AS-IS

관리인의 CCTV 감시에 의존

모니터를 항상 집중해서 봐야 하는 구조
사고 발생이 눈에 띄지 않을 수도 있음
전화·무전기로 경비원에게 연락 → 119 신고
NVR 저장된 영상은 사후 확인용에 그침
야간·심야 시간대 인력 부재로 대응 공백

→

▸ AFTER · TO-BE

VLM AI 자동 감지 · 즉시 대응

딥러닝 AI가 화재 초기 징후를 자동 감지
VLM이 상황 맥락을 이해해 오탐을 70% 감소
관제센터·모바일·소방청에 자동 알림 발송
정형/비정형 모든 데이터 통합 분석
IoT·열화상·전기 센서까지 연동 가능

08 · USE CASES

현장에 적용된
활용 시나리오

전통시장의 화재 사전 예측부터 건물의 통합 보안, 야간 방범, 군중 밀집 모니터링까지. 하나의 플랫폼이 여러 도메인을 커버합니다.

01

전통시장 화재 예측

밀집 점포·노후 시설에서의 화재 사전 예측. 뚝도시장·금남시장 등 실증 진행 중.

02

건물 통합 보안

대형 건물·산업단지의 CCTV+센서 통합 관제. 화재·범죄·안전사고를 단일 시스템으로 감시.

03

야간 방범 · 배회 탐지

자정~새벽 무인 시간대 자율방범 보조. 행인 식별·이상행동 탐지로 치안 강화.

04

군중 밀집 · 행동 인식

에스컬레이터·집회·축제 등 다중밀집 환경에서 쓰러짐·싸움·압사 위험을 사전 감지.

▸ MISSION · 01

육안 감시의
사각지대 제거

관제 인력의 집중력에 의존하던 기존 감시 체계를 AI 자동 감지 체계로 전환. 24/365 깜빡이지 않는 시선으로 화재 골든타임을 확보합니다.

▸ MISSION · 02

VLM 기반
지능형 자동화 (AX)

단순 영상 기록을 넘어, 상황을 이해하고 보고서를 자동 생성하는 인텔리전스 단계로. 전통시장과 건물 관리 방식의 패러다임을 전환합니다.

사람의 눈이 놓치는 1초를, AI는 봅니다.

CCTV를 넘어,이해하는 시선으로

영상 기반 화재 감시

VLM 맥락 분석

행인 식별 · 검색

행동 인식 알고리즘

분석 보고서 자동 생성

실시간 알람 · 자동 신고

실시간탐지 결과

전통시장의골든 타임은16배 짧습니다

멀티모달학습 구조

검증된기술 스택

실증으로입증된 성능

육안 감시에서지능형 자동화로