데이터 소개
▪ 도로 시설물 분류와 시설물 파손인지를 지능화하기 위해 다양한 보행로 시설물(예. 안전시설, 관리시설, 환경시설, 편의시설 등) 유형별 양호 및 불량 상태 이미지 데이터를 정제 및 가공
- 바운딩박스(객체) 및 세그멘테이션(지형지물) 형태로 가공한 후, 검수와 비식별화를 통해 재사용에 제한이 없도록 저작권 문제를 해결
01. ’21 NIA 데이터 구축사업 참여 119데이터 AI
학습용 데이터 구축 지원사업
보행 안전을 위한 도로 시설물 데이터
도로 시설물(예. 안전시설, 관리시설, 환경시설, 편의시설 등) 유형별 양호 및 불량 상태를 도출해낼 수 있도록 인공지능을 훈련하기 위한
이미지 데이터셋
구축내용 및 제공 데이터량
▪ 데이터셋 수량: 이미지 총 102.5만장
▪ 인공지능 모델이 불량 시설물을 선별해 내기 위해서는 대조군(기준)이 필요하여 파손 및 훼손 이미지(65.4%)와 함께 양호 상태(34.6%) 이미지도 수집
상태 |
정의 |
수집규모 |
양호 |
외관 및 기능 상 정상 상태 |
35.2만 장 |
불량 |
설치 때와 달리 파손되거나 변형되어 보수 또는 교체가 필요한 상태 |
67.3만 장 |
|
총 계 |
102.5만장 |
[표1] 양호/불량 구축 규모
가공 형태_세그멘테이션
이미지 |
대분류 |
도로 안전 시설 |
중분류 |
도로부속 시설 |
소분류 |
무단횡단 방지 울타리 |
불량상태 |
울타리 파손 |
어노테이션 타입 |
세그멘테이션 |
원본이미지 |
|
|
[표1] 양호/불량 구축 규모
데이터 구조
데이터 구성
구분 | 변수정의 | 변수명 | 변수값 | 비고 |
1 | 시설물명 | facility | 01~09_01~38 | 세부 시설을 유사 범주 묶음_세부 시설별 코드 |
2 | 상태구분 | state | 0~1 | 시설물의 양호/불량 상태 구분 |
3 | 촬영장소 | place | 1~5 | 일반보행로, 어린이보호구역, 노인보호구역 등 |
4 | 촬영지역 | city_id | 1~6 | 6개 권역 구분 |
5 | 촬영방향 | direction | 1~4 | 방향1~방향4 |
6 | 촬영날짜 | date | YYYYMMDD | Y/M/D : 년/월/일 |
7 | 고유번호 | image_id | 0000000001~1000000000 | 이미지 고유연번 |
어노테이션 포맷
구분 | 항목명 | 타입 | 필수여부 | 설명 |
1 | info | - | Y | 기본 정보 |
| 1-1 | image_id | String | Y | 이미지의 고유 아이디 |
1-2 | date | Date | Y | 촬영 일자 |
1-3 | city_id | String | Y | 촬영 지역 |
1-4 | filename | String | Y | 이미지 파일명 |
1-5 | width | Integer | Y | 이미지 넓이 |
1-6 | height | Integer | Y | 이미지 높이 |
2 | description | List | - | 데이터 수집 시 기본정보 |
| 2-1 | facility | String | Y | 도로 시설물 유형 (종류) |
2-2 | sub_class | String | - | 중소분류 |
2-3 | state | String | Y | 객체 상태 정보 |
3 | annotations | Array | Y | 어노테이션 정보 |
| 3-1 | annotation_id | String | Y | 어노테이션 정보 |
3-2 | label_id | String | Y | 어노테이션 정보 |
3-3 | label_name | String | Y | 라벨명 |
3-4 | is_defect | String | Y | 객체 파손 유무 (상태 정보) |
3-5 | annotation_type | String | Y | 라벨 타입 |
3-6 | annotation_info | Array | Y | 바운딩박스: [top,left,width,height]
폴리곤 : [[x,y],[x,y],[x,y],...]
|
구축내용 및 제공 데이터량
(1) 개념 : 주행 도로 파손 여부 및 상태를 실시간 분석하여 시각화하여 각 지자체 담당자에게 자동으로 알려줌으로써 광범위한 시설물을 효과적으로 유지/관리할 수 있는 모델
(2) 개발 목표: 보행 안전을 위한 도로 시설물 데이터를 활용한 CCTV기반 AI 응용서비스 및 지능형 관리 시스템 개발
(3) 주요 기능 : 시간 주행 도로 파손여부 분석도로파손 상태 세분화 및 카테고리별 분류파손 심각도 시각화
(4) 핵심 기술 : AI 기반 시설물 종류/상태 정보 분류 기술
’21 NIA 데이터 구축사업 참여 : 120데이터
개인형 이동장치 안전 데이터
개인형 이동장치(PM)의 위반 상황 분류와 위반 객체 탐지를 도출해낼 수 있도록 인공지능을 훈련하기 위한 이미지 데이터셋
데이터 소개
▪ 개인형 이동장치(PM, Personal Moblility)의 교통법규 위반 상황 분류와 위반 객체 탐지를 지능화하기 위해 개인형 이동장치(예. 퀵보드, 오토바이, 자전거) 유형별 정상 및 위반 상황 데이터를 정제 및 가공
- 바운딩박스(객체) 및 세그멘테이션(지형지물) 형태로 가공한 후, 검수와 비식별화를 통해 재사용에 제한이 없도록 저작권 문제를 해결
[그림] 데이터셋 구축 과정
구축내용 및 제공 데이터량
▪ 데이터셋 규모: 영상 총 300시간(이미지 60만장)
▪ PM 별 수집 비율: 오토바이(36.7%), 자전거(41.6%), PM(21.7%)
- 도로교통공단 교통사고분석시스템(TAAS)의 교통사교 통계(2020년) 자료를 참고하고, 인공지능 학습에 유의미한 데이터 확보를 위해 강제할당을 적용하여 수집 비율 산정
종류 | 사고 건수 | 비율(백분율) |
이륜차(오토바이) | 18,280 | 73.6 |
자전거 | 5,667 | 22.8 |
PM | 897 | 3.6 |
총계 | 24,838 | 100.0 |
[표1]개인형 이동장치 교통사고 현황 (2020년)
| 합계 | 오토바이 | 자전거 | 킥보드 |
구축 건수 | 100만건 | 36.7만건 | 41.6만건 | 21.7만건 |
구축 비율 | 100% | 36.7% | 41.6% | 21.7% |
[표2] PM 별 수집 비율
가공 형태 예시
| 합계 | 오토바이 | 자전거 | 킥보드 |
구축 건수 | 100만건 | 36.7만건 | 41.6만건 | 21.7만건 |
구축 비율 | 100% | 36.7% | 41.6% | 21.7% |
[표2] PM 별 수집 비율