본문 바로가기

인턴일지

인턴 최종 발표

인턴 최종 발표 PPT자료입니다. 4개월동안 많이 성장한 나 자신에게 박수를 ㅎㅎ//

발표 내용

- 예측 분야 설명 (series data, 통계적 해석, 딥러닝 해석)

- Emotion recognition (using CNN)

- Defect detection (using segmenataion method)

- Forecasting SMP (using hybrid ARIMA-LSTM)

- ETC. (rknn 변환 매뉴얼, 홈페이지 제작)

- Depth Map 역사 (stereo vision과 deep learning을 중심으로)

인공지능을 이용한 예측이 인간보다 뛰어날까요?

저는 예측이 무엇인지, 기존의 방법과 현재 딥러닝 방법을 비교하여 설명할 예정입니다.

그 전에 앞서, 혼동되는 단어를 짚고 가려고 합니다.

예측을 영어로 번역하면 무엇인지 아시는 분 계신가요?

시계열 데이터를 잘 분석하는 것: 불규칙성을 가지는 시계열 데이터에 특정한 기법/ 모델을 적용하여 규칙적인 패턴을 적용하거나 예측 하는 것

Decorrelated: 상관관계를 줄이는 것

Whitening이란 데이터의 기본상관관계를 제거하는 것 (=> 정규화  가능)

하지만 명절 혹은 기타 상황에 의해 거래량이 한시적으로 변화하거나, 사업 확대 등으로 거래량 자체가 변동될 때 예측의 정확도가 떨어진다는 단점이 있습니다.

Prophet 라이브러리로 예상한 거래량 그래프를 보면, 사람들이 모여서 여러 행사를 치르는 추석 당일 오전의 줄어드는 거래량을 고려하지 못하는 것을 볼 수 있습니다.

1) Forget gate

입력: 이전 output, 현재 입력

출력: cell state로 가는 값

함수 f시그모이드 활성화 함수 때문에 0~1의 값을 갖게 됩니다. 1이면 이전 cell state가 그대로 가고, 0이면 이전 cell state는 전부 버려지게 됩니다.

2) Input gate

input gateforget gate에서 결정한 가중치(현재를 cell state에 얼마나 더할지)를 기반으로 scale한 값입니다.

tanh 활성화 함수 때문에 C-1~1의 값을 가집니다.

3) Update

Forget GateInput Gate의 출력 값을 더해주는 부분입니다.

4) Output gate

Output Gateupdatecell state를 얼마나 빼낼지 결정하는 부분입니다.

 

기존 모니터링 시스템은 과거 3주간의 데이터를 바탕으로 현재를 포함한 향후 24시간 동안의 거래량을 예측했지만,

새로운 모니터링 시스템은 과거 10시간 동안의 데이터를 바탕으로 다음 5분간의 거래량을 예측한다.

먼 미래에 대한 예측은 신경 쓰지 않는 대신 현 시점의 거래량이 적절한 것인지 감지하는 데 집중하는 형태다.

SMP에 따라 발전량 달라짐

전기는 저장이 X è 발전량 조절 (환경 오염 방지)

터무니 없이 높은 가격이 된다면, 전기세가 높아지겠쥬?

표면 탐지 문제는 이항 분류 문제라고 할 수 있다.

딥러닝에서 적은 양의 데이터셋으로 높은 정확도를 기록하기 위해, 2단계 구조의 네트워크로 설계했다.

첫 번째 단계는 Segmentation Network로 표면 defect의 픽셀 단위의 위치를 나타낸다. 이 네트워크는 픽셀 단위의 loss로 훈련한다.

두 번째 단계는 Decision Networkdefect 유무를 판단한다.

입력 이미지 사이즈는 1280X512이고, 출력 이미지 사이즈는 입력 이미지의 1/8크기인 160X64

Xx’는 이미지 평면에서의 점과 해당 카메라 중심 사이의 거리

B는 카메라 간의 거리

F는 카메라의 focal length

모든 픽셀의 깊이를 알아냄

첫번째: 원본

두번째: ground truth

세번째: 가우시안 이용

네번째: 라플라스 이용

식은 가우시안

식 복잡

Semantic segmentation 학습하듯.. (이제 이걸 딥러닝으로 하는 것)

딥러닝의 풍부한 convolution feature를 활용한 논문

global course level depth를 만드는 네트워크와 local fine level depth를 만드는 네트워크 두 가지를 학습시켜 최종적인 depth map만듬

DNN 모델 지도학습

Kinetic 이용하여 ground truth

Þ비산 RGB-D 카메라로만 가능 (RGB+depth)

Þ센서의 한계로 측정되는 거리가 제한, depth 영상에 비어 있는 픽셀 존재

Stereo 영상을 이용해 학습

(일정한 거리 간격을 두고 두 장의 이미지를 동시에 찍음)

스테레오 카메라에서 두 카메라 사이의 거리를 알고

왼쪽 영상의 depth (혹은 disparity)를 알 수 있다면

오른쪽 시점의 이미지를 왼쪽 이미지로부터 재구성(reconstruct) 할 수 있다.

오른쪽 이미지를 재구성 할 수 있는 depth를 학습하는 것

Lidar는 천만원 ~ 수천만원