Jeonghun (James) Lee: AI-Machine/Deep Learning

https://inspace4u.github.io/dllab/lecture/2017/09/28/IoU.html

상위 방법은 Python으로 사용하면 쉽게 구할 수 있을 것 같은데, 소스의 동작원리를 정확하게 모르겠다.
일반적인 좌표를 사용하게 되면 어떻게 구현이 될까라는 것도 궁금하다

좌표로만 IOU 직접 계산방법

좌표구조로 구성되고 BBOX가 사각형이라고 하면 아래와 같이 구성이 될 것 같다.
Left(X), Top(Y) , Width, Height

이때 사각형의 대각선 좌표값으로, X, Y 좌표와 (X+Width) , ( Y+Height) 좌표 두개로 쉽게 IOU를 감지하고 이를 계산가능

ex) A-BBOX의 좌표 X(3) , Y (3) , widht (3) ,height(4) 이라고 하면 아래 두 좌표로 4각형을 인지가능

A-BBOX의 A-MIN 좌표 (3,3)
A-BBOX의 A-MAX 좌표 (6,7)

B-BBOX 의 B-MIN 좌표 X >=3 && Y>=3 일 때

B-MIN 좌표의 X, Y가 아래 두 조건 충족시 IOU 계산

3 < X < 6 (3+width)
3 < Y < 7 (3+height)

InterSection Size = A-MAX - B-MIN (각각의 크기나옴)

B-BBOX의 B-MIN 좌표 X < 3 || Y < 3 일 때

B-MAX 좌표의 X, Y가 아래 두 조건 충족시 IOU 계산

3 < X < 6 (3+width)
3 < Y < 7 (3+height)

InterSection Size = B-MAX - A-MIN (각각의 크기나옴)

상위와 같이 InterSection Size만 알면, 모든 계산이 쉬어진다.
현재 상위 조건은 모눈종이에 직접 그려서 생각해본 것 이며, 오류가 아직 존재할 수 있다.
추후 소스로 작성된 소스 검증을 해봐야겠다.

모눈종이 PDF 문서

머리가 나뻐서 자꾸, 모눈 종이가 필요해서 아래 링크
http://blog.daum.net/miparang/7058252

IOU 관련소스 자료모음

https://stackoverflow.com/questions/4549544/total-area-of-intersecting-rectangles/32244956
https://bskyvision.com/465

아래의 소스는 상위 소스에서 간단히 IOU를 만드는 소스를 만들어 보았는데, 아직 검증을 제대로 해보지를 못했다.

static int max(int v1 , int v2)
{
 if(v1 > v2) return v1;
 else return v2;
}

static int min(int v1 , int v2)
{
 if(v1 > v2) return v2;
 else return v1;
}

static int interSection(int Ax1, int Ay1, int Ax2, int Ay2, int Bx1, int By1, int Bx2, int By2)
{
    int left   = max(Ax1, Bx1);
    int top    = max(Ay1, By1);
    int right  = min(Ax2, Bx2);
    int bottom = min(Ay2, By2);
    int interArea = 0;

    if (left < right && bottom > top)
     interArea = ((right - left) + 1) * ((bottom - top)+1);

   return interArea;
}

1.2 IOU 사용용도

IOU 사용용도는 다양한 것 같으며, 일단, 아래의 사이트 에서 처럼 실제 BBOX와 예측된 BBOX의 차이를 알아서 교정을 위해서 도 사용이 되어진다.

Ground-Truth bouning Box: 실제 모델의 Box, 손으로 직접 Label
Predicted bouning Box: Deep Learning을 통해 예측된 BBOX

IOU 관련내용
https://www.pyimagesearch.com/2016/11/07/intersection-over-union-iou-for-object-detection/

또한 동일한 Object를 여러개의 Object로 인식을 할 경우, 이때 IOU값에 따라 나머지를 없애는 데에도 사용되어 지는 것 같다.

더불어 Tracking 알고리즘에서도 역시 IOU는 사용이 되어지는데, Object Detection이 되고 이전 Frame 과 이후 Frame IOU값을 가지고 지속적으로
Tracking 하기위해서도 사용되어지는 것 같다.

이외에도 개인적으로 생각을 해보면, ROI(Region of Interest) BBOX 와 Object Detection 된 BBOX의 IOU를 이용도 가능 할 것 같다.
이는 각각의 ROI의 영역이 서로 겹칠 경우, 상위 Smart Parking System일 경우 이용 가능할 것 같다.

간단하지만, 생각해보면 아주 다양하게 이용이 되어지기 때문에 꼭 필요하다

7/12/2019

Video Annotation Tool(VATIC)

Video Annotation Tool

VATIC(Video Annotation Tool from Irvine, California) 이라고 부르며, 무료로 제공해주는 Video Annotation Tool 이다.
VATIC은 Ubuntu기반에서 Apache 2.2 HTTP Server 와 MySQL를 설치된 상태에서 테스트가 가능하다고 한다.

$ git clone https://github.com/cvondrick/vatic
$ cd vatic 
$ ./vatic-install.sh  // 필요한 Package 설치 (python, mysql), 

$ cat ./vatic-install.sh  // Shell Script 확인 
sudo apt-get install -y git python-setuptools python-dev libavcodec-dev libavformat-dev libswscale-dev libjpeg62 libjpeg62-dev libfreetype6 libfreetype6-dev apache2 libapache2-mod-wsgi mysql-server-5.1 mysql-client-5.1 libmysqlclient-dev gfortran 

sudo easy_install -U SQLAlchemy wsgilog pil cython mysql-python munkres parsedatetime argparse
sudo easy_install -U numpy

git clone https://github.com/cvondrick/turkic.git
git clone https://github.com/cvondrick/pyvision.git
git clone https://github.com/cvondrick/vatic.git

cd turkic
sudo python setup.py install
cd ..

cd pyvision
sudo python setup.py install
cd ..

echo "*****************************************************"
echo "*** Please consult README to finish installation. ***"
echo "*****************************************************"


$ dpkg -l python-setuptools python-dev libavcodec-dev libavformat-dev libswscale-dev libjpeg62 libjpeg62-dev libfreetype6 libfreetype6-dev apache2 libapache2-mod-wsgi mysql-server-5.1 mysql-client-5.1 libmysqlclient-dev gfortran  

+++-===========================-==================-==================-============================================================
un  apache2                                               (설명 없음)
un  gfortran                                              (설명 없음)
ii  libfreetype6:amd64          2.6.1-0.1ubuntu2.3 amd64              FreeType 2 font engine, shared library files
ii  python-dev                  2.7.12-1~16.04     amd64              header files and a static library for Python (default)
ii  python-setuptools           20.7.0-1           all                Python Distutils Enhancements
dpkg-query: no packages found matching libavcodec-dev
dpkg-query: no packages found matching libavformat-dev
dpkg-query: no packages found matching libswscale-dev
dpkg-query: no packages found matching libjpeg62
dpkg-query: no packages found matching libjpeg62-dev
dpkg-query: no packages found matching libfreetype6-dev
dpkg-query: no packages found matching libapache2-mod-wsgi
dpkg-query: no packages found matching mysql-server-5.1
dpkg-query: no packages found matching mysql-client-5.1
dpkg-query: no packages found matching libmysqlclient-dev

How to install Vatic tool
https://glentimemaker.github.io/Install-and-Use-Vatic-Annotation-Tool/

VATIC(Video Annotation Tool from Irvine, California) 활용
http://www.cs.columbia.edu/~vondrick/vatic/

VATIC Source
https://github.com/cvondrick/vatic

5/26/2019

Deep Learning 기본지식 습득 (Math, 추후 보완)

갑자기 Deep Learning 부분을 이해하려고 하니, 모델/Network 와 사용되는 수학들이 왜 사용이 되는지가 궁금하여 관련자료 수집

각 사항들을 정확하게 인지할 필요가 있어 이부분 추후 이해하고 정리가 필요할 것 같음.

SoftMax 알고리즘

Softmax 의 classification 자료이며,Multinomial Classification 이 쉽게 이해가 같다.

https://pythonkim.tistory.com/19?category=573319

https://pythonkim.tistory.com/20

https://pythonkim.tistory.com/21

3/27/2019

Yolo 및 Jupyter notebook (자료만 수집 )

최근 Yolo 관련부분을 일을 하게되어 Yolo기능이 무엇이지 알기 위해서 관련부분을 구글링하여

아래와 같이 간단히 링크만 정리하도록 한다.

* 회사의 방침에 따라 기존의 Blog Post를 전부삭제

YOLO
  https://github.com/leehaesung/YOLO- Powered_Robot_Vision/blob/master/README_Korean.md
  https://github.com/leehaesung/YOLO-Powered_Robot_Vision/blob/master/YOLO-Powered_Robot_Vision.ipynb

Kaggle
  https://www.kaggle.com/

수업
  https://programmers.co.kr/learn/courses/21
  https://programmers.co.kr/learn/courses/21/lessons/11039#

Colab (Google의 Jupyter)
  https://colab.research.google.com/notebooks/welcome.ipynb

Jupyter notebook
  https://dataninja.me/ipds-kr/python-setup/
  https://jupyter.org/

기타사항
  https://goodtogreate.tistory.com/category/Data%20Science

모두의딥러닝
  https://hunkim.github.io/ml/

활성함수 SigMoid 함수정의
  https://icim.nims.re.kr/post/easyMath/64

Machine Learning Pipeline
  https://bcho.tistory.com/1177?category=555440

2/07/2019

Deep Learning 의 기초자료 수집 (CNN)

1. Deep Learning 부분 자료 수집

오늘 Meetup의 Data Science 모임을 다녀와서 Deep Learning에 관련된 용어 및 관련구조 흐름을 파악하고, 관련된 부분을 정리한다.
최근에, Machine / Deep Learning에 대해 알기 위해서 자료수집을 비롯하여, 관련내용들을 정리하기로 하였다.

CNN(convolutional neural network)

Deep Learning하게 되면 꼭 듣게되는 CNN 설명이며, Wiki 설명이 잘되어있다.

https://en.wikipedia.org/wiki/Convolutional_neural_network

합성곱(Convolution)을 좀 더 이해하고자 하면, 동작원리를 알면, 쉽게 상위 CNN부분도 이해가 간다.

구지, Deep Learning 이 아니여도, DSP에서도 Audio/Video에서도 사용되는 것이므로, 반드시 기본개념은 이해해야한다.

아래의 그림예제가 있으니, 쉽게 이해가 갈 것이라고 생각되어진다.

Tensorflow Colab 기반으로 실습 및 설명

최근에 다시 찾은 것으로 설명 및 실습이 너무 잘되어있다.

https://github.com/aamini/introtodeeplearning

https://colab.research.google.com/github/aamini/introtodeeplearning/blob/master/lab2/Part1_MNIST.ipynb

2D Convolutions 의 기본동작

Convolutions 의 동작을 보면 아래와 같이 좌측 Input 과 Filter 역할을 하는 Kernel 과 최종 Output로 볼 수 있다.

좀 확대해서 생각하면 Filter 개념으로도 생각해도 될꺼 같다.

https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1

Input 5x5 Matrix (청색)
Kernel 3x3 Matrix
Output 3x3 Matrix (Weight의 합으로 특징을 추출, 녹색)

좌측청색은 Input 이며, Kernel(Weight)이 합성곱(Convolution)을 이용하여, 슬라이드로 움직이면서 Output(Weight 합) 추출

Kernel

0 1 2

2 2 0

0 1 2

2D Convolution 의 Padding (확장)

2D Convolution 기본동작시 Kerenl을 Input의 양끝까지 적용하여 사용하려고 하면 Padding 문제가 생기는 것으로 보인다.

Input 5x5 Matrix
Kernel 3x3 Matrix
Output 5x5 Matrix

결과적으로 Output 즉 특징을 3x3 -> 5x5로 확장하고자 할때 사용하는 것으로 보인다.

Kernel을 순차적으로 움직이면, Kernel 과 동일한 Output은 3x3이지만, Padding하여, 확장한다.

아래를 보면 Input 과 Output Matrix가 동일하다.

물론 Input의 Padding으로 양끝의 오차는 발생할 것이며, 이를 감수하고 사용할 것 같다.

https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1

2D Convolution 의 Striding (축소)

상위기본에서 Output 즉 특징을 3x3에서 2x2로 축소하고자 할때 사용하는 것으로 보인다.

원래대로 하면, Output은 Kernel과 동일한 3x3 으로 나와야 하지만,한 번 건너 뛰어서, 이를 축소한다. (3x3->2x2)

Input 5x5 Matrix
Kernel 3x3 Matrix
Output 2x2 Matrix

영상에서 특징추출

상위 자료를 보면서 이전에 Camera의 Bayer Pattern 이 기억이 나면서 각 그림들이 쉽게 이해가 간다.

재미있는 것은 아래와 같이 Edge도 추출도 하고, 추출된 Feature들을 Visualzation도 가능하다고 하는데, 그 부분이 많이 흥미로웠다.

좌측 Input
중간 kernel
우측 Output

Convolution 의 이해 내용출처

https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1

CNN의 사용되는 구조 및 용어파악

MNIST의 CNN(Convolutional Neural Network)의 구조인 것으로 보이며, 상위 사이트 설명과 많은 부분이 중복되지만, 쉽게 설명이 되어있어 쉽게 CNN을 이해했다.

http://taewan.kim/post/cnn/

Batch Size 부터 각 용어들을 설명해주어 쉽게파악

https://radiopaedia.org/articles/batch-size-machine-learning

KAGGLE

AI에 관련된 기술 및 관련내용이 많다고 해서 가입하고 관련내용들을 보고 있다.

  https://www.kaggle.com/
  https://developers.ascentnet.co.jp/2017/11/24/kaggle-process-review/
  https://en.wikipedia.org/wiki/Kaggle
  https://www.kaggle.com/c/titanic/kernels

Data Pipeline 의 구조 (BigData)

Cloud 기반으로 BigData를 수집하고 이를 Piple Line형태로 연결하여 빠르게 데이타를 연결하고 Deep Learning를 학습한다.
https://www.dativa.com/best-practice-data-pipeline-architecture-in-2018/
https://docs.aws.amazon.com/ko_kr/datapipeline/latest/DeveloperGuide/what-is-datapipeline.html
https://cloud.google.com/solutions/big-data/?hl=ko

AWS/Azure/Google DATA Pipe line

  https://aws.amazon.com/ko/datapipeline/
  https://docs.microsoft.com/ko-kr/azure/hdinsight/spark/apache-spark-creating-ml-pipelines
  http://www.ciokorea.com/news/39248
  https://cloud.google.com/data-science/?hl=ko
  https://aws.amazon.com/ko/blogs/korea/get-started-with-deep-learning-using-the-aws-deep-learning-ami/

DATA Pipeline 한글자료

https://www.slideshare.net/deview/236-67609108
http://slides.com/openstack/sktechx11th#/

xgboost

다른 한 외국 친구가 아래 것을 자꾸 언급하면서 최적화 및 관련사항을 문의하고 하는데, 이해하지 못해 아래와 같이 관련자료만 수집한다.
https://brunch.co.kr/@snobberys/137
https://xgboost.readthedocs.io/en/latest/

Bigdata 의 Data Visualization

처음 visualization이 OpenCV이나 이런 Vision 관련부분을 처리하는 기능의 의미하는 줄 알았는데, 관련모임에서 만난 친절한 다른 외국인이 자세히 설명해주어 이해하기가 쉬었다.
일단, Deep Learning System Training 혹은 Inference를 하게 되면, 이를 확인 및 검증을 위해서 수치화 및 통계 자료가 필요한데,

이를 쉽게 그래프 및 다양한 차트로 이를 보여주는 기능이다.

Tensorflow에서 Data Visualization 하면 Tensorboard라고 생각하면 될 것 같다.
https://en.wikipedia.org/wiki/Data_visualization

Data Visualization에서 많이 사용되어지는 Zepplein

제플린은 Android에서도 많이 들어보고, Spark에서도 들어보고, 여러군데에서 사용이 되어지는것 같은데,

Data Visualization을 위해서 많이 사용되어지는 것 같으며, 나중에 설치해서 한번 이용해보자.

https://medium.com/apache-zeppelin-stories/%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-%EC%9D%BC%EA%B8%B0-2-apache-zeppelin-%EC%9D%B4%EB%9E%80-%EB%AC%B4%EC%97%87%EC%9D%B8%EA%B0%80-f3a520297938

오래전에 자료 모은 것 과 같이 어떤 구조로 동작이 되는지 어떻게 임베디드에 적용이 되는지를 확인을 해야 겠다.
현재 파악된 것은 상위 Data pipe line을 가진 Server에서 AI모델을 Training을 하며, 생성을 하는데,

이때 많은 데이타를 이용하기위해서 배우는 것이 Big data 이며, 이런 Data들의 흐름을 연결하는 것이 Pipeline이다.

내가 Server가 있다면, 각각 아래와 같이 구성을 해야 할 것 같으며, 마지막에 Jupyter로 연결하여 구성하면 될 것 같다.

Bigdata

Hadoop
Apache Spark
Apache Zeppelin
https://jupyter.org/

일단 라즈베리파이에서 소스를 Download하여 구성을 해보자.
골치아픈 딥러닝
https://github.com/tensorflow/tensorflow
https://gitlab.com/inverseai/tensorflow/tensorflow

Getting Started with TensorFlow for Raspberry Pi
https://www.youtube.com/watch?v=ukkNek46h_8

How to Set Up TensorFlow Object Detection on the Raspberry Pi
https://www.youtube.com/watch?v=npZ-8Nj1YwY

Detect ANY Object with Raspberry Pi and TensorFlow
https://www.youtube.com/watch?v=zqIBce4LKx8

Gitlab의 다중화자 음성합성 엔지 소스 및 관련자료

Tensorflow로 구성이 되어있는데, 지금 나의 실력으로는 이해를 하지 못하겠다.

추후 음성을 Text로 변경해야할일 있을때 다시 보도록 하자.

https://git.quendi.moe/public-archive/multi-speaker-tacotron-tensorflow

YOLO 와 연관된 자료

  https://github.com/leehaesung/YOLO- Powered_Robot_Vision/blob/master/README_Korean.md
  https://github.com/leehaesung/YOLO-Powered_Robot_Vision/blob/master/YOLO-Powered_Robot_Vision.ipynb
  https://towardsdatascience.com/review-yolov3-you-only-look-once-object-detection-eab75d7a1ba6
  https://medium.com/@sh.tsang/paper-brief-review-of-lenet-1-lenet-4-lenet-5-boosted-lenet-4-image-classification-1f5f809dbf17
  https://www.arunponnusamy.com/yolo-object-detection-opencv-python.html
  https://www.pyimagesearch.com/2018/11/12/yolo-object-detection-with-opencv/
  https://pjreddie.com/

Data Science 무료수업

https://programmers.co.kr/learn/courses/21
https://programmers.co.kr/learn/courses/21/lessons/11039#

Machin Learning 기본학습자료

처음 기초부터 각 모델에 대한 설명을 비롯하여 잘 설명해주고 있어서 좋다.

https://laonple.blog.me/220542170499

Colab

Google에서 무료로 제공해주는 Jupyter로 간단하게 테스트하고 사용하기가 쉽다
https://colab.research.google.com/notebooks/welcome.ipynb

Jupyter notebook

  https://dataninja.me/ipds-kr/python-setup/
  https://jupyter.org/
  https://datascienceschool.net/view-notebook/f9d9fddb7cc7494a9e4be99f0e137be0/

NVIDIA 의 TensorRT 와 각 모델

https://docs.nvidia.com/deeplearning/sdk/tensorrt-sample-support-guide/index.html

2/05/2019

MNIST 관련자료

1. MNIST 의 기본이해

가장 기본이되는 Neural Network로 MNIST는 Tensorflow를 가던, Keras를 가던 가장 기본이되는 학습이며, Hello World 처럼 이 구조를 이해를 해야,

CNN이든 다른 구조를 이해하기가 쉽다.

기본동작

28 픽셀 의 정사각형으로 데이타 입력 28x28 = 784 Pixel로 구성
이 정사각형에 입력된 데이타를 각 단계를 걸쳐 최종 각 0~9의 숫자로 인식

1의 경우 아래의 28x28 =784 Pixel 로 표시되며 이는 Matrix로 보면 다음과 같다.

https://en.wikipedia.org/wiki/MNIST_database

전제조건

칼라가 아닌 흑백이며 명암구분됨 (Gray Scale)

MNIST의 모델 구조 및 동작

Input Layer는 상위 Matrix와 일치 (총 784 Pixel 구성)
Hidden Layer1(renu)는 128 Node로 구성 (Hidden Layer의 Node구성 변경가능)
Hidden Layer2(renu)는 64 Node로 구성 (Hidden Layer의 Node구성 변경가능)
Output Layer(softmax) 10 Node로 classfication 구성되며, 이곳에서 숫자선택됨 (다중 선택도 가능)
상위 선택된 10개 중 다시 최종 확률이 높은 것으로 결정

아래의 구조를 MLP(MultiLayer Peceptron)이라고 하며 이는 CNN의 기초라고 하는데, 각 함수들을 이해하도록 해야겠다.

동작방식은 각 Layer를 걸쳐 특징을 추출하여, 이를 최종선택되는 구조이다.

최종 선택시 사용되는 것이 Activation Function 이며, 아래와 같이 각 ( Softmax/Sigmoid/Relu) 사용되어진다.

Activation Function

Weight, Bias를 적용되어진 상태에서 어느 기준에서 On/Off를 하는 것이라고 생각하면 될꺼 같다.

그러므로, 각 함수의 특징을 어느 정도는 인지를 하고 있어야 할 것으로 보인다.

쉽게 생각하면, Threshold 를 어디에 어떻게 적용하는 역할이 될 꺼 이기 때문인 걸로 생각되어진다.

https://en.wikipedia.org/wiki/Activation_function

기본 MNIST 모델 구성확인

Activation 함수로 Sigmoid 대신 ReLu를 사용했으며, 변경해서 사용해도 된다.

https://mxnet.apache.org/versions/1.3.1/tutorials/python/mnist.html

세부설명 및 참조

https://mxnet.apache.org/versions/1.3.1/tutorials/python/mnist.html

https://mlfromscratch.com/neural-network-tutorial/#/

1.1 Weight 의 Matrix 구성방법

각 Layer를 연결할때 필요한 것이 Weight 와 Bias 이며, 이를 Matrix 형태로 구성하여 Feature를 추출한다고 한다.

Input 과 Weight Matrix를 구성하는 방법이며, 쉽게 생각하면 행렬(Matrix)를 어떻게 해서 Faeture를 추출할지를 구성하는 방법이다.

Weight 의 Matrix 의 구성방식

Feature를 Column 로 구성
Feature를 Row로 구성

Feature as Column 방식

Column: Feature ( Weight 곱)
Row: Sample 의 갯수 (각 Node)

상위 X들은 Sample 즉 각 Node의 갯수

Feature as Row 방식

Column: Sample의 갯수 (각 Node)
Row: Feature

Matrix의 기본동작과 구성방식

Feature as Column 방식 : X * W + B
Feature as Row 방식 : W * X + B

Feature의 위치에 따라 상위와 같이 Weight의 위치가 변경이 되어진다.

Matrix 로 Weight 와 Bias 결합

각 Layer는 Weight의 합으로 연결되어 Activation 함수를 걸쳐 최종 Output Activate를 결정함

Activation 함수: Sigmoid /ReLu 등 다양함

1.2 Feature as Column 방식 Matrix 예제

각 Layer 구성이 다음과 같이 구성이 되어있다고 생각하고, 각 Layer0 과 Layer1을 Matrix로 연결해보자.

2개의 Layer Feature as Column 방식으로 연결

Layer0: 4 Node
Layer1: 6 Node

Layer0의 Input Node 4 와 Weight는 반드시 동일

Layer1 의 Output Node 이므로, Output Node 6개는 Bias와 동일하게 맞춤

최종 Layer 0 과 1의 구성되는 Matrix

이곳에 최종 Activation 함수만 적용하면된다.

상위 각 Matix의 구성 살펴보자 (Red: X , Blue: W , Green:B/Y)

상위그림을 보고 쉽게 이해하자.

Weight/Bias 의 Matrix 의 이해

https://medium.com/from-the-scratch/deep-learning-deep-guide-for-all-your-matrix-dimensions-and-calculations-415012de1568

https://cs231n.github.io/linear-classify/

1.3 MNIST의 의 Matrix 구성과 Bias 의 필요성

상위 맨위의 MNIST를 각 Layer 중 Input Layer 와 Hidden Layer1을 Matrix로 구성을 보도록하자.

MNIST의 Input Layer와 Hidden Layer1 연결

Input Layer: 784 Node
Hidden Layer1: 128 Node

구성으로 될 것이며, 이를 상위와 같이 Matrix를 구성하면 상위를 참조하여 구성한 후 ReLu로 최종 Activation을 하면된다.

Bias 의 필요성

처음 Bias의 필요성에 대해서 왜 사용하는지 몰랐으나, 지금까지 이해한 것으로는 단지 offset이 아닌 Activation의 최종 Threshold를 조절하기 위해서 보정값으로 봐야 할 것 같다.

Activation 함수들 과 Bias

더불어 Activation 함수들이 많은데, 왜 이 많은 함수들을 사용하는지 완벽히 이해하지 못했지만, 짐작으로 보면,

각 Activation 함수의 각 동작의 조건이 달라지기 때문으로 보인다.

예를들면, 각 x의 range에 따라 y의 range 범위의 변경이 되던가 혹은 함수마다 range, 범위가 다른것이 존재하여 이를 목적에 맞게 사용하는 것으로 보인다.

더불어 bias는 이곳에 offset으로 범위(range)의 위치를 변경하여, 최종 Threshold 값을 결정하여 on/off를 결정하는 것으로 보인다.

Weight 와 Bias 와 Activation

Weight: 각 Neuron에는 Weight , 즉 가중치값이 존재하며, 이는 각 특징을 추출
Bias: 일종의 최종 offset 이며, Activation 값에 영향을 미쳐 변경
Activation: Machin Learning에서 On / OFF 를 결정하는 함수로 각 특성이 있음

Sigmoid
ReLu
Softmax 등 다양함

https://en.wikipedia.org/wiki/Activation_function

Matrix 구성으로 본 Weight와 Bias

Input Layer: 784 Node
Hidden Layer1: 128 Node

상위 예제로 간단하게 Matrix를 구성해보도록 하고 Weight 와 Bias를 넣어보자.

W: Weight 784x128구성
X: Input Node (Sample) 784 구성하지만, 옆으로 구성
B: Bias 128 구성 (Output과 항상 동일)
Y: Output Node (Result) 128 구성되며 최종 Activation 함수 적용(ReLu)

https://ml-cheatsheet.readthedocs.io/en/latest/forwardpropagation.html

Matrix Input/Output 구성방법

Layer간에 Input /Output Node의 갯수의 구성을 맞추기 위해서 Matrix를 수정

https://ml-cheatsheet.readthedocs.io/en/latest/forwardpropagation.html

두 Layer 간의 구성

Weight 와 Input 적용 (W1 * X1 + W2* X2 + ... W64 * X64)
Bias 적용 (W1 * X1 + W2* X2 + ... W64 * X64) + B1
Activation 적용 Active( (W1 * X1 + W2* X2 + ... W64 * X64) + B1 )

Weight 와 Bias를 넣은 후 최종 Softmax 연산

각 Activation 함수들 특징들은 아래 링크 참조

ReLU

Activation Function으로 일정값 이상이면, On이 되어 동작

https://en.wikipedia.org/wiki/Rectifier_%28neural_networks%29

Softmax

https://en.wikipedia.org/wiki/Softmax_function

Softmax vs Sigmoid

https://medium.com/arteos-ai/the-differences-between-sigmoid-and-softmax-activation-function-12adee8cf322#:~:text=Softmax%20is%20used%20for%20multi,similar%20to%20the%20Sigmoid%20function.&text=This%20is%20main%20reason%20why%20the%20Softmax%20is%20cool.

Get started with TensorFlow's High-Level APIs (Google I/O '18)

Colab에 대해서 나오며, 설명을 보면 MNIST 관련부분과 CNN 설명해주고 있다.
https://www.youtube.com/watch?v=tjsHSIG8I08

Tensorflow의 MNIST 설명

기본 MNIST

https://tensorflowkorea.gitbooks.io/tensorflow-kr/content/g3doc/tutorials/mnist/beginners/

CNN을 이용한 MNIST

https://tensorflowkorea.gitbooks.io/tensorflow-kr/content/g3doc/tutorials/mnist/pros/

4/23/2018

Deep/ Machine Learning 자료 와 Cuda 자료 링크들

현재 Deep learning 및 AI 에 관련일을 하지 않기 때문에, 관련부분은 링크로 자료수집하며, 추후 시간이 된다면, 관련교육내용 사항을 정리하자.

추후 관련일을 하거나 공부할 일 있다면, 그때 다시 재 정리를 하도록 하자.

Deep Learning 이해를 위해 관련부분 링크

Machine/Deep Learning에 관련된 자료부분
  https://www.slideshare.net/HeeWonPark11/ss-80653977?from_m_app=ios
  http://www.deeplearningbook.org/
  http://singularity99.com/ko/articles/101
  http://enginius.tistory.com/category/Enginius/Machine%20Learning

Machine 과 Deep Learning의 차이

아래의 그림을 보면, AI에서 Machine Learning으로 그리고 Deep Learning의 변화를 간단히 볼 수있다.

차이는 존재하겠지만 그 기본은 동일한 것으로 보인다.

Cell 기반의 Layer의 구조

Machine / Deep Learning의 구조를 보면, 각각의 Cell 로 구성된 Layer들로 구성되며, 이는 인간의 뇌의 뉴런/ Cell을 기본구성으로 생각하고

이를 만들었다고 하는데, 글을 보면 추상적으로 는 이해가 되지만, 정확히 어떻게 동작되는지는 이해가 되지 않는다.

인간의 뉴런구조 와 이를 구현하기 위해서 만든 Cell 구조

상위그림 및 설명출처
https://medium.com/machine-learning-for-humans/neural-networks-deep-learning-cdad8aeae49b

Tensorflow 와 Keras 기반으로 설명해주는 Deep Learnig MNIST 설명부분

어느 사이트를 가든 기본으로 설명되는것이 MNIST인데, 이부분을 정확하게 이해하도록해야겠다.
https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0
http://cs231n.stanford.edu/syllabus.html
http://neuralnetworksanddeeplearning.com/chap1.html

Docker 설치 및 구조

Machine / Deep Learning을 보다 보면, Docker를 자주 사용해야하는데, 관련부분도 자세히 알아야함
https://datascienceschool.net/view-notebook/661128713b654edc928ecb455a826b1d/

TensorFlow 영어 교육 및 실습

모두를 위한 딥러닝 관련 학습자료

https://educast.pro/11.383/?gclid=CjwKCAjwjozPBRAqEiwA6xTOYNDdI3BzrUh8ru9tipA0aHq2U3eHYHcYhb6stCM3gQv5n3x0SVrUChoCukQQAvD_BwE

딥러닝의 Andrew Ng 교수내용이라고 하는데, 내용이 좀 많이 길다.
http://jaejunyoo.blogspot.com/2017/03/kr-nips-2016-tutorial-summary-nuts-and-bolts-of-building-AI-AndrewNg.html

상위자료 및 다양한 자료들을 수집해놓은 사이트

http://hunkim.github.io/ml/

Tensorflow 관련내용들 링크

  https://www.slideshare.net/JunKim22/tensorflow-tutorial-68885890
  https://github.com/golbin/TensorFlow-Tutorials
  https://github.com/uosdmlab/tensorflow-tutorial
  https://www.tensorflow.org/tutorials/

Deep learning 와 Cuda관련자료

Deep Learning관련부분을 찾다보면, 연산량때문에 반드시 Nvidia의 Cuda가 나오며, 관련자료들을 링크
  http://blog.naver.com/PostList.nhn?blogId=sogangori&from=postList&categoryNo=6
  http://blog.naver.com/PostList.nhn?blogId=sogangori&from=postList&categoryNo=7
  http://jaejunyoo.blogspot.com/2017/01/generative-adversarial-nets-1.html
  https://plus.google.com/+JaeJunYoo
  http://blog.naver.com/PostView.nhn?blogId=laonple&logNo=220648539191

Yollo and Yollo9000 설명

설명이 비교적 쉽게되어 있어서 대충은 이해가 가지만, 완벽히는 이해가 되지 않지만, 추상적으로는 알겠다.

이해가 되지 않는 이유는 보면, 수학함수와 왜 사용을 해야하는지 이해가 되지 않는다.
http://blog.naver.com/PostView.nhn?blogId=sogangori&logNo=221011203855&parentCategoryNo=6&categoryNo=&viewDate=&isShowPopularPosts=true&from=search

Caffe / Caffe2

http://caffe.berkeleyvision.org/

이쪽 자료가 너무 방대해서 한번에 알기는 너무 힘들며, 라즈베리파이로도 Tensorflow는 지금 현재 지원이 되는 방향으로 간다.
현재 이쪽 흐름이 어떻게 갈지 모르기때문에 추후 지켜보고 전망 후 사용할 플랫폼 결정이 필요하며,
Tensorflow or Caffe 이외 다른 것도 존재하므로, 지금 공부해야할 것을 정하기가 좀 애매하다.
이 모든 것을 공부하기에는 너무 많다.

Bigdata

BigData 부분은 Machine/ Deep Learning의 학습을 위해서 반드시 필요하다.
https://ahyuo79.blogspot.com/search/label/AI-Bigdata

임베디드 관련보드 기반의 AI 추후 자료찾기

TI 기반으로 구성된 보드에서는 AI 관련자료를 찾기가 힘듦
TI 역시 DSP기반으로 제공할 것 같은데, 이부분도 지속적으로 검색해야함
NVIDIA의 Jetson TX1/TX2 (Tensorflow 및 TensorRT 지원)
Zynq (Xilinx Soc) JetsonTX2 와 비교해봐야함
Google기반의 TPU가 지원가능한 SoC가 나올 경우 관련 SoC 검색
Qualcomm도 DSP 기반으로 상위 플랫폼지원을 한다고 하는데, 추후 검색

피드 구독하기: 글 ( Atom )