basic algorithms

Tour of Machine Learning Algorithms   – link

The Master Algorithm   – book

math

KhanAcademy:

Books

Audio (supplementary material)

deep learining

Resources

Languages & Frameworks

Resources

Checkpoint

45m/d ML

15m/d Math (KhanAcademy)

Audio

Shallow Algos 1

Resources

Consciousness

Resources

  • Philosophy of Mind: Brains, Consciousness, and Thinking Machines (Audible, TGC) audio:easy

Natural Language Processing 1

Resources

Deep NLP 1

Resources

Convolutional Neural Networks

Resources

Reinforcement Learning Intro

Resources

basic algorithms

Tour of Machine Learning Algorithms   – link

The Master Algorithm   – book

math

KhanAcademy:

Books

Audio (supplementary material)

deep learining

Resources

Languages & Frameworks

Resources

Checkpoint

45m/d ML

15m/d Math (KhanAcademy)

Audio

Shallow Algos 1

Resources

Consciousness

Resources

  • Philosophy of Mind: Brains, Consciousness, and Thinking Machines (Audible, TGC) audio:easy

Natural Language Processing 1

Resources

Deep NLP 1

Resources

Convolutional Neural Networks

Resources

Reinforcement Learning Intro

Resources

https://www.coursera.org/learn/machine-learning/lecture/iDBMm/problem-description-and-pipeline

PHOTO OCR – Problem Description and Pipeline

image

photo ocr ( optical character recognition ) 문제를 이 강의에서 주제로 다루고 있다.

사진에서 어떤 과정을 거쳐 글자를 인식하는지 보여주고 있다. 비슷한 문자로 인한 문제를 해결하는 작업이 추가되어야 하나 여기서는 생략한다. ( 예를 들어 1 과 l 을 혼동하는 경우를 대비해서 수정하는 작업 )

image

하나의 큰 작업을 수행하기 위해 연속된 작은 단위의 작업으로 나누어 수행하는 것을 machine learning pipeline이라고 한다. 보통 각 작은 단위에 1-5 명의 엔지니어가 작업을 수행한다. 


https://www.coursera.org/learn/machine-learning/lecture/bQhq3/sliding-windows

PHOTO OCR – Sliding Windows

image
image
image

그림에서 보듯이 녹색 박스를 좌우 상하로 움직이며 해당 물체를 찾는다. 박스크기를 다양하게 해서 여러 크기의 해당 물체를 찾아낸다.

image
image
image

위 그림 좌하단의 하얀 박스를 조금 넓혀서 글자의 영역을 넓혀준것이 우하단의 사진이다.

image

글자간의 여백을 찾아 각각의 글자를 구별한다.


https://www.coursera.org/learn/machine-learning/lecture/K0XQT/getting-lots-of-data-and-artificial-data

Getting Lots of Data and Artificial Data

좀더 많은 데이터가 필요한 상황인지 아닌지 파악하고 손수 데이터를 추가하는 것이 좋은지 가상의 데이터를 만드는 것이 좋은지 어떻게 판단하면 좋은지 설명하고 있다.

image

ocr 작업의 경우 다양한 폰트를 이용해서 가상데이터를 추가할수 있다.

image

ocr 작업의 경우 이미지 변형을 통해 가상데이터를 추가할수 있다.

image

음성인식인경우 다른 레이어의 음성을 추가할수 있다.

image
image

biased 된 알고리즘의 경우 데이터를 추가해도 별 효과가 없으므로 먼저 알고리즘이 biased된것이 아닌지 확인한다. 인공데이터를 이용할지 손수 데이터를 수집할지 다른 데이터 제공을 이용할지 결정하한다.


https://www.coursera.org/learn/machine-learning/lecture/LrJbq/ceiling-analysis-what-part-of-the-pipeline-to-work-on-next

Ceiling Analysis: What Part of the Pipeline to Work on Next

machine learning pipeline 작업을 하는 경우 어느 component의 성능이 가장 부족한지를 파악하고 그 부분에 신경을 쓰는 것이 좋다. 어떻게 어느 부분이 문제가 있는지 확인하는 작업에 대해 설명하고 있다.

image

각 단계를 최상으로 맞추고 전체 성능이 어떻게 변화하는지 확인한다. 예를 들어 text detection이 100%인 데이터를 넣고 알고리즘을 확인, 또 그다음에는 character segementation이 100%된 데이터를 넣고 확인한다.


https://www.coursera.org/learn/machine-learning/lecture/eYaD4/summary-and-thank-you

Summary

https://www.coursera.org/learn/machine-learning/lecture/iDBMm/problem-description-and-pipeline

PHOTO OCR – Problem Description and Pipeline

image

photo ocr ( optical character recognition ) 문제를 이 강의에서 주제로 다루고 있다.

사진에서 어떤 과정을 거쳐 글자를 인식하는지 보여주고 있다. 비슷한 문자로 인한 문제를 해결하는 작업이 추가되어야 하나 여기서는 생략한다. ( 예를 들어 1 과 l 을 혼동하는 경우를 대비해서 수정하는 작업 )

image

하나의 큰 작업을 수행하기 위해 연속된 작은 단위의 작업으로 나누어 수행하는 것을 machine learning pipeline이라고 한다. 보통 각 작은 단위에 1-5 명의 엔지니어가 작업을 수행한다. 


https://www.coursera.org/learn/machine-learning/lecture/bQhq3/sliding-windows

PHOTO OCR – Sliding Windows

image
image
image

그림에서 보듯이 녹색 박스를 좌우 상하로 움직이며 해당 물체를 찾는다. 박스크기를 다양하게 해서 여러 크기의 해당 물체를 찾아낸다.

image
image
image

위 그림 좌하단의 하얀 박스를 조금 넓혀서 글자의 영역을 넓혀준것이 우하단의 사진이다.

image

글자간의 여백을 찾아 각각의 글자를 구별한다.


https://www.coursera.org/learn/machine-learning/lecture/K0XQT/getting-lots-of-data-and-artificial-data

Getting Lots of Data and Artificial Data

좀더 많은 데이터가 필요한 상황인지 아닌지 파악하고 손수 데이터를 추가하는 것이 좋은지 가상의 데이터를 만드는 것이 좋은지 어떻게 판단하면 좋은지 설명하고 있다.

image

ocr 작업의 경우 다양한 폰트를 이용해서 가상데이터를 추가할수 있다.

image

ocr 작업의 경우 이미지 변형을 통해 가상데이터를 추가할수 있다.

image

음성인식인경우 다른 레이어의 음성을 추가할수 있다.

image
image

biased 된 알고리즘의 경우 데이터를 추가해도 별 효과가 없으므로 먼저 알고리즘이 biased된것이 아닌지 확인한다. 인공데이터를 이용할지 손수 데이터를 수집할지 다른 데이터 제공을 이용할지 결정하한다.


https://www.coursera.org/learn/machine-learning/lecture/LrJbq/ceiling-analysis-what-part-of-the-pipeline-to-work-on-next

Ceiling Analysis: What Part of the Pipeline to Work on Next

machine learning pipeline 작업을 하는 경우 어느 component의 성능이 가장 부족한지를 파악하고 그 부분에 신경을 쓰는 것이 좋다. 어떻게 어느 부분이 문제가 있는지 확인하는 작업에 대해 설명하고 있다.

image

각 단계를 최상으로 맞추고 전체 성능이 어떻게 변화하는지 확인한다. 예를 들어 text detection이 100%인 데이터를 넣고 알고리즘을 확인, 또 그다음에는 character segementation이 100%된 데이터를 넣고 확인한다.


https://www.coursera.org/learn/machine-learning/lecture/eYaD4/summary-and-thank-you

Summary