original source : https://youtu.be/1P9eV0ExuZ0

image

=========================================================

.

.

image

obtainMessage()는 pool에 있는 이미 만들어진 남는 Message를 가져온다.

=========================================================

.

.

image

obj를 통해 Message에 데이터를 전달할수 있지만 간단한 정수만을 사용해도 되는 경우 arg1, arg2를 이용한다. 

=========================================================

.

.’

image

=========================================================

.

.

image

handler의 sendMessage()를 통해 Message가 queue에 올라 가게 된다.

=========================================================

.

.

image

=========================================================

.

.

image
image
image
image

=========================================================

.

.

image

post()를 통해 Message가 아닌 Runnable을 queue에 올려 놓을 수 있다.

=========================================================

.

.

image

=========================================================

.

.

image

=========================================================

.

.

image

handler가 아닌 위의 방법들로 main thread에 접근가능하다.

=========================================================

.

.

image

=========================================================

.

.

image

=========================================================

.

.

image

=========================================================

.

.

image

=========================================================

.

.

image

AsyncTask<>의 첫번째 arg는 doInBackgroun에 전달되는 arg이다. 

두번째 arg는 onProgressUpdate()에 사용되는 arg이다.

세번째 arg는 onPostExecute()에 사용되는 arg이다.

image

=========================================================

.

.

image
image
image
image

Lec 2 | MIT 18.06 Linear Algebra, Spring 2005

https://youtu.be/QVKj3LADCnA

image
image

matrix*vector is linear combination of the columns of the matrix, and vector*matrix is linear combination of the row of the matrix.

image

순서가 바뀌지 않는 한도 내에서 결합법칙은 가능하다. 그러므로 위그림에서는 E32와 E21을 먼저 계산할수 있다.

image
image

2 1 Regular Expressions

https://youtu.be/zfH2ADGtzJQ

image
image
image

| 는 ‘또는’을 의미한다.

image

u?의 경우 u는 있어도 되고 없어도 된다는 의미이다. o+는 적어도 o가 한번 이상나와야 한다. o*는 0번또는 그 이상 여러번 나올수 있다. 점 . 는 어떤 캐릭터도 될수 있다. 

image

여기서 ^는 시작을 의미한다. $는 마침을 의미한다. 

2 3 Word Tokenization
https://youtu.be/f9o514a-kuc

image

모든 nlp에서 데이터는 기본적으로 token 단위로 나누어야 한다. 

image

같은 어원, 어근을 가지는 단어들을 어떻게 처리할것인지 단수, 복수처럼 상황에 따라 단어의 형태가 조금 바뀌는 경우 같은 단어로 볼것인지 아닌지를 결정해야 한다.

image

 token은 중복되는 것을 상관하지 않고 각각 따로 갯수를 센다. type의 경우 동일한 단어는 갯수에서 제외한다.

image

각 tokens의 갯수가 types보다 큰것을 알수 있다.

image

tokens, types단위로 나눌때 흔히 발생하는 문제를 보여주고 있다.

image

각 언어별 특성에 따른 문제점들을 보여주고 있다.

image
image

중국어나 일본어처럼 띄어쓰기가 없는 경우 사용할수 있는 방법으로 maxium matching word segmentation algorithm이 있는데 이를 보여주고 있다.

2 4 Word Normalization and Stemming
https://youtu.be/ZhyLgPnOeh0

아래에 단어를 여러방법으로 정리하는 것을 보여주고 있다. 

image
image

case를 한 방향으로 통일하는 방법이다.

image

한 lemma를 기반으로 하는 단어들을 하나로 통일해준다. 

image

어근과 접미, 접두의 합으로 표현할수도 있다.

image
image

영어 단어를 정리하는데 porter algorithm을 많이 사용한다.

image

영어에서 ing 를 정리할때 모음이 있는 경우만 제거한다.

2 5 Sentence Segmentation
https://youtu.be/UL4Ez56AMVo

문장단위로 데이터를 잘라서 처리하는 방법을 보여주고 있다.

!와 ?를 기준으로 문장을 구분하는 것은 불확실하다. 점 .를  기준으로 나누는 경우도 단어의 약자나 숫자에 사용되는 . 때문에 어려움이 있다. 그래서 추가 작업이 필요하다. 이때 사용할수 있는 것이 hand-written rules, regular expression, machine learning 등등이 있다.

문장의 끝을 확인하는 간단한 방법으로 decision tree를 이용하는 것이 있다. 

dot 앞뒤에 대문자가 사용된경우 약자에 사용된 dot일 확률이 높다. dot 뒤에 대문자가 오는 경우 dot이 문장 끝일가능성이 높다. 단어 the 앞에 dot 이 사용된 경우 dot이 문자의 끝일 확률이 높다. 

L02.2 Conditional Probabilities
https://youtu.be/MPRKc4UPoJk

image
image

L02.3 A Die Roll Example
https://youtu.be/YenDB3yOfDc

image

Conditional Probabilities의 예시

L02.4 Conditional Probabilities Obey the Same Axioms
https://youtu.be/L_pEeYLGaP0

image

L02.5 A Radar Example and Three Basic Tools
https://youtu.be/uL31gpFdarc

image

L02.6 The Multiplication Rule
https://youtu.be/ugzs7dgQ-JE

image

L02.7 Total Probability Theorem
https://youtu.be/8odFouBR2wE

image

L02.8 Bayes’ Rule
https://youtu.be/kz2tvO_ZAKI

image

밑의 공식의 밑변은 Total Probability Theorem에서 나온것이다. 윗 부분은 conditional probability에서 유도된것이다.