TIL

λ¨Έμ‹ λŸ¬λ‹μ„ μœ„ν•œ ν™•λ₯  기초 - TIL230719

sunhokimDev 2023. 7. 24. 14:19

πŸ“š KDT WEEK 16 DAY 3 TIL

  • ν™•λ₯  기초

 

λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈν•™μŠ΅μ˜ λͺ©ν‘œ > μ†μ‹€ν•¨μˆ˜(μ˜ˆμΈ‘κ°’κ³Ό 라벨사이 거리)의 μ΅œμ†Œν™”

 

손싀 ν•¨μˆ˜

 

ν•΄λ‹Ή 식은 ν™•λ₯ μ— λŒ€ν•œ 지식을 기반으둜 λ§Œλ“€μ–΄μ§„ 식이닀.

λ”°λΌμ„œ λ¨Έμ‹ λŸ¬λ‹μ— λŒ€ν•΄ 깊게 μ΄ν•΄ν•˜λ €λ©΄ ν™•λ₯ μ— λŒ€ν•œ κΈ°μ΄ˆμ§€μ‹μ΄ ν•„μš”ν•˜λ‹€.

 


πŸŸ₯ ν™•λ₯ 

μ‹€ν—˜μ˜ κ²°κ³Ό(ex. λ™μ „λ˜μ§€κΈ°)둜 λ°œμƒν•˜λŠ” λͺ¨λ“  결과의 μ§‘ν•©(ν‘œλ³Έμ§‘ν•©)을 S라고 ν•  λ•Œ,

μ§‘ν•© S의 λΆ€λΆ„μ§‘ν•©(event)을 μ‹€μˆ˜κ°’μ— λŒ€μ‘μ‹œν‚€λŠ” ν•¨μˆ˜!

 

동전을 ν•œλ²ˆ λ˜μ‘Œμ„ λ•Œ λͺ¨λ“  결과의 μ§‘ν•©, 즉 ν‘œλ³Έμ§‘ν•©μ€ μ•žλ©΄(H), λ’·λ©΄(T)둜 이루어진닀.

λ”°λΌμ„œ S = {H, T}이고, μ—¬κΈ°μ„œ μ•žλ©΄μ΄ λ‚˜μ˜¬ ν™•λ₯ μ€ P = {H}라고 ν•˜λ©°, 1/2κ°€ λœλ‹€.

 

ν™•λ₯ λ³€μˆ˜

ν™•λ₯ λ³€μˆ˜ XλŠ” ν‘œλ³Έμ§‘ν•© S의 μ›μ†Œ eλ₯Ό μ‹€μˆ˜κ°’ X(e) = x에 λŒ€μ‘μ‹œν‚€λŠ” ν•¨μˆ˜μ΄λ‹€.

λ‹€μŒ 그림의 ν™•λ₯ λ³€μˆ˜ XλŠ” H의 κ°œμˆ˜μ— λ”°λ₯Έ ν•¨μˆ˜κ°€ λœλ‹€.

 

SλŠ” 동전을 λ‘λ²ˆ λ˜μ‘Œμ„ λ•Œμ˜ ν‘œλ³Έμ§‘ν•©μ΄λ‹€.

 

λˆ„μ λΆ„ν¬ν•¨μˆ˜(cumulative distribution function, CDF)

x μ΄ν•˜μ˜ λͺ¨λ“  κ°’μ˜ ν™•λ₯ μ΄λ‹€.

CDF

 

연속확λ₯ λ³€μˆ˜ (Continuous Random Variable) & ν™•λ₯ λ°€λ„ν•¨μˆ˜ (probability density function, PDF)

ν™•λ₯ λ³€μˆ˜κ°€ κ°–λŠ” 값듀이 μ‹€μˆ˜μ˜ κ΅¬κ°„μœΌλ‘œ ν‘œν˜„λ  λ•Œ 연속확λ₯ λ³€μˆ˜λΌκ³  ν•œλ‹€.

 

연속확λ₯ λ³€μˆ˜μ™€ ν™•λ₯ λ°€λ„ν•¨μˆ˜

λ”°λΌμ„œ μ–΄λ–€ κ°’ a와 b μ‚¬μ΄μ˜ ν™•λ₯ μ„ κ΅¬ν•˜λŠ” 것은 ν™•λ₯ λ°€λ„ν•¨μˆ˜ κ·Έλž˜ν”„μ˜ 넓이λ₯Ό κ΅¬ν•˜λŠ” 것과 κ°™λ‹€.

f(x) λŒ€μ‹  p(x)라고 ν‘œκΈ°ν•˜κΈ°λ„ ν•˜κ³ , ν™•λ₯ μ˜ 합은 항상 1이어야 ν•˜λ―€λ‘œ λ‹€μŒμ˜ 쑰건을 항상 λ§Œμ‘±ν•œλ‹€.

 

 

κΈ°λŒ“κ°’(Expectations)

ν™•λ₯ λΆ„포 p(x)ν•˜μ—μ„œ ν•¨μˆ˜ f(x)의 평균값

 

κΈ°λŒ“κ°’μ„ ν†΅ν•œ 이산확λ₯ λΆ„포와 연속확λ₯ λΆ„포

 

λΆ„μ‚°(variance)κ³Ό 곡뢄산(covariance)

f(x)의 값듀이 κΈ°λŒ“κ°’μœΌλ‘œλΆ€ν„° 흩어져 μžˆλŠ” 정도

 

 

ν™•λ₯ μ„ ν•΄μ„ν•˜λŠ” 두 κ°€μ§€ λ‹€λ₯Έ 관점

  • λΉˆλ„μ£Όμ˜ : λ°˜λ³΅κ°€λŠ₯ν•œ 사건(ex. λ™μ „λ˜μ§€κΈ°)λ“€μ˜ λΉˆλ„μˆ˜μ— 기반
  • λ² μ΄μ§€μ•ˆ : λΆˆν™•μ‹€μ„±μ„ μ •λŸ‰μ μœΌλ‘œ ν‘œν˜„ > λ°˜λ³΅κ°€λŠ₯ν•˜μ§€μ•Šμ€ 사건(ex. λΆκ·Ήμ–ΌμŒμ΄ 이번 세기말에 녹을 ν™•λ₯ )

λΉˆλ„μ£Όμ˜μ—μ„œλŠ” λ°˜λ³΅κ°€λŠ₯ν•˜μ§€μ•Šμ€ 사건 계산이 μ–΄λ €μš°λ―€λ‘œ 일반적으둜 λ² μ΄μ§€μ•ˆμ΄ κ°•λ ₯ν•˜λ‹€κ³  λ³Έλ‹€.

 

λ² μ΄μ§€μ•ˆ κ΄€μ μ˜ μž₯정은 사전확λ₯ μ„ λͺ¨λΈμ— ν¬ν•¨μ‹œν‚¬ 수 μžˆλ‹€λŠ” 점이닀.

 

μ •κ·œλΆ„ν¬

연속확λ₯ λ³€μˆ˜μ˜ λŒ€ν‘œμ μΈ λΆ„ν¬λ‘œ, μ‹€μ œ λ¬Έμ œμ—μ„œ μΈ‘μ •μΉ˜κ°€ κ·Όμ‚¬μ μœΌλ‘œ μ •κ·œλΆ„ν¬λ₯Ό λ”°λ₯΄κ²Œ λœλ‹€.

 

  • 평균을 μ€‘μ‹¬μœΌλ‘œ λŒ€μΉ­μΈ μ’…λͺ¨μ–‘(bell-shaped)인 ν™•λ₯ λ°€λ„ν•¨μˆ˜μ˜ κ·Έλž˜ν”„μ΄λ‹€.
  • μ •κ·œλΆ„ν¬μ˜ λͺ¨μ–‘κ³Ό μœ„μΉ˜λŠ” 평균과 ν‘œμ€€νŽΈμ°¨μ— μ˜ν•΄ κ²°μ •λœλ‹€
  • μ •κ·œκ³‘μ„ κ³Ό XμΆ• μ‚¬μ΄μ˜ 면적은 1이닀.
  • μ •κ·œκ³‘μ„ μ€ XμΆ• 사이에 λ‹Ώμ§€ μ•ŠμœΌλ―€λ‘œ, XμΆ• κ°’μ˜ λ²”μœ„λŠ” -∞ < X < ∞ 이닀.

μ •κ·œλΆ„ν¬μ˜ 식과 κ·Έ κ·Έλž˜ν”„

 

μ •κ·œλΆ„ν¬μ—μ„œ 평균이 0이고, ν‘œμ€€νŽΈμ°¨κ°€ 1인 뢄포λ₯Ό ν‘œμ€€μ •κ·œλΆ„ν¬λΌκ³  λΆ€λ₯Έλ‹€.

 

 

곑선근사(Curve Fitting)