функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π€ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ – основы Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Машинного ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΡ

Адаптированный ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ прСкрасной ΡΡ‚Π°Ρ‚ΡŒΠΈ энтузиаста Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ машинного обучСния Javaid Nabi.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ машинного обучСния учится ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ…, Π²Π°ΠΆΠ½ΠΎ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ Π² основных концСпциях ΠΈ понятиях, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

Π€ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ

Π’ контСкстС Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ машинного обучСния, ΠΎΡ†Π΅Π½ΠΊΠ° – это статистичСский Ρ‚Π΅Ρ€ΠΌΠΈΠ½ для нахоТдСния Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ приблиТСния нСизвСстного ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° Π½Π° основС Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. ВочСчная ΠΎΡ†Π΅Π½ΠΊΠ° – это ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠ° Π½Π°ΠΉΡ‚ΠΈ СдинствСнноС Π»ΡƒΡ‡ΡˆΠ΅Π΅ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠ΅ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ количСства ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‰ΠΈΡ… нас ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². Или Π½Π° Π±ΠΎΠ»Π΅Π΅ Ρ„ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠΌ языкС матСматичСской статистики β€” точСчная ΠΎΡ†Π΅Π½ΠΊΠ° это число, ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅ΠΌΠΎΠ΅ Π½Π° основС наблюдСний, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π±Π»ΠΈΠ·ΠΊΠΎΠ΅ ΠΊ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅ΠΌΠΎΠΌΡƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρƒ.

Под количСством ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‰ΠΈΡ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ подразумСваСтся:
β€’ Один ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€
β€’ Π’Π΅ΠΊΡ‚ΠΎΡ€ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² – Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, вСса Π² Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии
β€’ ЦСлая функция

ВочСчная ΠΎΡ†Π΅Π½ΠΊΠ°

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π’Π°ΠΊΠΎΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ являСтся ΠΎΡ‡Π΅Π½ΡŒ ΠΎΠ±Ρ‰ΠΈΠΌ ΠΈ прСдоставляСт Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΡƒ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ свободу дСйствий. ΠŸΠΎΡ‡Ρ‚ΠΈ любая функция, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½Ρ‰ΠΈΠΊ, Π½ΠΎ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ ΠΎΡ†Π΅Π½Ρ‰ΠΈΠΊ – это функция, значСния ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π±Π»ΠΈΠ·ΠΊΠΈ ΠΊ истинному Π±Π°Π·ΠΎΠ²ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ ΞΈ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ сгСнСрированно ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ.

ВочСчная ΠΎΡ†Π΅Π½ΠΊΠ° Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒΡΡ ΠΊ ΠΎΡ†Π΅Π½ΠΊΠ΅ взаимосвязи ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ ΠΈ Ρ†Π΅Π»Π΅Π²Ρ‹ΠΌΠΈ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ, Π² этом случаС Ρ‡Π°Ρ‰Π΅ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ.

Ѐункция ΠΎΡ†Π΅Π½ΠΊΠΈ

Π—Π°Π΄Π°Ρ‡Π°, Ρ€Π΅ΡˆΠ°Π΅ΠΌΠ°Ρ ΠΌΠ°ΡˆΠΈΠ½Π½Ρ‹ΠΌ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ, Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠ΅ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ y ΠΏΠΎ Π·Π°Π΄Π°Π½Π½ΠΎΠΌΡƒ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΌΡƒ Π²Π΅ΠΊΡ‚ΠΎΡ€Ρƒ x. ΠœΡ‹ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ сущСствуСт функция f(x), которая описываСт ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ связь ΠΌΠ΅ΠΆΠ΄Ρƒ y ΠΈ x. НапримСр, ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ y = f(x) + Ξ΅, Π³Π΄Π΅ Ξ΅ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ Ρ‡Π°ΡΡ‚ΡŒ y, которая явно Π½Π΅ прСдсказываСтся Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ x. ΠŸΡ€ΠΈ ΠΎΡ†Π΅Π½ΠΊΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ нас интСрСсуСт ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΈΠ΅ f с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ»ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ fΛ†. Ѐункция ΠΎΡ†Π΅Π½ΠΊΠΈ Π² Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ это Ρ‚ΠΎΠΆΠ΅ самоС, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° ΞΈ; функция ΠΎΡ†Π΅Π½ΠΊΠΈ f это просто точСчная ΠΎΡ†Π΅Π½ΠΊΠ° Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΌ пространствС. ΠŸΡ€ΠΈΠΌΠ΅Ρ€: Π² полиномиальной рСгрСссии ΠΌΡ‹ Π»ΠΈΠ±ΠΎ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅ΠΌ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ w, Π»ΠΈΠ±ΠΎ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅ΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ отобраТСния ΠΈΠ· x Π² y.

Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ ΠΈ диспСрсия

Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ ΠΈ диспСрсия ΠΈΠ·ΠΌΠ΅Ρ€ΡΡŽΡ‚ Π΄Π²Π° Ρ€Π°Π·Π½Ρ‹Ρ… источника ошибки Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ. Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ измСряСт ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ΅ ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ ΠΎΡ‚ истинного значСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΈΠ»ΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°. ДиспСрсия, с Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΌΠ΅Ρ€Ρƒ отклонСния ΠΎΡ‚ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ³ΠΎ значСния ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹Π·Π²Π°Ρ‚ΡŒ любая конкрСтная Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ….

Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅

Π‘ΠΌΠ΅Ρ‰Π΅Π½ΠΈΠ΅ опрСдСляСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

Π³Π΄Π΅ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ E(ΞΈΛ†m) для Π΄Π°Π½Π½Ρ‹Ρ… (рассматриваСмых ΠΊΠ°ΠΊ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΈΠ· случайной Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹) ΠΈ ΞΈ являСтся истинным Π±Π°Π·ΠΎΠ²Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΌ для опрСдСлСния распрСдСлСния, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰Π΅Π³ΠΎ Π΄Π°Π½Π½Ρ‹Π΅.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ΠžΡ†Π΅Π½Ρ‰ΠΈΠΊ ΞΈΛ†m называСтся нСсмСщСнным, Ссли bias(ΞΈΛ†m)=0, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ Ρ‡Ρ‚ΠΎ E(ΞΈΛ†m) = ΞΈ.

ДиспСрсия ΠΈ Бтандартная ошибка

ДиспСрсия ΠΎΡ†Π΅Π½ΠΊΠΈ обозначаСтся ΠΊΠ°ΠΊ Var(ΞΈΛ†), Π³Π΄Π΅ случайная Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° являСтся ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌ мноТСством. ΠΠ»ΡŒΡ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Π½ΠΎ, ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΊΠΎΡ€Π΅Π½ΡŒ диспСрсии называСтся стандартной ошибкой, ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°Π΅ΠΌΠΎΠΉ ΠΊΠ°ΠΊ SE(ΞΈΛ†). ДиспСрсия ΠΈΠ»ΠΈ стандартная ошибка ΠΎΡ†Π΅Π½Ρ‰ΠΈΠΊΠ° ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΌΠ΅Ρ€Ρƒ оТидания Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΎΡ†Π΅Π½ΠΊΠ°, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΡ‹ вычисляСм, Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ ΠΏΠΎ ΠΌΠ΅Ρ€Π΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΌΡ‹ мСняСм Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΈΠ· Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… процСсс.

Π’ΠΎΡ‡Π½ΠΎ Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ ΠΌΡ‹ Ρ…ΠΎΡ‚Π΅Π»ΠΈ Π±Ρ‹, Ρ‡Ρ‚ΠΎΠ±Ρ‹ функция ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΈΠΌΠ΅Π»Π° ΠΌΠ°Π»ΠΎΠ΅ смСщСниС, ΠΌΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ стрСмимся, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρƒ Π½Π΅Π΅ Π±Ρ‹Π»Π° ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ низкая диспСрсия.

Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ рассмотрим Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ.

ΠžΡ†Π΅Π½ΠΊΠ° Максимального ΠŸΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΡ (MLE)

ΠžΡ†Π΅Π½ΠΊΠ° максимального правдоподобия ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠ°ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² (Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ диспСрсия) ΠΈΠ· Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ получСния Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… максимальна.

ΠžΡ†Π΅Π½ΠΊΠ° максимального правдоподобия для ΞΈ опрСдСляСтся ΠΊΠ°ΠΊ:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΌΡ‹ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠ»ΠΈ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ нСзависимыми Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌΠΈ, ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠ΅ Π²Ρ‹ΡˆΠ΅ ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ Π² Π²ΠΈΠ΄Π΅:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π­Ρ‚Π° ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ ΠΌΠ½ΠΎΠ³ΠΈΡ… вСроятностСй ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π΅ΡƒΠ΄ΠΎΠ±Π½Ρ‹ΠΌ ΠΏΠΎ ряду ΠΏΡ€ΠΈΡ‡ΠΈΠ½. Π’ частности, ΠΎΠ½ΠΎ склонно ΠΊ числовой Π½Π΅Π΄ΠΎΠΎΡ†Π΅Π½ΠΊΠ΅. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΉΡ‚ΠΈ максимумы/ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡ‹ этой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, ΠΌΡ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π²Π·ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΡƒΡŽ этой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ‚ ΞΈ ΠΈ ΠΏΡ€ΠΈΡ€Π°Π²Π½ΡΡ‚ΡŒ Π΅Π΅ ΠΊ 0. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ это ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Ρ‡Π»Π΅Π½ΠΎΠ², Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ довольно Π³Ρ€ΠΎΠΌΠΎΠ·Π΄ΠΊΠΎ. Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ ΡƒΠ΄ΠΎΠ±Π½ΡƒΡŽ, Π½ΠΎ ΡΠΊΠ²ΠΈΠ²Π°Π»Π΅Π½Ρ‚Π½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌ вСроятности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π΅ мСняСт Π΅Π³ΠΎ argmax, Π½ΠΎ ΡƒΠ΄ΠΎΠ±Π½ΠΎ ΠΏΡ€Π΅Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² сумму, ΠΈ ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌ – строго Π²ΠΎΠ·Ρ€Π°ΡΡ‚Π°ΡŽΡ‰Π°Ρ функция (функция Π½Π°Ρ‚ΡƒΡ€Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌΠ° – ΠΌΠΎΠ½ΠΎΡ‚ΠΎΠ½Π½ΠΎΠ΅ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅), это Π½Π΅ повлияСт Π½Π° ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΞΈ.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π”Π²Π° Π²Π°ΠΆΠ½Ρ‹Ρ… свойства: ΡΡ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ ΠΈ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ

Π‘Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ. По ΠΌΠ΅Ρ€Π΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ число ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ приблиТаСтся ΠΊ бСсконСчности, ΠΎΡ†Π΅Π½ΠΊΠ° максимального правдоподобия сходится ΠΊ истинному Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°.

Π­Ρ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ. Бпособ измСрСния Ρ‚ΠΎΠ³ΠΎ, насколько ΠΌΡ‹ Π±Π»ΠΈΠ·ΠΊΠΈ ΠΊ истинному ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρƒ, – это оТидаСмая срСдняя квадратичная ошибка, вычислСниС ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΈΡ‡Π½ΠΎΠΉ Ρ€Π°Π·Π½ΠΈΡ†Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ†Π΅Π½ΠΎΡ‡Π½Ρ‹ΠΌΠΈ ΠΈ истинными значСниями ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π³Π΄Π΅ матСматичСскоС ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅ вычисляСтся Π½Π°Π΄ m ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌΠΈ ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ…, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… распрСдСлСниС. Π­Ρ‚Π° парамСтричСская срСднСквадратичная ошибка ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ с ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ m, ΠΈ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… m ниТняя Π³Ρ€Π°Π½ΠΈΡ†Π° нСравСнства ΠšΡ€Π°ΠΌΠ΅Ρ€Π°-Π Π°ΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π½ΠΈ Ρƒ ΠΎΠ΄Π½ΠΎΠΉ сходящСйся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ Π½Π΅Ρ‚ срСднСквадратичной ошибки мСньшС, Ρ‡Π΅ΠΌ Ρƒ ΠΎΡ†Π΅Π½ΠΊΠΈ максимального правдоподобия.

ИмСнно ΠΏΠΎ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π΅ сходимости ΠΈ эффСктивности, ΠΎΡ†Π΅Π½ΠΊΠ° максимального правдоподобия часто считаСтся ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΎΡ†Π΅Π½Ρ‰ΠΈΠΊΠΎΠΌ для машинного обучСния.

Когда количСство ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² достаточно ΠΌΠ°Π»ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ привСсти ΠΊ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ, стратСгии рСгуляризации, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ ΠΏΠΎΠ½ΠΈΠΆΠ°ΡŽΡ‰ΠΈΠ΅ вСса, ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для получСния смСщСнной вСрсии ΠΎΡ†Π΅Π½ΠΊΠΈ максимального правдоподобия, которая ΠΈΠΌΠ΅Π΅Ρ‚ ΠΌΠ΅Π½ΡŒΡˆΡƒΡŽ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ, ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½Ρ‹Π΅ обучСния ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹.

Максимальная апостСриорная (MAP) ΠΎΡ†Π΅Π½ΠΊΠ°

Богласно байСсовскому ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρƒ, ΠΌΠΎΠΆΠ½ΠΎ ΡƒΡ‡Π΅ΡΡ‚ΡŒ влияниС ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Π²Ρ‹Π±ΠΎΡ€ Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ. MAP ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для получСния Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ нСнаблюдаСмой Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ Π½Π° основС эмпиричСских Π΄Π°Π½Π½Ρ‹Ρ…. ΠžΡ†Π΅Π½ΠΊΠ° MAP Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚ Ρ‚ΠΎΡ‡ΠΊΡƒ максимальной апостСриорной вСроятности (ΠΈΠ»ΠΈ максимальной плотности вСроятности Π² Π±ΠΎΠ»Π΅Π΅ распространСнном случаС Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠ³ΠΎ ΞΈ):

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π³Π΄Π΅ с ΠΏΡ€Π°Π²ΠΎΠΉ стороны, log(p(x|ΞΈ)) – стандартный Ρ‡Π»Π΅Π½ логарифмичСской вСроятности ΠΈ log(p(ΞΈ)) соотвСтствуСт ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΌΡƒ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΡŽ.

Как ΠΈ ΠΏΡ€ΠΈ ΠΏΠΎΠ»Π½ΠΎΠΌ байСсовском ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅, байСсовский MAP ΠΈΠΌΠ΅Π΅Ρ‚ прСимущСство
использования ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π½Π΅Ρ‚ Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚Π° Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Π°Ρ информация ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ для Ρ‚ΠΎΡ‡Π΅Ρ‡Π½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ MAP (ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ MLE). Однако, это происходит Ρ†Π΅Π½ΠΎΠΉ ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½Π½ΠΎΠ³ΠΎ смСщСния.

Π€ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ

Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… сСтСй ошибка рассчитываСтся ΠΊΠ°ΠΊ Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ фактичСским Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ y ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Ε·. Ѐункция, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΠ°Ρ для вычислСния этой ошибки, извСстна ΠΊΠ°ΠΊ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, Ρ‚Π°ΠΊΠΆΠ΅ часто называСмая Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ошибки ΠΈΠ»ΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚.

Π”ΠΎ сих ΠΏΠΎΡ€ нашС основноС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΡƒΠ΄Π΅Π»ΡΠ»ΠΎΡΡŒ ΠΎΡ†Π΅Π½ΠΊΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ MLE ΠΈΠ»ΠΈ MAP. ΠŸΡ€ΠΈΡ‡ΠΈΠ½Π°, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΌΡ‹ обсуТдали это Ρ€Π°Π½ΡŒΡˆΠ΅, Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΈ MLE, ΠΈ MAP ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ для получСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

БрСдняя квадратичная ошибка (MSE): срСдняя квадратичная ошибка являСтся Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ распространСнной Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ MSE ΡˆΠΈΡ€ΠΎΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии Π² качСствС показатСля эффСктивности. Π§Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ MSE, Π½Π°Π΄ΠΎ Π²Π·ΡΡ‚ΡŒ Ρ€Π°Π·Π½ΠΈΡ†Ρƒ ΠΌΠ΅ΠΆΠ΄Ρƒ прСдсказанными значСниями ΠΈ истинными, возвСсти Π΅Π΅ Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ΠΈ ΡƒΡΡ€Π΅Π΄Π½ΠΈΡ‚ΡŒ ΠΏΠΎ всСму Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ….

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π³Π΄Π΅ y (i) – фактичСский ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, Π° Ε· (i) – ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· ΠΌΠΎΠ΄Π΅Π»ΠΈ.

МногиС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ (Π·Π°Ρ‚Ρ€Π°Ρ‚), ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ MSE, ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Ρ‹ ΠΈΠ· ΠΌΠ΅Ρ‚ΠΎΠ΄Π° максимального правдоподобия.

Π§Ρ‚ΠΎΠ±Ρ‹ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ, ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ вывСсти Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈΠ· MLE ΠΈΠ»ΠΈ MAP, трСбуСтся нСкоторая ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠ°. Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΡ€ΠΎΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Π΅Π΅ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΉΡ‚ΠΈ ΠΊ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌΡƒ Ρ€Π°Π·Π΄Π΅Π»Ρƒ.

ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ MSE ΠΈΠ· MLE

МоТно ΡΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ модСль Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ΠΌΡ‹ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ ΠΈΠΌΠ΅Π΅Ρ‚ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС с Ε· Π² качСствС срСднСго значСния распрСдСлСния ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ постоянной σ² Π² качСствС диспСрсии, Π²Ρ‹Π±Ρ€Π°Π½Π½ΠΎΠΉ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΌ. ΠΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСния ΡΠ²Π»ΡΡŽΡ‚ΡΡ Ρ€Π°Π·ΡƒΠΌΠ½Ρ‹ΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… случаях. Π’ отсутствиС ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊΠΎΠ΅ распрСдСлСниС Π² Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ соотвСтствуСт рассматриваСмым Π΄Π°Π½Π½Ρ‹ΠΌ, Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС являСтся Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ.

ВСрнСмся ΠΊ логарифмичСской вСроятности, ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ Ρ€Π°Π½Π΅Π΅:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π³Π΄Π΅ Ε·(i) – Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии Π½Π° i-ΠΌ Π²Ρ…ΠΎΠ΄Π΅, Π° m – количСство ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ². ΠœΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π΄Π²Π΅ ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ постоянными, поэтому максимизация логарифмичСской вСроятности сводится ΠΊ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ MSE:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, максимизация логарифмичСского правдоподобия ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΞΈ Π΄Π°Π΅Ρ‚ Ρ‚Π°ΠΊΡƒΡŽ ΠΆΠ΅ ΠΎΡ†Π΅Π½ΠΊΡƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΞΈ, Ρ‡Ρ‚ΠΎ ΠΈ минимизация срСднСквадратичной ошибки. Π”Π²Π° критСрия ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅ значСния, Π½ΠΎ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ΅ располоТСниС ΠΎΠΏΡ‚ΠΈΠΌΡƒΠΌΠ°. Π­Ρ‚ΠΎ ΠΎΠΏΡ€Π°Π²Π΄Ρ‹Π²Π°Π΅Ρ‚ использованиС MSE Π² качСствС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ максимального правдоподобия.

ΠšΡ€ΠΎΡΡ-энтропия (ΠΈΠ»ΠΈ логарифмичСская функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ – log loss): ΠšΡ€ΠΎΡΡ-энтропия измСряСт расхоТдСниС ΠΌΠ΅ΠΆΠ΄Ρƒ двумя вСроятностными распрСдСлСниями. Если кросс-энтропия Π²Π΅Π»ΠΈΠΊΠ°, это ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ двумя распрСдСлСниями Π²Π΅Π»ΠΈΠΊΠ°, Π° Ссли кросс-энтропия ΠΌΠ°Π»Π°, Ρ‚ΠΎ распрСдСлСния ΠΏΠΎΡ…ΠΎΠΆΠΈ Π΄Ρ€ΡƒΠ³ Π½Π° Π΄Ρ€ΡƒΠ³Π°.

ΠšΡ€ΠΎΡΡ-энтропия опрСдСляСтся ΠΊΠ°ΠΊ:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π³Π΄Π΅ P – распрСдСлСниС истинных ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ², Π° Q – распрСдСлСниС вСроятностСй ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ. МоТно ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ функция кросс-энтропии Ρ‚Π°ΠΊΠΆΠ΅ получаСтся ΠΈΠ· MLE, Π½ΠΎ я Π½Π΅ Π±ΡƒΠ΄Ρƒ ΡƒΡ‚ΠΎΠΌΠ»ΡΡ‚ΡŒ вас большим количСством ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ.

Π”Π°Π²Π°ΠΉΡ‚Π΅ Π΅Ρ‰Π΅ упростим это для нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ с:
β€’ N – количСство наблюдСний
β€’ M – количСство Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠΊ класса (собака, кошка, Ρ€Ρ‹Π±Π°)
β€’ y – Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΉ ΠΈΠ½Π΄ΠΈΠΊΠ°Ρ‚ΠΎΡ€ (0 ΠΈΠ»ΠΈ 1) Ρ‚ΠΎΠ³ΠΎ, являСтся Π»ΠΈ ΠΌΠ΅Ρ‚ΠΊΠ° класса C ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ классификациСй для наблюдСния O
β€’ p – прогнозируСмая Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ

Бинарная классификация

Π’ случаС Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации (M=2), Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° ΠΈΠΌΠ΅Π΅Ρ‚ Π²ΠΈΠ΄:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ΠŸΡ€ΠΈ Π΄Π²ΠΎΠΈΡ‡Π½ΠΎΠΉ классификации каТдая прСдсказанная Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ сравниваСтся с фактичСским Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ класса (0 ΠΈΠ»ΠΈ 1), ΠΈ вычисляСтся ΠΎΡ†Π΅Π½ΠΊΠ°, которая ΡˆΡ‚Ρ€Π°Ρ„ΡƒΠ΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Π½Π° основС расстояния ΠΎΡ‚ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΠΎΠ³ΠΎ значСния.

Визуализация

На ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π½ΠΈΠΆΠ΅ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Π½ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ с ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ истинного наблюдСния (y = 1). Когда прогнозируСмая Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ приблиТаСтся ΠΊ 1, логистичСская функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ. Однако ΠΏΡ€ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ вСроятности ΠΎΠ½Π° быстро возрастаСт.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ЛогистичСская функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π½Π°ΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΎΠ±Π° Ρ‚ΠΈΠΏΠ° ошибок, Π½ΠΎ особСнно Ρ‚Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ достовСрными ΠΈ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½Ρ‹ΠΌΠΈ!

ΠœΡƒΠ»ΡŒΡ‚ΠΈ-классовая классификация

Π’ случаС ΠΌΡƒΠ»ΡŒΡ‚ΠΈ-классовой классификации (M>2) ΠΌΡ‹ Π±Π΅Ρ€Π΅ΠΌ сумму Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ логарифмичСских Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° Π½Π°Π±Π»ΡŽΠ΄Π°Π΅ΠΌΡ‹Ρ… классов.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

ΠšΡ€ΠΎΡΡ-энтропия для Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ ΠΈΠ»ΠΈ Π΄Π²ΡƒΡ…-классовой Π·Π°Π΄Π°Ρ‡ΠΈ прогнозирования фактичСски рассчитываСтся ΠΊΠ°ΠΊ срСдняя кросс-энтропия срСди всСх ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ². Log loss ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ значСния Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌΠ°, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±Π΅ΡΠΏΠ΅Ρ‡ΠΈΡ‚ΡŒ ΡƒΠ΄ΠΎΠ±Π½ΡƒΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ для сравнСния. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ основан Π½Π° Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌ чисСл функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π—Π°Π΄Π°Ρ‡Π° Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации

Π—Π°Π΄Π°Ρ‡Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠ°ΠΊ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΠΉ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Π΄Π²ΡƒΡ… классов. Или Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎ, Π·Π°Π΄Π°Ρ‡Π° сформулирована ΠΊΠ°ΠΊ прСдсказаниС вСроятности Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ ΠΏΠ΅Ρ€Π²ΠΎΠΌΡƒ классу, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, классу, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ Π²Ρ‹ присваиваСтС цСлочислСнноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 1, Ρ‚ΠΎΠ³Π΄Π° ΠΊΠ°ΠΊ Π΄Ρ€ΡƒΠ³ΠΎΠΌΡƒ классу присваиваСтся Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 0.

β€’ ΠšΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ уровня: ΠΎΠ΄ΠΈΠ½ ΡƒΠ·Π΅Π» с сигмовидной Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ.
β€’ Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ: кросс-энтропия, Ρ‚Π°ΠΊΠΆΠ΅ называСмая логарифмичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π—Π°Π΄Π°Ρ‡Π° ΠΌΡƒΠ»ΡŒΡ‚ΠΈ-классовой классификации

Π­Ρ‚Π° Π·Π°Π΄Π°Ρ‡Π° состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠ°ΠΊ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΠΉ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… классов. Π—Π°Π΄Π°Ρ‡Π° сформулирована ΠΊΠ°ΠΊ прСдсказаниС вСроятности Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ классу.

β€’ ΠšΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ уровня: ΠΎΠ΄ΠΈΠ½ ΡƒΠ·Π΅Π» для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‰ΠΈΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ softmax.
β€’ Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ: кросс-энтропия, Ρ‚Π°ΠΊΠΆΠ΅ называСмая логарифмичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

РассмотрСв ΠΎΡ†Π΅Π½ΠΊΡƒ ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅ΠΌ ΠΊ Ρ€ΠΎΠ»ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΎΠ² Π² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… ML.

ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹

Π§Ρ‚ΠΎΠ±Ρ‹ свСсти ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡƒ ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΈΠ»ΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŽ Π² ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ, модСль, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΈΠ· ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, обновляСт ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ W. РасчСты ошибок строятся Π² зависимости ΠΎΡ‚ W ΠΈ Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ΡΡ Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚ J(w), ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½Π° опрСдСляСт Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹/Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, минимизация ошибки Ρ‚Π°ΠΊΠΆΠ΅ часто называСтся ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚.

Но ΠΊΠ°ΠΊ ΠΈΠΌΠ΅Π½Π½ΠΎ это дСлаСтся? Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹.

ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для обновлСния вСсов ΠΈ смСщСний, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΡ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ.

Π‘Π°ΠΌΡ‹ΠΌ Π²Π°ΠΆΠ½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ ΠΈ основой Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΎΠ±ΡƒΡ‡Π°Π΅ΠΌ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ Π½Π°ΡˆΡƒ модСль, являСтся ΠΌΠ΅Ρ‚ΠΎΠ΄ Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ Бпуска.

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ Бпуск

Когда ΠΌΡ‹ строим Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π·Π°Ρ‚Ρ€Π°Ρ‚ J(w), это ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Как Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· ΠΊΡ€ΠΈΠ²ΠΎΠΉ, сущСствуСт Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² W, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΈΠΌΠ΅Π΅Ρ‚ минимальноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Jmin. Нам Π½ΡƒΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ способ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ этого минимального значСния.

Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска ΠΌΡ‹ Π½Π°Ρ‡ΠΈΠ½Π°Π΅ΠΌ со случайных ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ вычисляСм ΠΎΡˆΠΈΠ±ΠΊΡƒ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ обучСния, продолТая ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚ΡŒΡΡ ΠΊ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ значСниям.

ΠŸΠΎΠ²Ρ‚ΠΎΡ€ΡΠ΅ΠΌ Π΄ΠΎ достиТСния ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ°:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π’ ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΌ Π²Ρ‹ΡˆΠ΅ ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠΈ ΠΌΡ‹ обновляСм ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ послС ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. Π’Ρ‚ΠΎΡ€ΠΎΠΉ Ρ‡Π»Π΅Π½ уравнСния вычисляСт Π½Π°ΠΊΠ»ΠΎΠ½ ΠΈΠ»ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ ΠΊΡ€ΠΈΠ²ΠΎΠΉ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ.

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚ вычисляСтся ΠΊΠ°ΠΊ частная производная Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π·Π°Ρ‚Ρ€Π°Ρ‚ J ΠΏΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρƒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Wj, Π³Π΄Π΅ j ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ числа ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² [1, n]. Ξ± – Π°Π»ΡŒΡ„Π°, это ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠΉ ΠΊΠ°ΠΊ быстро ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Π΄Π²ΠΈΠ³Π°Ρ‚ΡŒΡΡ ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡƒ. Если Ξ± слишком Π²Π΅Π»ΠΈΠΊΠΎ, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΎΡΠΊΠΎΡ‡ΠΈΡ‚ΡŒ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ. Если Ξ± слишком ΠΌΠ°Π»ΠΎ, это ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Ρ‚ ΠΊ нСбольшим этапам обучСния, поэтому ΠΎΠ±Ρ‰Π΅Π΅ врСмя, Π·Π°Ρ‚Ρ€Π°Ρ‡ΠΈΠ²Π°Π΅ΠΌΠΎΠ΅ модСлью для достиТСния ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ°, Π±ΡƒΠ΄Π΅Ρ‚ большС.

Π•ΡΡ‚ΡŒ Ρ‚Ρ€ΠΈ способа ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск:

ΠŸΠ°ΠΊΠ΅Ρ‚Π½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск: ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ всС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ для обновлСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ.

Мини-ΠΏΠ°ΠΊΠ΅Ρ‚Π½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск: вмСсто использования всСх Π΄Π°Π½Π½Ρ‹Ρ…, ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск Π΄Π΅Π»ΠΈΡ‚ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π½Π° мСньший Ρ€Π°Π·ΠΌΠ΅Ρ€, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ ΠΏΠ°Ρ€Ρ‚ΠΈΠ΅ΠΉ, ΠΈ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°Π΅ΠΌΡ‹ΠΉ Π±ΡƒΠΊΠ²ΠΎΠΉ Β«bΒ». Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚ Β«bΒ» ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для обновлСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ.

Π’ΠΎΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Π΅ ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹:

БтохастичСский Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ Бпуск (SGD): обновляСт ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΈ. Π’Π°ΠΊΠΎΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ выбираСтся случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ. БтохастичСский Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск часто ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡Ρ‚ΠΈΡ‚Π΅Π»Π΅Π½ для ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π·Π°Ρ‚Ρ€Π°Ρ‚, ΠΊΠΎΠ³Π΄Π° Π΅ΡΡ‚ΡŒ сотни тысяч ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½ Π±ΡƒΠ΄Π΅Ρ‚ ΡΡ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ быстрСС, Ρ‡Π΅ΠΌ ΠΏΠ°ΠΊΠ΅Ρ‚Π½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск.

Адаград

Адаград Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΡƒΠ΅Ρ‚ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎ ΠΊ ΠΈΠ½Π΄ΠΈΠ²ΠΈΠ΄ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΌ особСнностям: это ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ вСса Π² вашСм Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… Π±ΡƒΠ΄ΡƒΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΈΡ…. Π­Ρ‚ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ для Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½Ρ‹Ρ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Π³Π΄Π΅ ΠΏΡ€ΠΎΠΏΡƒΡ‰Π΅Π½ΠΎ ΠΌΠ½ΠΎΠ³ΠΎ Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ. Однако, Ρƒ Адаграда Π΅ΡΡ‚ΡŒ ΠΎΠ΄Π½Π° ΡΠ΅Ρ€ΡŒΠ΅Π·Π½Π°Ρ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°: адаптивная ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния со Π²Ρ€Π΅ΠΌΠ΅Π½Π΅ΠΌ становится ΠΎΡ‡Π΅Π½ΡŒ малСнькой.

НСкоторыС Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹, описанныС Π½ΠΈΠΆΠ΅, ΠΏΡ‹Ρ‚Π°ΡŽΡ‚ΡΡ ΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒΡΡ с этой ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ.

RMSprop

RMSprop – это ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ вСрсия Adagrad, разработанная профСссором Π”ΠΆΠ΅Ρ„Ρ„Ρ€ΠΈ Π₯ΠΈΠ½Ρ‚ΠΎΠ½ΠΎΠΌ Π² Π΅Π³ΠΎ классС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй. ВмСсто Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ всС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹, ΠΎΠ½ вычисляСт Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² фиксированном ΠΎΠΊΠ½Π΅. RMSprop ΠΏΠΎΡ…ΠΎΠΆ Π½Π° Adaprop, это Π΅Ρ‰Π΅ ΠΎΠ΄ΠΈΠ½ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ пытаСтся Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Адаград оставляСт ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌΠΈ.

Адам ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ ΠΌΠΎΠΌΠ΅Π½Ρ‚Π° ΠΈ являСтся Π΅Ρ‰Π΅ ΠΎΠ΄Π½ΠΈΠΌ способом использования ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² для вычислСния Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΡ… Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ². Адам Ρ‚Π°ΠΊΠΆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ ΠΈΠΌΠΏΡƒΠ»ΡŒΡΠ°, добавляя Π΄ΠΎΠ»ΠΈ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΊ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΌΡƒ. Π­Ρ‚ΠΎΡ‚ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» довольно ΡˆΠΈΡ€ΠΎΠΊΠΎΠ΅ распространСниС ΠΈ практичСски принят для использования Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтях.

Π’Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡Ρ‚ΠΎ ознакомились с ΠΊΡ€Π°Ρ‚ΠΊΠΈΠΌ ΠΎΠ±Π·ΠΎΡ€ΠΎΠΌ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΎΠ². Π‘ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ ΠΎΠ± этом ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ здСсь.

Π― надСюсь, Ρ‡Ρ‚ΠΎ послС прочтСния этой ΡΡ‚Π°Ρ‚ΡŒΠΈ, Π²Ρ‹ Π±ΡƒΠ΄Π΅Ρ‚Π΅ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ‡Ρ‚ΠΎ происходит, ΠΊΠΎΠ³Π΄Π° Π’Ρ‹ ΠΏΠΈΡˆΠΈΡ‚Π΅ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ ΠΊΠΎΠ΄:

Бпасибо Π·Π° проявлСнный интСрСс!

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Руководство Ρ…Π°ΠΊΠ΅Ρ€Π° ΠΏΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹ΠΌ сСтям. Π“Π»Π°Π²Π° 2: МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΎΠ»Π΅Π΅ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄: Π€ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ

ΠœΡ‹ ΠΏΡƒΠ±Π»ΠΈΠΊΡƒΠ΅ΠΌ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ послСднСй ΠΈΠ· ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… частСй Β«ΠΊΠ½ΠΈΠ³ΠΈΒ». ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΡƒΠ΄Π΅ΠΌ ΡΠ»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° Π±Π»ΠΎΠ³ΠΎΠΌ Π°Π²Ρ‚ΠΎΡ€Π° ΠΈ ΠΏΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΠΌ ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ этого ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»Π°, ΠΊΠ°ΠΊ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ½ΠΈ появятся.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅ΠΌ основы Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ эти схСмы Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, Π΄Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌ Π±ΠΎΠ»Π΅Π΅ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²Ρ‹ навСрняка ΡƒΠΆΠ΅ Π²ΠΈΠ΄Π΅Π»ΠΈ Π³Π΄Π΅-Π½ΠΈΠ±ΡƒΠ΄ΡŒ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π΅ ΠΈ Π² Π΄Ρ€ΡƒΠ³ΠΈΡ… ΡƒΡ€ΠΎΠΊΠ°Ρ… ΠΈ ΠΊΠ½ΠΈΠ³Π°Ρ…. Π’Ρ‹ вряд Π»ΠΈ встрСтитС, Ρ‡Ρ‚ΠΎΠ±Ρ‹ люди слишком ΠΌΠ½ΠΎΠ³ΠΎ рассказывали ΠΎ характСристиках силы. ВмСсто этого Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ обучСния ΠΌΠ°ΡˆΠΈΠ½Ρ‹ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ (ΠΈΠ»ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π·Π°Ρ‚Ρ€Π°Ρ‚, ΠΈΠ»ΠΈ Ρ†Π΅Π»Π΅ΠΉ).

По ΠΌΠ΅Ρ€Π΅ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ я ΡΠΎΡΡ‚Π°Π²Π»ΡΡŽ эти матСматичСскиС Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρ‹, я Π±Ρ‹ Ρ…ΠΎΡ‚Π΅Π» Π½Π°Ρ‡Π°Ρ‚ΡŒ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒΡΡ Π±ΠΎΠ»Π΅Π΅ Π²Π½ΠΈΠΌΠ°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊ Ρ‚ΠΎΠΌΡƒ, ΠΊΠ°ΠΊ ΠΌΡ‹ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌ наши ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹. Π― Π±Ρ‹ Ρ…ΠΎΡ‚Π΅Π», Ρ‡Ρ‚ΠΎΠ±Ρ‹ эти уравнСния выглядСли Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ Π²Ρ‹ ΠΌΠΎΠ³Π»ΠΈ Π²ΠΈΠ΄Π΅Ρ‚ΡŒ ΠΈΡ… Π² ΠΊΠ½ΠΈΠ³Π°Ρ… ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΡƒΡ€ΠΎΠΊΠ°Ρ…, поэтому я Π½Π°Ρ‡Π½Ρƒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ стандартныС наимСнования.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€: 2-ΠΌΠ΅Ρ€Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²

Π”Π°Π²Π°ΠΉΡ‚Π΅ Π½Π°Ρ‡Π½Π΅ΠΌ с ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Π΄Π²ΡƒΡ…ΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ SVM. Нам Π΄Π°Π½ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, состоящий ΠΈΠ· N ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² (xi0,xi1) ΠΈ ΠΈΡ… ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΊΠΈ yi, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ значСния +1/βˆ’1 для ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² соотвСтствСнно. Π’Π°ΠΆΠ½Π΅ΠΉ всСго Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ, ΠΊΠ°ΠΊ Π²Ρ‹ ΠΏΠΎΠΌΠ½ΠΈΡ‚Π΅, Ρƒ нас Π΅ΡΡ‚ΡŒ Ρ‚Ρ€ΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° (w0,w1,w2). Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ SVM Π² Ρ‚Π°ΠΊΠΎΠΌ случаС опрСдСляСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ это Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ всСгда ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅, Π²Π²ΠΈΠ΄Ρƒ опрСдСлСния ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ значСния ΠΎΡ‚ нуля Π² ΠΏΠ΅Ρ€Π²ΠΎΠΌ Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ ΠΈ Π²ΠΎΠ·Π²Π΅Π΄Π΅Π½ΠΈΠΈ Π² ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ΠΏΡ€ΠΈ рСгуляризации. Бмысл Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ это Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π»ΠΎ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ мСньшСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅. ΠŸΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΌΡ‹ возьмСмся Π·Π° Π΅Π³ΠΎ тонкости, Π΄Π°Π²Π°ΠΉΡ‚Π΅ сначала прСдставим Π΅Π³ΠΎ Π² Π²ΠΈΠ΄Π΅ ΠΊΠΎΠ΄Π°:

ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ это Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅: ΠΎΠ½ΠΎ измСряСт, насколько ΠΏΠ»ΠΎΡ… наш классификатор SVM. Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим это Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ:

Ѐункция Π·Π°Ρ‚Ρ€Π°Ρ‚ – это Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ измСряСт насколько ΠΏΠ»ΠΎΡ…ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ваш классификатор. Если Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… обучСния классифицируСтся идСально, Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ (Π·Π° ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ΠΌ рСгуляризации) Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π°Π²Π½Ρ‹ Π½ΡƒΠ»ΡŽ.
ΠžΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ послСдним элСмСнтом ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ рСгуляризации, Ρ‡Ρ‚ΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ нашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ нСбольшиС значСния. Π’Π²ΠΈΠ΄Ρƒ этого элСмСнта, Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ фактичСски Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ (Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ это Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠ·Π½Π°Ρ‡Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ всС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π·Π° ΠΈΡΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ΠΌ систСматичСской ошибки, фактичСски Ρ€Π°Π²Π½Ρ‹ Π½ΡƒΠ»ΡŽ), Π½ΠΎ Ρ‡Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ ΠΌΡ‹ подбСрСмся, Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ наш классификатор.

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π·Π°Ρ‚Ρ€Π°Ρ‚ Π² ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠ°ΡˆΠΈΠ½Ρ‹ состоят ΠΈΠ· Π΄Π²ΡƒΡ… частСй:

1. Π§Π°ΡΡ‚ΡŒ, которая измСряСт, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ модСль соотвСтствуСт Π΄Π°Π½Π½Ρ‹ΠΌ, ΠΈ 2: РСгуляризация, которая измСряСт ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏ Ρ‚ΠΎΠ³ΠΎ, насколько слоТной ΠΈΠ»ΠΈ ΡƒΠ΄ΠΎΠ±Π½ΠΎΠΉ являСтся модСль.

НадСюсь, я ΡƒΠ±Π΅Π΄ΠΈΠ» вас Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ SVM, Π½Π°ΠΌ, Π½Π° самом Π΄Π΅Π»Π΅, Π½ΡƒΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ Π±Ρ‹Π»ΠΈ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ мСньшС. Π—Π²ΡƒΡ‡ΠΈΡ‚ Π·Π½Π°ΠΊΠΎΠΌΠΎ? ΠœΡ‹ Ρ‚ΠΎΡ‡Π½ΠΎ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°Ρ‚ΡŒ: функция Π·Π°Ρ‚Ρ€Π°Ρ‚, записанная Π²Ρ‹ΡˆΠ΅ – это наша схСма. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ всС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Ρ‡Π΅Ρ€Π΅Π· схСму, Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ всС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ схСма Π²Ρ‹Π΄Π°Π»Π° Π½Π°ΠΌ Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π·Π°Ρ‚Ρ€Π°Ρ‚ Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅ΠΌ. Π’ частности, ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚, послС Ρ‡Π΅Π³ΠΎ ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π² ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΎΡ‚ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° (Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π·Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ Π½ΠΈΠ·ΠΊΠΈΠΌΠΈ, Π° Π½Π΅ высокими).

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Бтэнфордский курс: лСкция 3. Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈ оптимизация

На ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΉ Π»Π΅ΠΊΡ†ΠΈΠΈ ΠΌΡ‹ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Π»ΠΈΡΡŒ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ классификация ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Π§Ρ‚ΠΎ ΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Β«ΠΏΠΎΡ‚Π΅Ρ€ΡΡ‚ΡŒΡΡΒ» Π² процСссС ΠΈ ΠΌΠΎΠΆΠ½ΠΎ Π»ΠΈ этого ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ? Из сСгодняшнСго ΡƒΡ€ΠΎΠΊΠ° Π²Ρ‹ ΡƒΠ·Π½Π°Π΅Ρ‚Π΅, ΠΊΠ°ΠΊ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ классификатора Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ ΠΈ эффСктивным с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ.

Π§Ρ‚ΠΎ Π΄Π΅Π»Π°Ρ‚ΡŒ, Ссли β€œcat” классифицируСтся ΠΊΠ°ΠΊ β€œdog”

Вспомним ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΌ классификаторС. ΠœΡ‹ выяснили, Ρ‡Ρ‚ΠΎ ΠΎΠ½ состоит ΠΈΠ· Π΄Π²ΡƒΡ… частСй: Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… X ΠΈ Π½Π°Π±ΠΎΡ€Π° вСсов W. Но ΠΌΡ‹ Π½Π΅ раскрыли Π³Π»Π°Π²Π½Ρ‹ΠΉ вопрос: ΠΊΠ°ΠΊ ΠΈΠΌΠ΅Π½Π½ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ значСния W, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ классификатор Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅ всСго?

Рассмотрим простой ΠΏΡ€ΠΈΠΌΠ΅Ρ€. ΠŸΡƒΡΡ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ состоят всСго ΠΈΠ· Ρ‚Ρ€Ρ‘Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ 10 исходных классов, Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ W Π²Ρ‹Π±Ρ€Π°Π½Ρ‹ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½ΠΎ. Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π·Π°ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ· ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΎΡ†Π΅Π½ΠΎΠΊ сильно Π²Ρ‹ΡˆΠ΅ ΠΈΠ»ΠΈ Π½ΠΈΠΆΠ΅, Ρ‡Π΅ΠΌ Π΄Ρ€ΡƒΠ³ΠΈΠ΅:

НапримСр, ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ с кошкой ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎ ΠΎΡ†Π΅Π½ΠΊΡƒ 2.9 для ΠΌΠ΅Ρ‚ΠΊΠΈ β€œcat” ΠΈ 8.02 для ΠΌΠ΅Ρ‚ΠΊΠΈ β€œdog”. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° с Π»ΡΠ³ΡƒΡˆΠΊΠΎΠΉ ΠΈ вовсС ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»Π° ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ для своСго класса. А Ρ„ΠΎΡ‚ΠΎ с Π°Π²Ρ‚ΠΎΠΌΠΎΠ±ΠΈΠ»Π΅ΠΌ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ достигаСт Π½Π°ΠΈΠ²Ρ‹ΡΡˆΠ΅ΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ для ΠΌΠ΅Ρ‚ΠΊΠΈ β€œautomobile”. Π­Ρ‚ΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ наш классификатор Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ.

Π§Ρ‚ΠΎΠ±Ρ‹ автоматичСски ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊΠΈΠ΅ значСния W Π±ΡƒΠ΄ΡƒΡ‚ Π»ΡƒΡ‡ΡˆΠΈΠΌΠΈ, Π½Π°ΠΌ Π½ΡƒΠΆΠ΅Π½ ΠΊΠ°ΠΊΠΎΠΉ-Ρ‚ΠΎ способ количСствСнной ΠΎΡ†Π΅Π½ΠΊΠΈ «нСпригодности» для любого W. И этим способом Π±ΡƒΠ΄Π΅Ρ‚ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ функция, которая ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄ значСния W ΠΈ опрСдСляСт, насколько ΠΏΠ»ΠΎΡ…ΠΎ ΠΎΠ½ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚. Π’ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΎΠ½Π° называСтся Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ (loss function).

ΠœΡ‹ рассмотрим нСсколько ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Если функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π²Ρ‹Π΄Π°Ρ‘Ρ‚ слишком большиС числа β€” Π·Π½Π°Ρ‡ΠΈΡ‚, Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΠ»ΠΎΡ…ΠΎ. Поиск ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… вСсов W, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… функция достигаСт ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ°, называСтся ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ.

Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. НСмного ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ

Упростим Π·Π°Π΄Π°Ρ‡Ρƒ ΠΈ ΠΈΠ· 10 классов оставим Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚Ρ€ΠΈ. Для Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠ³ΠΎ классификатора f(x,W) = Wx с ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½Ρ‹ΠΌΠΈ W ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅:

ΠžΡ†Π΅Π½ΠΊΠΈ снова Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅.

Π”Π°Π΄ΠΈΠΌ Π±ΠΎΠ»Π΅Π΅ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Π½Π°Π±ΠΎΡ€ ΠΈΠ· N Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… X ΠΈ y, Π³Π΄Π΅ X β€” исходныС изобраТСния (Π° Ρ‚ΠΎΡ‡Π½Π΅Π΅, значСния ΠΈΡ… пиксСлСй), Π° y β€” Ρ‚Π΅ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ (ΠΈΡ… Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΌΠ΅Ρ‚ΠΊΠΈ классов ΠΈΠ»ΠΈ Ρ†Π΅Π»Π΅Π²Ρ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅). Π’ процСссС классификации ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΎΡ‚ 1 Π΄ΠΎ 10 (ΠΈΠ»ΠΈ ΠΎΡ‚ 0 Π΄ΠΎ 9, Π² зависимости ΠΎΡ‚ языка программирования) для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ принадлСТности изобраТСния xi ΠΊ классу yi.

ΠžΠ±ΠΎΠ·Π½Π°Ρ‡ΠΈΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΊΠ°ΠΊ Li. Наш классификатор f Π±Π΅Ρ€Ρ‘Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ xi, Π²Π΅ΡΠΎΠ²ΡƒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ W ΠΈ Π΄Π΅Π»Π°Π΅Ρ‚ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· для класса yi. Ѐункция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Li ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, сравнивая ΠΈΡ… с Π·Π°Ρ€Π°Π½Π΅Π΅ извСстными истинными ΠΌΠ΅Ρ‚ΠΊΠ°ΠΌΠΈ. Π­Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ, насколько ΠΏΠ»ΠΎΡ…ΠΎ ΠΈΠ»ΠΈ Ρ…ΠΎΡ€ΠΎΡˆΠΎ выполняСтся ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· для Ρ‚Π΅ΠΊΡƒΡ‰Π΅Π³ΠΎ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° xi.

НаконСц, ΠΎΠ±Ρ‰ΠΈΠ΅ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ L ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ ΡΡ€Π΅Π΄Π½ΡŽΡŽ сумму ΠΏΠΎΡ‚Π΅Ρ€ΡŒ для всСх ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…:

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ

ΠŸΡ€ΠΈΠΌΠ΅Ρ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΏΠΎΠ΄ΠΎΠΉΠ΄Ρ‘Ρ‚ для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, β€” функция ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΊΠ»Π°ΡΡΠΎΠ²Ρ‹Ρ… ΠΏΠΎΡ‚Π΅Ρ€ΡŒ SVM (Support Vector Machine, ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²). РазбСрёмся, ΠΊΠ°ΠΊ ΠΎΠ½Π° Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚.

Π‘Π½ΠΎΠ²Π° Π²ΠΎΠ·ΡŒΠΌΡ‘ΠΌ наши ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ xi ΠΈ ΠΌΠ΅Ρ‚ΠΊΠΈ классов yi. ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΠΌ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ классификатора (ΠΎΡ†Π΅Π½ΠΊΠΈ) Π² Π²ΠΈΠ΄Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²: s = f(xi, W). Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° просуммируСм значСния ΠΎΡ†Π΅Π½ΠΎΠΊ всСх y, ΠΊΡ€ΠΎΠΌΠ΅ истинной ΠΌΠ΅Ρ‚ΠΊΠΈ yi. Π’ΠΎ Π΅ΡΡ‚ΡŒ, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ сумму Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ всСх Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ посчитаСм Ρ€Π°Π·Π½ΠΈΡ†Ρƒ ΠΌΠ΅ΠΆΠ΄Ρƒ Π»ΠΎΠΆΠ½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π°ΠΌΠΈ ΠΈ истинной ΠΎΡ†Π΅Π½ΠΊΠΎΠΉ: sj βˆ’ syi; jβ‰ yi. Если истинная ΠΎΡ†Π΅Π½ΠΊΠ° большС, Ρ‡Π΅ΠΌ сумма всСх Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ² плюс Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Β«Π·Π°Π·ΠΎΡ€Β» (установим Π΅Π³ΠΎ Ρ€Π°Π²Π½Ρ‹ΠΌ 1) β€” Π·Π½Π°Ρ‡ΠΈΡ‚, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Π±Π°Π»Π» для ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ прСвосходит Π»ΡŽΠ±ΡƒΡŽ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ. Π­Ρ‚ΠΎ ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ наша функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ.

Π’ символьном Π²ΠΈΠ΄Π΅ это выглядит Ρ‚Π°ΠΊ:

Π’ΠΎ ΠΆΠ΅ самоС ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π² Π²ΠΈΠ΄Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ максимума (вторая строка Π½Π° ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ΅ Π²Ρ‹ΡˆΠ΅). ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΠΌ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€ с нашими трСмя классами:

Π˜ΡΡ‚ΠΈΠ½Π½Π°Ρ ΠΌΠ΅Ρ‚ΠΊΠ° для изобраТСния β€” β€œcat”, Π΅Ρ‘ ΠΎΡ†Π΅Π½ΠΊΠ° β€” 3.2. ΠœΡ‹ Π²Ρ‹Ρ‡ΠΈΡ‚Π°Π΅ΠΌ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ ΠΈΠ· всСх Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ сравниваСм: Ссли Ρ€Π°Π·Π½ΠΎΡΡ‚ΡŒ большС нуля, Π·Π½Π°Ρ‡ΠΈΡ‚, ΠΌΠ΅Ρ‚ΠΊΠ° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎ ΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚, Ссли мСньшС β€” всё Ρ…ΠΎΡ€ΠΎΡˆΠΎ, ΠΏΠΎΡ‚Π΅Ρ€ΠΈ Π½ΡƒΠ»Π΅Π²Ρ‹Π΅. ПослС этого суммируСм Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. Для класса β€œcat” Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Ρ€Π°Π²Π½ΠΎ 2.9.

Π’ΠΎ ΠΆΠ΅ самоС для автомобиля:

функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это. Π€ΠΎΡ‚ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ это

Π’ этом случаС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ оказались Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ ΠΌΠ΅Ρ‚ΠΊΠ° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π° ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ. Но Π²ΠΎΡ‚ для Π»ΡΠ³ΡƒΡˆΠΊΠΈ всё совсСм ΠΏΠ»ΠΎΡ…ΠΎ:

Если ΠΌΡ‹ посчитаСм ΠΎΠ±Ρ‰ΠΈΠ΅ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΏΠΎ всСм классам, Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅:

ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» ΠΎΡ†Π΅Π½ΠΊΡƒ 5.27 β€” Π·Π½Π°Ρ‡ΠΈΡ‚, ΠΎΠ½ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π΅Π²Π°ΠΆΠ½ΠΎ. Из ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² ясно, Ρ‡Ρ‚ΠΎ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡΡ‚Ρ€Π΅ΠΌΠΈΡ‚ΡŒΡΡ ΠΊ Π½ΡƒΠ»ΡŽ.

Π Π°Π·ΠΌΠΈΠ½ΠΊΠ°: вопросы ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹

ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° нСсколько вопросов, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΌΠΎΠ³ΡƒΡ‚ Π²Π°ΠΌ ΠΈΠ½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΆΠ΅ Π΄Π΅Π»Π°ΡŽΡ‚ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ. Π‘Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π½ΠΈΡ‡Π΅Π³ΠΎ Π½Π΅ Π½Π°Π΄ΠΎ, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΏΠΎΠ΄ΡƒΠΌΠ°Ρ‚ΡŒ:

1. Π§Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Ρ‘Ρ‚, Ссли совсСм Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΎΡ†Π΅Π½ΠΊΠΈ классов для изобраТСния с машиной? (ΠžΡ‚Π²Π΅Ρ‚: Π½ΠΈΡ‡Π΅Π³ΠΎ, ΠΏΠΎΡ‚Π΅Ρ€ΠΈ останутся Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ.)

2. КакиС ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΈ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ SVM-ΠΏΠΎΡ‚Π΅Ρ€ΠΈ? (ΠžΡ‚Π²Π΅Ρ‚: 0 ΠΈ ∞. Π’Π΅Ρ€Ρ…Π½Π΅ΠΉ Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ для ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π½Π΅Ρ‚, Π° Π²ΠΎΡ‚ ниТняя ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π° Π½ΡƒΠ»Ρ‘ΠΌ.)

3. Если всС ΠΎΡ†Π΅Π½ΠΊΠΈ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ€Π°Π²Π½Ρ‹ Π½ΡƒΠ»ΡŽ ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ€Π°Π²Π½Ρ‹ ΠΌΠ΅ΠΆΠ΄Ρƒ собой, Ρ‡Π΅ΠΌΡƒ Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π°Π²Π½Ρ‹ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ? (ΠžΡ‚Π²Π΅Ρ‚: Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π° Π΅Π΄ΠΈΠ½ΠΈΡ†Ρƒ мСньшС, Ρ‡Π΅ΠΌ число классов. НС Π·Π°Π±ΡƒΠ΄ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΈΠΌΠΎ sj βˆ’ syi Π΅ΡΡ‚ΡŒ Π΅Ρ‰Ρ‘ + 1.)

4. Как измСнятся ΠΏΠΎΡ‚Π΅Ρ€ΠΈ, Ссли ΡΡƒΠΌΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ всС ΠΎΡ†Π΅Π½ΠΊΠΈ, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ ΠΈΡΡ‚ΠΈΠ½Π½ΡƒΡŽ ΠΌΠ΅Ρ‚ΠΊΡƒ yi? (ΠžΡ‚Π²Π΅Ρ‚: увСличатся Π½Π° Π΅Π΄ΠΈΠ½ΠΈΡ†Ρƒ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ syi βˆ’ syi + 1 = 1.)

5. Π§Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚, Ссли для ΠΎΠ±Ρ‰ΠΈΡ… ΠΏΠΎΡ‚Π΅Ρ€ΡŒ вмСсто суммы ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅? (ΠžΡ‚Π²Π΅Ρ‚: Π½ΠΈΡ‡Π΅Π³ΠΎ Π½Π΅ измСнится, ΠΏΠΎ сути эта Ρ„ΠΎΡ€ΠΌΡƒΠ»Π° β€” ΠΈ Π΅ΡΡ‚ΡŒ поиск срСднСго.)

ΠŸΠΈΡˆΠΈΡ‚Π΅ Π² коммСнтариях, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎΡΡŒ Π»ΠΈ Ρƒ вас ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° вопросы. Если Π²ΠΎΠ·Π½ΠΈΠΊΠ»ΠΈ затруднСния β€” ΡƒΠΊΠ°ΠΆΠΈΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π²Π°ΠΌ показалось нСпонятным, ΠΈ ΠΌΡ‹ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ всё Ρ€Π°Π·ΡŠΡΡΠ½ΠΈΠΌ.

Для наглядности β€” ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π° Π½Π° Python, ΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΉ Ρ€Π°Π±ΠΎΡ‚Ρƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ:

Как Π²ΠΈΠ΄ΠΈΡ‚Π΅, описанный Π²Ρ‹ΡˆΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ рСализуСтся Π² нСсколько строк. Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ, ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ эту Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ Π² Ρ†ΠΈΠΊΠ», подбирая ΠΈ отправляя Π² Π½Π΅Ρ‘ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ W.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π΅Ρ‰Ρ‘ ΠΎΠ΄ΠΈΠ½ вопрос β€” ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π²Π°ΠΌ ΠΏΠΎΠ²Π΅Π·Π»ΠΎ ΠΈ Π²Ρ‹ нашли вСса W, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΠΎΡ‚Π΅Ρ€ΠΈ оказались Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ. Π‘ΡƒΠ΄ΡƒΡ‚ Π»ΠΈ значСния W ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ?

ΠŸΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚ β€” Π½Π΅Ρ‚. НС Π·Π°Π±ΡƒΠ΄ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ W β€” это ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°, для ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΡ€Π°Π²ΠΈΠ»Π° Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ зависимости. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π²Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅ Π½ΡƒΠ»Π΅Π²Ρ‹Π΅ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΈ для 2W, ΠΈ для 4W, ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅.

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° пСрСобучСния

Основной Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π΄Π°Ρ‘Ρ‚ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ β€” ΠΎΡ†Π΅Π½ΠΊΠ° Ρ‚ΠΎΠ³ΠΎ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ классификатор Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. Но ΠΌΡ‹ ΠΏΠΎΠΌΠ½ΠΈΠΌ, Ρ‡Ρ‚ΠΎ главная Ρ†Π΅Π»ΡŒ машинного обучСния β€” Π·Π°ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΡΠΏΡ€Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉΡΡ с ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½Π½ΠΎ Π½Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° Π½ΠΎΠ²Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°Ρ…. Π­Ρ‚ΠΎ явлСниС называСтся Β«ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Β».

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΠΌ, Ρ‡Ρ‚ΠΎ наш датасСт состоит ΠΈΠ· Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ. Если ΠΌΡ‹ заставим Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ идСально ΠΏΠΎΠ΄ΡΡ‚Ρ€Π°ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΏΠΎΠ΄ ΠΊΠ°ΠΆΠ΄ΡƒΡŽ ΠΈΠ· Ρ‚ΠΎΡ‡Π΅ΠΊ с Π½ΡƒΠ»Π΅Π²Ρ‹ΠΌΠΈ потСрями, Ρ‚ΠΎ Π³Ρ€Π°Ρ„ΠΈΠΊ классификации прСвратится Π² ΠΈΠ·Π²ΠΈΠ»ΠΈΡΡ‚ΡƒΡŽ ΠΊΡ€ΠΈΠ²ΡƒΡŽ:

Но это ΠΏΠ»ΠΎΡ…ΠΎΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Π½Π°ΠΌ Π²Π°ΠΆΠ½Π° Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π½Π° тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅, Π° Π½Π΅ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ. Если ΠΌΡ‹ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ Ρ€Π°Π±ΠΎΡ‚Ρƒ Π½Π° Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… (ΠΎΡ‚ΠΌΠ΅Ρ‡Π΅Π½Ρ‹ Π·Π΅Π»Ρ‘Π½Ρ‹ΠΌΠΈ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π°ΠΌΠΈ Π½Π° рисункС Π½ΠΈΠΆΠ΅), Ρ‚ΠΎ синяя кривая станСт Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½ΠΎ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ:

Π‘ΠΊΠΎΡ€Π΅Π΅ всСго, классификатор Π΄ΠΎΠ»ΠΆΠ΅Π½ Π½Π°ΠΉΡ‚ΠΈ ΠΊΠ°ΠΊΡƒΡŽ-Ρ‚ΠΎ ΠΏΡ€ΡΠΌΡƒΡŽ линию, которая ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ соотвСтствовала Π±Ρ‹ ΠΈ Ρ‚Π΅ΠΌ, ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ:

Π’ этом Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° машинного обучСния. Для Π΅Ρ‘ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ рСгуляризации.

Π Π΅Π³ΡƒΠ»ΠΈΡ€ΡƒΠΉ ΠΈ властвуй

Π’Ρ‹ΡˆΠ΅ Π±Ρ‹Π»ΠΎ сказано, Ρ‡Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ мноТСство Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… вСсов W. Но ΠΊΠ°ΠΊ ΠΈΠΌΠ΅Π½Π½ΠΎ функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π΄ΠΎΠ»ΠΆΠ½Π° Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΈΠ· Π½ΠΈΡ… ΠΎΠ΄ΠΈΠ½?

Π‘ΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ для этого вводится ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ рСгуляризации β€” ΠΎΠ½ заставляСт модСль Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ вСса W, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π±ΡƒΠ΄Π΅Ρ‚ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ простым. ΠŸΠΎΠ½ΡΡ‚ΠΈΠ΅ простоты зависит ΠΎΡ‚ Π·Π°Π΄Π°Ρ‡ΠΈ, Ρ€Π΅ΡˆΠ°Π΅ΠΌΠΎΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ.

Π­Ρ‚Π° идСя относится ΠΊ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΡƒ Β«Π±Ρ€ΠΈΡ‚Π²Ρ‹ Оккама» β€” Ссли ваши наблюдСния ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡŠΡΡΠ½ΠΈΡ‚ΡŒ нСсколькими Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π°ΠΌΠΈ, слСдуСт Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΈΠ· Π½ΠΈΡ… ΡΠ°ΠΌΡƒΡŽ ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ. Π’ случаС классификации Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ простоС Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… β€” Π² ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Π²Ρ‹ΡˆΠ΅ это Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ прямая линия, Π° Π½Π΅ кривая.

Π˜Ρ‚Π°ΠΊ, наша функция Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ состоит ΠΈΠ· Π΄Π²ΡƒΡ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚: ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π½Π° ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… (суммы всСх Li) ΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ рСгуляризации R(W):

Π“ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ лямбда ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° Ρ‚ΠΎ, насколько сильно рСгуляризация Π±ΡƒΠ΄Π΅Ρ‚ Π²Π»ΠΈΡΡ‚ΡŒ Π½Π° модСль. ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°Ρ… ΠΌΡ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΠ»ΠΈ Π½Π° ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΉ Π»Π΅ΠΊΡ†ΠΈΠΈ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ посмотрим, ΠΊΠ°ΠΊΠΈΠ΅ Π±Ρ‹Π²Π°ΡŽΡ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ R(W) ΠΈ ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ рСгуляризации

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ довольно ΠΌΠ½ΠΎΠ³ΠΎ Π²ΠΈΠ΄ΠΎΠ² рСгуляризации, Π½ΠΎ ΠΌΡ‹ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ популярныС.

РСгуляризация L2

ΠŸΡ€ΠΈΠΌΠ΅Π½ΡΠ΅Ρ‚ΡΡ Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ довольно часто. Π­Ρ‚ΠΎ обычная Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° Π½ΠΎΡ€ΠΌΠ° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² W (ΠΈΠ½ΠΎΠ³Π΄Π° бСрётся ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ΠΈΠ»ΠΈ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π° Π½ΠΎΡ€ΠΌΡ‹). ИдСя Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹ просто добавляСтС Β«ΡˆΡ‚Ρ€Π°Ρ„Β» ΠΊ вСсам, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΡ… значСния Π½Π΅ оказались слишком большими. Ѐункция R(W) выглядит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

РСгуляризация L1

L1 ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠ°Π½Ρ…ΡΡ‚Ρ‚Π΅Π½ΡΠΊΡƒΡŽ Π½ΠΎΡ€ΠΌΡƒ W ΠΈ Ρ‚ΠΎΠΆΠ΅ добавляСт ΡˆΡ‚Ρ€Π°Ρ„ ΠΊ вСсовым коэффициСнтам. Π‘ рСгуляризациСй L1 ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π±ΡƒΠ΄Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ Ρ€Π°Π·Ρ€Π΅ΠΆΠ΅Π½Π½ΠΎΠΉ.

Эластичная ΡΠ΅Ρ‚ΡŒ

Π­Ρ‚ΠΎ комбинация рСгуляризаций L1 ΠΈ L2:

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π²ΠΈΠ΄Ρ‹ рСгуляризаций, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ максимум Π½ΠΎΡ€ΠΌΡ‹, Dropout, пакСтная нормализация ΠΈ стохастичСская Π³Π»ΡƒΠ±ΠΈΠ½Π°. Они ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π² Π±ΠΎΠ»Π΅Π΅ ΡƒΠ·ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ обучСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ рассмотрим Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… лСкциях.

Π‘ΠΎΠ»ΡŒΡˆΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ²

Если Π²Ρ‹ всё Ρ€Π°Π²Π½ΠΎ Π½Π΅ поняли, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ рСгуляризация, β€” Π½Π΅ Π²ΠΎΠ»Π½ΡƒΠΉΡ‚Π΅ΡΡŒ. БСйчас ΠΌΡ‹ объясним Π½Π° Π΅Ρ‰Ρ‘ Π±ΠΎΠ»Π΅Π΅ простом ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅.

Π’ΠΎΠ·ΡŒΠΌΡ‘ΠΌ ΠΏΡ€ΠΈΠΌΠΈΡ‚ΠΈΠ²Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… x, состоящий ΠΈΠ· Ρ‡Π΅Ρ‚Ρ‹Ρ€Ρ‘Ρ… Π΅Π΄ΠΈΠ½ΠΈΡ†. Π’Π°ΠΊΠΆΠ΅ создадим Π΄Π²Π° Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсов w1=[1,0,0,0] ΠΈ w2=[0.25, 0.25, 0.25, 0.25]. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΌΡ‹ рассматриваСм случай Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ классификации f(x,W) = Wx, Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅ΠΌ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ссли ΡƒΠΌΠ½ΠΎΠΆΠΈΡ‚ΡŒ любой ΠΈΠ· Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² w1 ΠΈΠ»ΠΈ w2 Π½Π° Π²Π΅ΠΊΡ‚ΠΎΡ€ x, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΉ:

Π’Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, вопрос: ΠΊΠ°ΠΊΠΎΠΉ ΠΈΠ· этих Π΄Π²ΡƒΡ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π΄ΠΎΠ»ΠΆΠ΅Π½ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ рСгуляризатор L2?

ΠžΡ‚Π²Π΅Ρ‚: Π²Π΅ΠΊΡ‚ΠΎΡ€ w2, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΠ½ ΠΈΠΌΠ΅Π΅Ρ‚ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΡƒΡŽ Π½ΠΎΡ€ΠΌΡƒ.

На ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ Π»Π΅ΠΊΡ†ΠΈΠΈ ΠΌΡ‹ ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ вСса W ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚, насколько ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΉ элСмСнт ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ соотвСтствуСт ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· классов. ЦСль рСгуляризации L2 β€” ΡƒΠ±Π΅Π΄ΠΈΡ‚ΡŒΡΡ, Ρ‡Ρ‚ΠΎ это ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ выполняСтся для всСх элСмСнтов. Π’ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Π²Ρ‹ΡˆΠ΅ значСния Π²Π΅ΠΊΡ‚ΠΎΡ€Π° x ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Π΅ ΠΈ явно Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒΡΡ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу, поэтому ΠΈ вСса для Π½ΠΈΡ… Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°Π²Π½Ρ‹.

ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ

Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Ρ‚ΠΎ значСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² W Π½Π°Π΄ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ с ΡƒΠΌΠΎΠΌ. Но ΠΌΡ‹ всё Π΅Ρ‰Ρ‘ Π½Π΅ нашли ΠΎΡ‚Π²Π΅Ρ‚ Π½Π° вопрос: «Как ΠΈΠΌΠ΅Π½Π½ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΈΡΠΊΠ°Ρ‚ΡŒ Ρ‚Π΅ самыС вСса W, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ?Β» Рассмотрим нСсколько ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ².

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π²Ρ‹ ΠΈΠ΄Ρ‘Ρ‚Π΅ ΠΏΠΎ большой Π΄ΠΎΠ»ΠΈΠ½Π΅ срСди Π³ΠΎΡ€, ΠΏΠΎΠ»Π΅ΠΉ ΠΈ Ρ€Π΅ΠΊ. И высота ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° этого Π»Π°Π½Π΄ΡˆΠ°Ρ„Ρ‚Π° соотвСтствуСт ΠΎΠ±ΡŠΡ‘ΠΌΡƒ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΏΡ€ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½ΠΎΠΉ настройкС W. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, Π²Π°ΠΌ ΠΊΠ°ΠΊΠΈΠΌ-Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π½ΡƒΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ ΡΠ°ΠΌΡƒΡŽ Π½ΠΈΠ·ΠΊΡƒΡŽ Ρ‚ΠΎΡ‡ΠΊΡƒ Π² Π΄ΠΎΠ»ΠΈΠ½Π΅.

К соТалСнию, Π½Π΅ сущСствуСт ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ‚Π΅Π»Π΅ΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ вас ΠΊ этой Ρ‚ΠΎΡ‡ΠΊΠ΅. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ процСсс ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ выглядит ΠΊΠ°ΠΊ Π½Π°Π±ΠΎΡ€ ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ, Π³Π΄Π΅ Π² качСствС Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ бСрётся случайноС Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π²Ρ‹ Π½Π°Ρ‡ΠΈΠ½Π°Π΅Ρ‚Π΅ постСпСнно ΡƒΠ»ΡƒΡ‡ΡˆΠ°Ρ‚ΡŒ.

БтратСгия 1. ΠŸΠ΅Ρ€Π²ΠΎΠ΅, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ Π² Π³ΠΎΠ»ΠΎΠ²Ρƒ β€” Ρ€Π°Π½Π΄ΠΎΠΌΠ½Ρ‹ΠΉ поиск. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ просто Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ случайныС значСния W ΠΈ ΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΎΠ½ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚. Π‘ΠΏΠΎΠΉΠ»Π΅Ρ€: это плохая идСя, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π½Π΅ стоит ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅.

НапримСр, для 10 классов датасСта CIFAR-10 Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π²Ρ‹ Π½Π°ΠΉΠ΄Ρ‘Ρ‚Π΅ подходящиС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ W, составит 10%. И это ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠ»ΠΎΡ…ΠΎΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ.

БтратСгия 2. ВСрнёмся ΠΊ нашСй Π΄ΠΎΠ»ΠΈΠ½Π΅. Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π²Ρ‹ Π½Π΅ Π²ΠΈΠ΄ΠΈΡ‚Π΅ прямого ΠΏΡƒΡ‚ΠΈ ΠΊ Π΅Ρ‘ самой Π½ΠΈΠ·ΠΊΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅, Π½ΠΎ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΎΡ†Π΅Π½ΠΈΡ‚ΡŒ Π³Π΅ΠΎΠΌΠ΅Ρ‚Ρ€ΠΈΡŽ Π»Π°Π½Π΄ΡˆΠ°Ρ„Ρ‚Π° ΠΈ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚ΡŒ, Π² ΠΊΠ°ΠΊΠΎΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ слСдуСт ΠΈΠ΄Ρ‚ΠΈ.

Бтоя Π½Π° склонС, Π²Ρ‹ Π½Π°Ρ‡Π½Ρ‘Ρ‚Π΅ ΠΈΡΠΊΠ°Ρ‚ΡŒ спуск.

Π’ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠ΅ Π°Π½Π°Π»ΠΎΠ³ΠΎΠΌ поиска спуска являСтся производная. Взяв ΠΎΠ΄Π½ΠΎΠΌΠ΅Ρ€Π½ΡƒΡŽ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ f(x) ΠΈ вычислив Π΅Ρ‘ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΡƒΡŽ Π² ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ Ρ‚ΠΎΡ‡ΠΊΠ΅, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, возрастаСт ΠΈΠ»ΠΈ ΡƒΠ±Ρ‹Π²Π°Π΅Ρ‚ функция Π² этой Ρ‚ΠΎΡ‡ΠΊΠ΅.

Но Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ x ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ являСтся Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ, поэтому ΠΎΠ±ΠΎΠ±Ρ‰Ρ‘Π½Π½Ρ‹ΠΌ Π°Π½Π°Π»ΠΎΠ³ΠΎΠΌ спуска Π±ΡƒΠ΄Π΅Ρ‚ Π²Π΅ΠΊΡ‚ΠΎΡ€ частных ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½Ρ‹Ρ… ΠΈΠ»ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚. Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ ΡƒΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ возрастания Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, поэтому для поиска Π΅Ρ‘ убывания ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚.

Π’ поисках Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°

Π˜Ρ‚Π°ΠΊ, Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ Ρƒ нас Π΅ΡΡ‚ΡŒ Π²Π΅ΠΊΡ‚ΠΎΡ€ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² W, ΠΈ наша Ρ†Π΅Π»ΡŒ β€” Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ Π²Π΅ΠΊΡ‚ΠΎΡ€ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π° 𝛁W. МоТно просто Π²Π·ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½Ρ‹Π΅ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ элСмСнта. Π’Π°ΠΊ ΠΌΡ‹ ΡƒΠ·Π½Π°Π΅ΠΌ, насколько измСнятся ΠΏΠΎΡ‚Π΅Ρ€ΠΈ, Ссли ΠΌΡ‹ пСрСмСстимся Π½Π° бСсконСчно ΠΌΠ°Π»ΡƒΡŽ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ h Π² ΠΎΠ΄Π½ΠΎΠΌ ΠΈΠ· Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΉ ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚. Π’Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ называСтся «числовой Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Β».

Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… случаСв эти расчёты Π±ΡƒΠ΄ΡƒΡ‚ слишком ΠΌΠ΅Π΄Π»Π΅Π½Π½Ρ‹ΠΌΠΈ. Π’Π΅Π΄ΡŒ Π² ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ½ΠΎΠ³Π΄Π° содСрТатся ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈΡ… ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π³ΠΎΡ€Π°Π·Π΄ΠΎ слоТнСС. Для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ сущСствуСт Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ «аналитичСский Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Β».

Если Π²Ρ‹ ΠΊΠΎΠ³Π΄Π°-Ρ‚ΠΎ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΠ»ΠΈ курс матСматичСского Π°Π½Π°Π»ΠΈΠ·Π°, Ρ‚ΠΎ Π·Π½Π°Π΅Ρ‚Π΅, Ρ‡Ρ‚ΠΎ благодаря этим Π΄Π²ΡƒΠΌ людям Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ просто Π·Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ магию Π΄ΠΈΡ„Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ исчислСния ΠΈ сразу ΠΆΠ΅ Π½Π°ΠΉΡ‚ΠΈ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚.

Исаак ΠΡŒΡŽΡ‚ΠΎΠ½ (слСва) ΠΈ Π“ΠΎΡ‚Ρ„Ρ€ΠΈΠ΄ Π’ΠΈΠ»ΡŒΠ³Π΅Π»ΡŒΠΌ Π›Π΅ΠΉΠ±Π½ΠΈΡ† (справа)

Π­Ρ‚ΠΎ становится Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ΠΌ благодаря аналитичСской ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΠΎΠΉ, которая Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ подстановки Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, Π° Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ сразу со всСй Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ. Π—Π΄Π΅ΡΡŒ стоит Π²ΡΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΠΎΠΉ Ρ‡Π΅Ρ€Π΅Π· ΠΏΡ€Π΅Π΄Π΅Π».

ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΠΎΠΉ Ρ‡Π΅Ρ€Π΅Π· ΠΏΡ€Π΅Π΄Π΅Π»

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ аналитичСским Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠΌ, Π½ΠΎ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ числового. Π­Ρ‚ΠΎ называСтся Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΎΠΉ.

Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π²Ρ‹ Π·Π½Π°Π΅Ρ‚Π΅, ΠΊΠ°ΠΊ вычисляСтся Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚. ΠžΡΡ‚Π°Π»ΠΎΡΡŒ совсСм Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ Ρ‚Π΅ΠΎΡ€ΠΈΠΈ: ΠΌΡ‹ ΠΏΠ»Π°Π²Π½ΠΎ подошли ΠΊ ΠΎΡ‡Π΅Π½ΡŒ простому Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π»Π΅ΠΆΠΈΡ‚ Π² основС обучСния Π΄Π°ΠΆΠ΅ самых Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΈ слоТных нСйросСтСй, β€” Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠΌΡƒ спуску.

Π‘Π½Π°Ρ‡Π°Π»Π° ΠΌΡ‹ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ W случайными значСниями, вычисляСм ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚, Π° Π·Π°Ρ‚Π΅ΠΌ обновляСм вСса Π² соотвСтствии с ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°.

step_size β€” это Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, Π·Π°Π΄Π°ΡŽΡ‰ΠΈΠΉ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ шага, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΡ‹ смСщаСмся ΠΏΡ€ΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Π½ΠΎΠ²ΠΎΠΌ вычислСнии Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°. Иногда Π΅Π³ΠΎ Ρ‚Π°ΠΊΠΆΠ΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ обучСния. И это ΠΎΠ΄Π½Π° ΠΈΠ· самых Π²Π°ΠΆΠ½Ρ‹Ρ… настроСк Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ.

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΠΌ, ΠΊΠ°ΠΊ это выглядит Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎ. На Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ Π½ΠΈΠΆΠ΅ большая разноцвСтная ΠΎΠ±Π»Π°ΡΡ‚ΡŒ β€” это наша функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Участок красного Ρ†Π²Π΅Ρ‚Π° β€” ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ значСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Π΄ΠΎΡΡ‚ΠΈΠ³Π½ΡƒΡ‚ΡŒ, Π° синий ΠΈ Π·Π΅Π»Ρ‘Π½Ρ‹ΠΉ ΠΎΠ·Π½Π°Ρ‡Π°ΡŽΡ‚ высокиС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ.

ΠœΡ‹ Π½Π°Ρ‡ΠΈΠ½Π°Π΅ΠΌ с исходного W Π² Ρ€Π°Π½Π΄ΠΎΠΌΠ½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠ΅ ΠΈ вычисляСм ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π΄ΠΎΠ»ΠΆΠ½ΠΎ шаг Π·Π° шагом привСсти нас ΠΊ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ потСрям.

Π­Ρ‚ΠΎ самый Ρ‚Ρ€ΠΈΠ²ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ пошагового Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ‡ΡƒΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ слоТныС ΠΏΡ€ΠΈΡ‘ΠΌΡ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΡ‹ рассмотрим Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… лСкциях.

БтохастичСский Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск

Когда Π²Ρ‹ вычисляСтС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ 𝛁W Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ шагС, Π²Π°ΠΌ приходится ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ всС ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ 𝛁W β€” это сумма ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ², Π²Ρ‹Π·Π²Π°Π½Π½Ρ‹Ρ… ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ элСмСнтом обучСния. Но ΠΈΡ… число ΠΌΠΎΠΆΠ΅Ρ‚ Π΄ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ΡŒ Π΄ΠΎ ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π°, ΠΈ Π² этом случаС ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹ΠΉ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ стохастичСский Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск.

Π•Π³ΠΎ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ шагС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡŽΡ‚ΡΡ Π½Π΅ ΠΏΠΎ всСму датасСту, Π° Π½Π° нСбольшом Π½Π°Π±ΠΎΡ€Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² β€” ΠΌΠΈΠ½ΠΈ-ΠΏΠ°ΠΊΠ΅Ρ‚Π΅ (Π° ΠΈΠ½ΠΎΠ³Π΄Π° всСго Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅). Π’ΠΎ Π΅ΡΡ‚ΡŒ, ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ W ΠΎΠ±Π½ΠΎΠ²Π»ΡΡŽΡ‚ΡΡ послС ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π° Π½Π΅ послС ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π° ΠΏΠΎ всСму датасСту. Π­Ρ‚ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ускоряСт процСсс ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, Π° Π² ΠΊΠΎΠ΄ добавляСтся всСго ΠΎΠ΄Π½Π° строчка:

Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск, Π² Π²Π΅Π±-дСмонстрации. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ ΠΏΠΎΠΌΠ΅Π½ΡΡ‚ΡŒ вСса, Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ шага ΠΈΠ»ΠΈ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Ρ‚ΠΎΡ‡Π΅ΠΊ ΠΈ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ, ΠΊΠ°ΠΊ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ΡŒ оптимизация.

НадССмся, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ³Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Π² настройку ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ классификации Π±Ρ‹Π»ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ, вСдь эти Π²Π΅Ρ‰ΠΈ Π² дальнСйшСм ΠΏΠΎΠΌΠΎΠ³ΡƒΡ‚ Π²Π°ΠΌ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ слоТныС нСйросСти. Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Ρ€Π°Π· ΠΌΡ‹ Π½Π°ΠΊΠΎΠ½Π΅Ρ†-Ρ‚ΠΎ познакомимся с основами нСйросСтСй ΠΈ ΠΏΠΎΠ³ΠΎΠ²ΠΎΡ€ΠΈΠΌ ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния ошибки.Π‘ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΉ Π»Π΅ΠΊΡ†ΠΈΠ΅ΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΡ‚ΡŒΡΡ Π½Π° YouTube.

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π»Π΅ΠΊΡ†ΠΈΠΈ (список Π±ΡƒΠ΄Π΅Ρ‚ Π΄ΠΎΠΏΠΎΠ»Π½ΡΡ‚ΡŒΡΡ ΠΏΠΎ ΠΌΠ΅Ρ€Π΅ появлСния ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ²):

Π‘ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΉ Π»Π΅ΠΊΡ†ΠΈΠ΅ΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΡ‚ΡŒΡΡ Π½Π° YouTube.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *