big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’ Ρ‡Π΅ΠΌ Ρ€Π°Π·Π½ΠΈΡ†Π° ΠΌΠ΅ΠΆΠ΄Ρƒ Π½Π°ΡƒΠΊΠΎΠΉ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…, Π°Π½Π°Π»ΠΈΠ·ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, большими Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΎΠΉ, Π΄Π°Ρ‚Π° ΠΌΠ°ΠΉΠ½ΠΈΠ½Π³ΠΎΠΌ ΠΈ ΠΌΠ°ΡˆΠΈΠ½Π½Ρ‹ΠΌ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ

Π’ послСднСС врСмя слово big data Π·Π²ΡƒΡ‡ΠΈΡ‚ ΠΎΡ‚ΠΎΠ²ΡΡŽΠ΄Ρƒ ΠΈ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ Ρ€ΠΎΠ΄Π΅ это понятиС стало мСйнстримом. Π‘ большими Π΄Π°Π½Π½Ρ‹ΠΌΠΈ тСсно связаны Ρ‚Π°ΠΊΠΈΠ΅ Ρ‚Π΅Ρ€ΠΌΠΈΠ½Ρ‹ ΠΊΠ°ΠΊ Π½Π°ΡƒΠΊΠ° ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… (data science), Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… (data analysis), Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… (data analytics), сбор Π΄Π°Π½Π½Ρ‹Ρ… (data mining) ΠΈ машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ (machine learning).

ΠŸΠΎΡ‡Π΅ΠΌΡƒ всС стали Ρ‚Π°ΠΊ ΠΏΠΎΠΌΠ΅ΡˆΠ°Π½Ρ‹ Π½Π° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ‡Ρ‚ΠΎ Π·Π½Π°Ρ‡Π°Ρ‚ всС эти слова?

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΠΎΡ‡Π΅ΠΌΡƒ всС молятся Π½Π° Π±ΠΈΠ³ Π΄Π°Ρ‚Ρƒ

Π§Π΅ΠΌ большС Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π΅ΠΌ слоТнСС с Π½ΠΈΠΌΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ. ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹Π΅ ΠΊ нСбольшим массивам Π΄Π°Π½Π½Ρ‹Ρ… скорСС всСго Π½Π΅ ΡΡ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΏΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π±ΠΈΠ³ Π΄Π°Ρ‚Ρ‹. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Π² Π½Π°ΡƒΠΊΠ΅ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… большиС Π΄Π°Π½Π½Ρ‹Π΅ Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ Π²Π°ΠΆΠ½ΠΎΠ΅ мСсто. Π§Π΅ΠΌ большС массив, Ρ‚Π΅ΠΌ интСрСснСй Π±ΡƒΠ΄ΡƒΡ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½Π½Ρ‹Π΅ ΠΈΠ· Π³Π»ΡƒΠ±ΠΎΠΊΠΈΡ… Π½Π΅Π΄Ρ€ большой ΠΊΡƒΡ‡ΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²Π° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…:

Наука ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…

Наука ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… это Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ познания ΠΎ Π²Ρ‹Π²ΠΎΠ΄ΠΈΠΌΡ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Π§Ρ‚ΠΎΠ±Ρ‹ Π·Π°Π½ΠΈΠΌΠ°Ρ‚ΡŒΡΡ Π½Π°ΡƒΠΊΠΎΠΉ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π·Π½Π°Ρ‚ΡŒ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΡƒ Π½Π° высоком ΡƒΡ€ΠΎΠ²Π½Π΅, алгоритмичСскиС Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ, бизнСс-Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΡƒ ΠΈ Π΄Π°ΠΆΠ΅ ΠΏΡΠΈΡ…ΠΎΠ»ΠΎΠ³ΠΈΡŽ. ВсС это Π½ΡƒΠΆΠ½ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠ΅Ρ€Π΅Π»ΠΎΠΏΠ°Ρ‚ΠΈΡ‚ΡŒ ΠΎΠ³Ρ€ΠΎΠΌΠ½ΡƒΡŽ ΠΊΡƒΡ‡Ρƒ ΠΈΠ½Ρ„Ρ‹ ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΉ инсайт ΠΈΠ»ΠΈ интСрСсныС закономСрности.

Наука ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… базируСтся Π²ΠΎΠΊΡ€ΡƒΠ³ строгих аналитичСских Π΄ΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΡΡ‚Π² ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ со структурированными ΠΈ Π½Π΅ структурированными Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Π’ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ΅ всС, Ρ‡Ρ‚ΠΎ связано с ΠΎΡ‚Π±ΠΎΡ€ΠΎΠΌ, ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΎΠΉ ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΎΠΌ, Π»Π΅ΠΆΠΈΡ‚ Π² ΠΏΡ€Π΅Π΄Π΅Π»Π°Ρ… Π½Π°ΡƒΠΊΠΈ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ….

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ примСнСния Π½Π°ΡƒΠΊΠΈ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…:

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Аналитика

Аналитика β€” это Π½Π°ΡƒΠΊΠ° ΠΎΠ± Π°Π½Π°Π»ΠΈΠ·Π΅, ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… для принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ.

Аналитика Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π° для внСдрСния инсайтов Π² массив Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ использованиС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… запросов ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€ объСдинСния Π΄Π°Π½Π½Ρ‹Ρ…. Она прСдставляСт Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ зависимости ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ. НапримСр, автоматичСски выявлСнныС, Π½Π΅ ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹Π΅ связи ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΠΎΠΊΡƒΠΏΠΊΠ°ΠΌΠΈ.

Π’ Π½Π°ΡƒΠΊΠ΅ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ… для построСния ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ сырыС Π΄Π°Π½Π½Ρ‹Π΅. Π’ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ΅ Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠΆΠ΅ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²Π»Π΅Π½Ρ‹, Π° ΠΎΡ‚Ρ‡Π΅Ρ‚Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ практичСски любой ΡŽΠ·Π΅Ρ€. Аналитику Π½Π΅ Π½ΡƒΠΆΠ½Ρ‹ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ знания Π²Ρ‹ΡΡˆΠ΅ΠΉ ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΈ, достаточно Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΎΠΏΠ΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ ΠΈ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΡƒΠ΄Π°Ρ‡Π½Ρ‹Π΅ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹.

Анализ Π΄Π°Π½Π½Ρ‹Ρ…

Анализ Π΄Π°Π½Π½Ρ‹Ρ… β€” это Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ спСциалиста, которая Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½Π° Π½Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΎ массивС Π΄Π°Π½Π½Ρ‹Ρ…. Аналитик ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ инструмСнты для Π°Π½Π°Π»ΠΈΠ·Π°, Π° ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΡƒΠΌΠΎΠ·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ полагаясь Π½Π° Π½Π°ΠΊΠΎΠΏΠ»Π΅Π½Π½Ρ‹ΠΉ ΠΎΠΏΡ‹Ρ‚. НапримСр, Ρ‚Ρ€Π΅ΠΉΠ΄Π΅Ρ€ Forex ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°Ρ‚ΡŒ ΠΈ Π·Π°ΠΊΡ€Ρ‹Π²Π°Ρ‚ΡŒ трСйдСрскиС ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ, ΠΎΡΠ½ΠΎΠ²Ρ‹Π²Π°ΡΡΡŒ Π½Π° простых Π½Π°Π±Π»ΡŽΠ΄Π΅Π½ΠΈΡΡ… ΠΈ ΠΈΠ½Ρ‚ΡƒΠΈΡ†ΠΈΠΈ.

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ тСсно связано с Π½Π°ΡƒΠΊΠΎΠΉ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° искусствСнного обучСния, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ для сбора Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…. По-простому это Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ систСму ΠΈΠ»ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ прСдставлСния ΠΈΠ· массива.

ΠŸΡ€ΠΈ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ для построСния ΠΌΠΎΠ΄Π΅Π»ΠΈ прогнозирования Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π½Π΅ΠΊΠΈΠΉ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π·Π½Π°Π½ΠΈΠΉ. МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠΎ ΠΊ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌ Ρ‚ΠΈΠΏΠ°ΠΌ слоТных систСм: ΠΎΡ‚ рСгрСссионных ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π΄ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй. Π—Π΄Π΅ΡΡŒ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΌ являСтся ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ обучаСтся Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ²:

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠžΡ‚Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…

Π‘Ρ‹Ρ€Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ бСспорядочны ΠΈ Π·Π°ΠΏΡƒΡ‚Π°Π½Ρ‹, собраны ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… источников ΠΈ Π½Π΅ΠΏΡ€ΠΎΠ²Π΅Ρ€Π΅Π½Π½Ρ‹Ρ… записСй. НС ΠΎΡ‡ΠΈΡ‰Π΅Π½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΊΡ€Ρ‹Ρ‚ΡŒ ΠΏΡ€Π°Π²Π΄Ρƒ, Π·Π°Ρ€Ρ‹Ρ‚ΡƒΡŽ Π³Π»ΡƒΠ±ΠΎΠΊΠΎ Π² Π±ΠΈΠ³ Π΄Π°Ρ‚Π΅, ΠΈ ввСсти Π² Π·Π°Π±Π»ΡƒΠΆΠ΄Π΅Π½ΠΈΠ΅ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ°.

Π”Π°Ρ‚Π° ΠΌΠ°ΠΉΠ½ΠΈΠ½Π³ β€” это процСсс очистки Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ ΠΈΡ… ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌΡƒ Π°Π½Π°Π»ΠΈΠ·Ρƒ ΠΈΠ»ΠΈ использованию Π² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… машинного обучСния. Π”Π°Ρ‚Π° ΠΌΠ°ΠΉΠ½Π΅Ρ€Ρƒ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠ±Π»Π°Π΄Π°Ρ‚ΡŒ ΠΈΡΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ качСствами, чудСсной ΠΈΠ½Ρ‚ΡƒΠΈΡ†ΠΈΠ΅ΠΉ ΠΈ тСхничСскими умСниями для объСдинСния ΠΈ трансформирования ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ³ΠΎ количСства Π΄Π°Π½Π½Ρ‹Ρ….

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Big data ΠΈ Machine learning – Ρ‡Ρ‚ΠΎ это Ρ‚Π°ΠΊΠΎΠ΅?

Π‘ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ Π³ΠΎΠ΄ΠΎΠΌ интСрСс ΠΊ Big Data Π½Π΅ΡƒΠΊΠΎΡΠ½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ растСт. ΠšΡ€ΡƒΠΏΠ½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ хотят Π½Π°ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ большиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ ΠΊ Π½ΠΈΠΌ Ρ‡Π΅Ρ€Π΅Π· Ρ€Π°Π·Π½Ρ‹Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ ΠΊΠ°Π½Π°Π»Ρ‹. Π•ΠΆΠ΅Π³ΠΎΠ΄Π½ΠΎ ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, которая Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒΡΡ Π² Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π΅, Π²Ρ‹Ρ€Π°ΡΡ‚Π°ΡŽΡ‚ ΠΊΠ°ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ Π²Π΄Π²ΠΎΠ΅. ΠœΠΈΡ€ΠΎΠ²Ρ‹Π΅ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ†ΠΈΠΈ ΡƒΠΆΠ΅ Π½Π΅ ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Π³ΠΎΠ΄ Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ΡΡ исслСдованиями Π² сфСрС Big Data. Π’Π΅Π΄ΡŒ считаСтся, Ρ‡Ρ‚ΠΎ это ΠΊΠ»ΡŽΡ‡ ΠΊ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎΠΌΡƒ бизнСсу.

Π’ самом простом смыслС слова, это Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ «большиС Π΄Π°Π½Π½Ρ‹Π΅Β». Они ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ структурированы ΠΈΠ»ΠΈ Π½Π΅Ρ‚. Анализ массива Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π»ΡŽΠ±ΡƒΡŽ ΠΏΠΎΡΡ‚Π°Π²Π»Π΅Π½Π½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ. Однако Π½Π΅ вся информация ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Π°. Часто Π² ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π΅ формируСтся ΠΊΡƒΡ‡Π° бСсполСзных Π΄Π°Π½Π½Ρ‹Ρ…, поэтому для исслСдования Big Data Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ΡΡ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΈ экспСртныС Π³Ρ€ΡƒΠΏΠΏΡ‹. Π—Π΄Π΅ΡΡŒ Π½Π° ΠΏΠΎΠΌΠΎΡ‰ΡŒ ΠΈ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ Machine Learning.

Как это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚?

Π‘ самым простым ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ Machine Learning ΠΌΡ‹ сталкиваСмся ΠΏΡ€ΠΈ профилактичСском Ρ€Π΅ΠΌΠΎΠ½Ρ‚Π΅ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ. Допустим, ΠΊ Π½Π°ΠΌ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π΄Π°Π½Π½Ρ‹Π΅ Π΄Π°Ρ‚Ρ‡ΠΈΠΊΠΎΠ² (показания Ρ‚Π΅ΠΌΠΏΠ΅Ρ€Π°Ρ‚ΡƒΡ€Ρ‹, влаТности, давлСния ΠΈ Π²ΠΈΠ±Ρ€Π°Ρ†ΠΈΠΈ Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π΄Π΅Ρ‚Π°Π»ΠΈ оборудования). ИмСнно ΠΎΠ½ΠΈ ΠΈ лоТатся Π² основу Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ML. Она ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ скрытыС ошибки, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ приводят ΠΊ ΠΎΡ‚ΠΊΠ°Π·Ρƒ оборудования, ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΠΎ встроСнным Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, аналитичСская систСма ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ½ΠΈΡ†ΠΈΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ оповСщСния для ΠΊΠΎΠΌΠ°Π½Π΄Ρ‹ обслуТивания, Ссли модСль ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΡ†ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΏΡ€ΠΈ сопоставлСнии с ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹ΠΌΠΈ показатСлями.

Π˜Π½Ρ‚Π΅Ρ€Π΅Ρ ΠΊ Machine Learning растСт. Π’Π΅Π΄ΡŒ Π΅Π³ΠΎ ΠΎΠ±ΡƒΡΠ»Π°Π²Π»ΠΈΠ²Π°ΡŽΡ‚ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰ для Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ³ΠΎ обСспСчСния, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰Π΅Π³ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ. АвтоматичСскоС ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ позволяСт Π΄Π°Ρ‚ΡŒ Ρ†Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ Π±Π΅Π· участия чСловСчСского Ρ€Π°Π·ΡƒΠΌΠ°.

Machine Learning Π² сфСрС Ρ€ΠΎΠ·Π½ΠΈΡ‡Π½ΠΎΠΉ Ρ‚ΠΎΡ€Π³ΠΎΠ²Π»ΠΈ ΠΈ услуг

Π’ Ρ€ΠΈΡ‚Π΅ΠΉΠ»Π΅ Π΄Π°Π½Π½ΠΎΠ΅ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π°Π½Π°Π»ΠΈΠ·Π° Β«Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…Β» являСтся ΠΊΠ»ΡŽΡ‡ΠΎΠΌ ΠΊ успСху. Machine Learning ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΡΠΎΠ±Ρ€Π°Ρ‚ΡŒ, ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ для пСрсонализации ΠΏΠΎΠΊΡƒΠΏΠΎΠΊ Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Алгоритмы ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ быстро ΠΈ просто ΡΠ΅Π³ΠΌΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π°ΡƒΠ΄ΠΈΡ‚ΠΎΡ€ΠΈΡŽ, Ρ‡Ρ‚ΠΎ идСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для Ρ‚Π°Ρ€Π³Π΅Ρ‚ΠΈΠ½Π³Π°.

ΠžΡΠ½ΠΎΠ²Ρ‹Π²Π°ΡΡΡŒ Π½Π° ΠΈΠ·ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… прСдпочтСниях, начинаСтся Π±ΠΎΠ»Π΅Π΅ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·. Он ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… людСй ΠΈ ΠΏΠΎΠ΄Ρ‚Π°Π»ΠΊΠΈΠ²Π°Π΅Ρ‚ Π½Π΅Ρ€Π΅ΡˆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… посСтитСлСй ΠΊ конвСрсии. НапримСр, возмоТности ML ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-покупатСлям пСрсонализированныС Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ ΠΏΠΎ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Ρƒ. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΎΠ½ΠΈ позволят ΡΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ†Π΅Π½Ρ‹, ΡΠ³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΊΡƒΠΏΠΎΠ½Ρ‹ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ стимулы Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ.

Компания Walmart Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π°Π΄ созданиСм собствСнных Π·Π°ΠΏΠ°Ρ‚Π΅Π½Ρ‚ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ машинного обучСния ΠΈ искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°. Π’ ΠΌΠ°Ρ€Ρ‚Π΅ 2017 Π³ΠΎΠ΄Π° розничная ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ΠΊΡ€Ρ‹Π»Π° Магазин β„–8 Π² Π‘ΠΈΠ»ΠΈΠΊΠΎΠ½ΠΎΠ²ΠΎΠΉ Π΄ΠΎΠ»ΠΈΠ½Π΅. Π­Ρ‚ΠΎ спСциализированноС пространство ΠΈ ΠΈΠ½ΠΊΡƒΠ±Π°Ρ‚ΠΎΡ€ для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ позволят ΠΌΠ°Π³Π°Π·ΠΈΠ½Π°ΠΌ ΠΎΡΡ‚Π°Π²Π°Ρ‚ΡŒΡΡ конкурСнтоспособными Π² блиТайшСС дСсятилСтиС.

Π’ финансовом сСкторС прогностичСская Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ° ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ, анализируя большиС Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΡ€ΠΈ этом ΠΎΠ½Π° позволяСт ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ Π½Π° основС ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. МодСли ML ΡƒΡΠ²Π°ΠΈΠ²Π°ΡŽΡ‚ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈ Π·Π°Ρ‚Π΅ΠΌ осознанно ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ покупатСлям Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ.

Π‘Π°Π½ΠΊΠΈ ΠΈ финансовыС учрСТдСния ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ML для сбора ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, которая ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ Ρ€Π°Π·Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ инвСстиционныС стратСгии ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ возмоТности для бизнСса.

Π’ 2018 Π³ΠΎΠ΄Ρƒ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ машинного обучСния выходят Π½Π° Π½ΠΎΠ²Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ зрСлости. ΠšΡ€ΡƒΠΏΠ½Ρ‹Π΅ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ†ΠΈΠΈ всС Ρ‡Π°Ρ‰Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π°Π½Π°Π»ΠΈΠ· Β«Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…Β». Они ΡΡ‚Π°Ρ€Π°ΡŽΡ‚ΡΡ ΡΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π²ΠΎ всСх областях. Π’ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΌ ΠΈΡ‚ΠΎΠ³Π΅ это ΠΏΠΎΠ²Ρ‹ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ обслуТиваниС ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ².

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠžΡ‚ Big Data ΠΊ Machine Learning

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π˜Π½Ρ‚Π΅Ρ€Π΅Ρ ΠΊ Big Data Π½Π΅ угасаСт, Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚, всС большС людСй ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‚ΡΡ Ρ‚Π΅ΠΌ ΠΊΠ°ΠΊ ΡΠΎΠ±ΠΈΡ€Π°Ρ‚ΡŒ, ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ, Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π² своСй Ρ€Π°Π±ΠΎΡ‚Π΅ ΠΈ бизнСсС ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹Π΅ ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π² нашС врСмя ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ фактичСски ΠΎΡ‚ΠΎΠ²ΡΡŽΠ΄Ρƒ. Π­Ρ‚ΠΎ Π½Π΅ΡƒΠ΄ΠΈΠ²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, вСдь Π·Π° ΠΎΠ΄Π½Ρƒ ΠΌΠΈΠ½ΡƒΡ‚Ρƒ Π² Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π΅ появляСтся 570 Π½ΠΎΠ²Ρ‹Ρ… сайтов, Π·Π° 1 дСнь Π² ΠΌΠΈΡ€ΠΎΠ²ΠΎΠΌ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΌ пространствС происходит Π±ΠΎΠ»Π΅Π΅ 2 ΠΌΠ»Ρ€Π΄ событий, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π°ΠΆΠ΅ послС ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈ сТатия Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‚ ΠΎΠΊΠΎΠ»ΠΎ 400 Π“Π±Π°ΠΉΡ‚, Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Π³ΠΎΠ΄ ΠΎΠ±Ρ‰ΠΈΠΉ объСм ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΡ‹Ρ… ΠΈ Ρ…Ρ€Π°Π½ΠΈΠΌΡ‹Ρ… бизнСс-Π΄Π°Π½Π½Ρ‹Ρ… удваиваСтся.

ΠœΠΈΡ€ΠΎΠ²Ρ‹Π΅ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ†ΠΈΠΈ ΠΈ большиС ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΡƒΠΆΠ΅ нСсколько Π»Π΅Ρ‚ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Big Data для развития своСго бизнСса, инвСстируя ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Ρ‹ Π΄ΠΎΠ»Π»Π°Ρ€ΠΎΠ² Π² ΠΈΡ… ΠΈΠ·ΡƒΡ‡Π΅Π½ΠΈΠ΅, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ украинскиС ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΠΎΠ²Π°Ρ‚ΡŒΡΡ этим Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ. Но Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π»ΠΈ Big Data являСтся ΠΏΠ°Π½Π°Ρ†Π΅Π΅ΠΉ ΠΈΠ»ΠΈ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ большСС?

Big Data – это большой объСм структурированных ΠΈΠ»ΠΈ нСструктурированных Π΄Π°Π½Π½Ρ‹Ρ…, Ρ†Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… зависит ΠΎΡ‚ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎ поставлСнной Π·Π°Π΄Π°Ρ‡ΠΈ. Π’ нашС врСмя ΡƒΠΆΠ΅ всС Π΄Π°Π½Π½Ρ‹Π΅ становятся большими, Π½ΠΎ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Π·Π°Π΄Π°Ρ‡ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ ΠΌΠ°Π»Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Π‘ΠΎΠ»ΡŒΡˆΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ β€” Π½Π΅ всСгда Π΄Π°ΡŽΡ‚ ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚. ОсобСнно Π²Π°ΠΆΠ½ΠΎΠΉ становится ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° качСства Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ вмСстС с Ρ†Π΅Π½Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ гСнСрируСтся ΠΊΡƒΡ‡Π° ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ мусора. Для качСствСнного Π°Π½Π°Π»ΠΈΠ·Π° ΠΈ практичСского примСнСния Big Data Π½ΡƒΠΆΠ½Π° Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ ΠΊΠΎΠΌΠ°Π½Π΄Π° Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ смогут ΠΈΠ·Π²Π»Π΅Ρ‡ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Π΅ знания ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΈΡ… ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠ°Ρ Ρ†Π΅Π½Π½ΠΎΡΡ‚ΡŒ Big Data ΠΏΠ΅Ρ€Π΅ΡˆΠ»Π° Π² Π½ΠΎΠ²ΡƒΡŽ ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ, ΠΈ Π΅Π΅ фактичСски Π·Π°ΠΌΠ΅Π½ΠΈΠ» Π½ΠΎΠ²Ρ‹ΠΉ класс Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΉ β€” Machine Learning («МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Β»), появившийся ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π΅Π΄Π°Π²Π½ΠΎ. Machine Learning β€” это ΠΌΠ΅Ρ‚ΠΎΠ΄ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, основанный Π½Π° построСнии Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ аналитичСской ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ матСматичСскиС Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ…, Machine Learning позволяСт Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ скрытыС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΈ зависимости, Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‡ΠΈ Π·Π°Ρ€Π°Π½Π΅Π΅ Π·Π°ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹ΠΌ Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠ΅ мСсто поиска.

Π’Π°ΠΆΠ½Ρ‹ΠΌ аспСктом Π² Machine Learning являСтся ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΈ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒΡΡ Π½Π° вновь ΠΏΠΎΡΡ‚ΡƒΠΏΠΈΠ²ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, для получСния Π½Π°Π΄Π΅ΠΆΠ½Ρ‹Ρ… ΠΈ Ρ€Π΅ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ². Π‘ ростом ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ мощности ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠ² Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ€Π°ΡΡˆΠΈΡ€ΠΈΠ»ΠΈΡΡŒ сфСры примСнСния Machine Learning для Π°Π½Π°Π»ΠΈΠ·Π° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…. Π’ΠΎΡ‚ нСсколько ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², ΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Ρ‹ ΠΌΠΎΠ³Π»ΠΈ ΡΠ»Ρ‹ΡˆΠ°Ρ‚ΡŒ:

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Рост интСрСса ΠΊ Machine Learning ΠΈ Π΅Π³ΠΎ практичСской значимости обусловлСн Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ сСйчас для Π΅Π³ΠΎ примСнСния Π΅ΡΡ‚ΡŒ всС инструмСнты, ΠΊΠ°ΠΊ Π½ΠΈΠΊΠΎΠ³Π΄Π° Ρ€Π°Π½Π΅Π΅: постоянно растущиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ ΠΈ разновидности ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Π΄Π°Π½Π½Ρ‹Ρ…, Π΄Π΅ΡˆΠ΅Π²Ρ‹Π΅ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ мощности ΠΈ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° Π΄Π°Π½Π½Ρ‹Ρ…, постоянно ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π΅ΡΡ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ обСспСчСниС, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ позволяСт ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π°Π½Π°Π»ΠΈΠ· ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ Π΄Π°Π½Π½Ρ‹Ρ…, Π½Π΅ имСя ΡƒΠ³Π»ΡƒΠ±Π»Π΅Π½Π½Ρ‹Ρ… Π·Π½Π°Π½ΠΈΠΉ Π² этой области.

Machine Learning позволяСт быстро Π² автоматичСском Ρ€Π΅ΠΆΠΈΠΌΠ΅ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ большиС, Π±ΠΎΠ»Π΅Π΅ слоТныС Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ обСспСчиваСт Π±ΠΎΠ»Π΅Π΅ быстрый, Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚. А Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ β€” это Ρ†Π΅Π½Π½Ρ‹Π΅ прСдсказания, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΌΠΎΠ³Π°ΡŽΡ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΈ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ дСйствия Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π±Π΅Π· Π²ΠΌΠ΅ΡˆΠ°Ρ‚Π΅Π»ΡŒΡΡ‚Π²Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°.

По этому ΠΏΠΎΠ²ΠΎΠ΄Ρƒ Ρ…ΠΎΡ€ΠΎΡˆΠΎ высказался Π²Π΅Π΄ΡƒΡ‰ΠΈΠΉ ΡƒΡ‡Π΅Π½Ρ‹ΠΉ Π² области Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠΈ Вомас ДэвСнпорт Π² своСм ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΈ The Wall Street Journal. По Π΅Π³ΠΎ словам, Π² условиях быстро ΠΌΠ΅Π½ΡΡŽΡ‰ΠΈΡ…ΡΡ, растущих объСмов Π΄Π°Π½Π½Ρ‹Ρ…, «… Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ быстроС ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ²ΠΎΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π΅ ΠΎΡ‚ΡΡ‚Π°Π²Π°Ρ‚ΡŒ.Β» И Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ это с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Machine Learning. Он Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚:

Π›ΡŽΠ΄ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΎΠ΄Π½Ρƒ ΠΈΠ»ΠΈ Π΄Π²Π΅ Ρ…ΠΎΡ€ΠΎΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² нСдСлю; Machine Learning ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ тысячи ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² нСдСлю.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Big Data, Π±Π»ΠΎΠΊΡ‡Π΅ΠΉΠ½, машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ β€” объясняСм Ρ‚Π΅Ρ€ΠΌΠΈΠ½Ρ‹ Π½Π° Ρ‘ΠΆΠΈΠΊΠ°Ρ…

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π˜ΡΠΊΡƒΡΡΡ‚Π²Π΅Π½Π½Ρ‹ΠΉ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ ΠΈ машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ всё Ρ‡Π°Ρ‰Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ компаниями Π² ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π΅. О Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΈ для Ρ‡Π΅Π³ΠΎ ΠΎΠ½ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ Π² Ρ€Π°Π±ΠΎΡ‚Π΅, расскаТСм Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΡΡ‚Π°Ρ‚ΡŒΡΡ…. А Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, ΠΊΠ°ΠΊ устроСны эти Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ, ΠΌΡ‹ ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΈΠ»ΠΈ для вас тСматичСский ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ с наглядными ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ. ОбъясняСм Ρ‚Π΅Ρ€ΠΌΠΈΠ½Ρ‹ Ρ‚Π°ΠΊ просто, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈ Π΅ΠΆΡƒ стало понятно.

Π˜ΡΠΊΡƒΡΡΡ‚Π²Π΅Π½Π½Ρ‹ΠΉ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚
Он ТС ИИ, Artificial Intelligence, AI

Π’ΠΎΡ‡Π½ΠΎΠ³ΠΎ опрСдСлСния Π½Π΅ сущСствуСт, совсСм ΠΊΠ°ΠΊ Π² философии. Всё зависит ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΏΠΎΠ΄ словами Β«Ρ€Π°Π·ΡƒΠΌΒ» ΠΈ Β«ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Β». Π‘Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ это Ρ‚ΠΎΠ»ΡŒΠΊΠΎ свойством людСй? Или Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΆΠΈΠ²ΠΎΡ‚Π½Ρ‹Π΅ Ρ‚ΠΎΠΆΠ΅ Ρ€Π°Π·ΡƒΠΌΠ½Ρ‹ ΠΈ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΠΎΠΌ? Π’ Ρ†Π΅Π»ΠΎΠΌ, искусствСнный ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ β€” это свойство систСм ΠΈΠΌΠΈΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π»ΠΈΠ±ΠΎ психичСскиС процСссы Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°, Π»ΠΈΠ±ΠΎ Ρ€Π°Π·ΡƒΠΌΠ½ΠΎΠ΅ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ ΠΈ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΡΠΎΠ²Π΅Ρ€ΡˆΠ°Ρ‚ΡŒ Π²Ρ‹Π±ΠΎΡ€.

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Π²Ρ‹ ΠΌΠ΅Ρ‡Ρ‚Π°Π΅Ρ‚Π΅ завСсти Π΅ΠΆΠ°. ΠžΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Π΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ аллСргия Π½Π° этих ΠΆΠΈΠ²ΠΎΡ‚Π½Ρ‹Ρ…. Π’ΠΎΠ³Π΄Π° Π΄Ρ€ΡƒΠ·ΡŒΡ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ ΠΊΡƒΠΏΠΈΡ‚ΡŒ Ρ€ΠΎΠ±ΠΎΡ‘ΠΆΠΈΠΊΠ°. Он Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡƒΠΌΠ΅Ρ‚ΡŒ Π²ΠΎΡΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ настоящСго Π΅ΠΆΠ°: Ρ„Ρ‹Ρ€ΠΊΠ°Ρ‚ΡŒ, выраТая своё Π½Π΅Π΄ΠΎΠ²ΠΎΠ»ΡŒΡΡ‚Π²ΠΎ, ΡΠ²ΠΎΡ€Π°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒΡΡ Π² ΠΊΠ»ΡƒΠ±ΠΎΡ‡Π΅ΠΊ, ΠΊΠΎΠ³Π΄Π° Π΅Π³ΠΎ ΠΏΡ‹Ρ‚Π°ΡŽΡ‚ΡΡ ΠΏΠΎΠ³Π»Π°Π΄ΠΈΡ‚ΡŒ, Π³Ρ€ΠΎΠΌΠΊΠΎ Ρ‚ΠΎΠΏΠ°Ρ‚ΡŒ Π»Π°ΠΏΠΊΠ°ΠΌΠΈ ΠΏΠΎ Π½ΠΎΡ‡Π°ΠΌ, Π»ΡŽΠ±ΠΈΡ‚ΡŒ хозяина ΠΈ ΠΊΡƒΡΠ°Ρ‚ΡŒ Π½Π΅Π·Π½Π°ΠΊΠΎΠΌΡ‹Ρ… Π΅ΠΌΡƒ людСй. Если ваш Ρ€ΠΎΠ±ΠΎΡ‘ΠΆ ΡƒΠΌΠ΅Π΅Ρ‚ всё это, Ρ‚ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ смСло Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ искусствСнным ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚ΠΎΠΌ.

Π‘ΠΎΠ»ΡŒΡˆΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅
Они ТС Big Data

Π’Ρ€ΠΎΠ΄Π΅ сразу понятно, большиС Π΄Π°Π½Π½Ρ‹Π΅ β€” это ΠΌΠ½ΠΎΠ³ΠΎ ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. Но всё Π½Π΅ Ρ‚Π°ΠΊ просто. Для Π½Π°Ρ‡Π°Π»Π°, ΠΌΠ½ΠΎΠ³ΠΎ β€” это сколько? Π’Ρ€ΠΈ, Π΄Π΅ΡΡΡ‚ΡŒ, ΠΌΠΈΠ»Π»ΠΈΠΎΠ½, ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄? А Ρ‡Π΅Π³ΠΎ β€” ΠΌΠ΅Π³Π°Π±Π°ΠΉΡ‚ΠΎΠ², Π³ΠΈΠ³Π°Π±Π°ΠΉΡ‚ΠΎΠ², Ρ‚Π΅Ρ€Π°Π±Π°ΠΉΡ‚ΠΎΠ²? Насчёт этого Π½Π΅Ρ‚ Π΅Π΄ΠΈΠ½ΠΎΠ³ΠΎ мнСния. ΠšΡ‚ΠΎ-Ρ‚ΠΎ Π΄ΡƒΠΌΠ°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ это ΠΊΠΎΠ³Π΄Π° Π΄Π°Π½Π½Ρ‹Π΅ нСльзя ΠΏΠΎΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅, ΠΊΡ‚ΠΎ-Ρ‚ΠΎ β€” ΠΊΠΎΠ³Π΄Π° Π΅ΠΆΠ΅Π΄Π½Π΅Π²Π½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ 100 Π“Π± Π² дСнь. ΠŸΡ€ΠΈΠ½ΡΡ‚ΠΎ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ большиС Π΄Π°Π½Π½Ρ‹Π΅ β€” это Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сами Π΄Π°Π½Π½Ρ‹Π΅, Π½ΠΎ Π΅Ρ‰Ρ‘ ΠΈ инструмСнты, ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ.

Допустим, Π΅ΡΡ‚ΡŒ Π·Π°Π΄Π°Π½ΠΈΠ΅ ΠΎΡ‚ Гринпис: ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ дСнь ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π±Π΅Π»ΠΎΠ±Ρ€ΡŽΡ…ΠΈΡ…, ΡƒΡˆΠ°ΡΡ‚Ρ‹Ρ… ΠΈ африканских ΠΊΠ°Ρ€Π»ΠΈΠΊΠΎΠ²Ρ‹Ρ… Π΅ΠΆΠ΅ΠΉ, ΠΆΠΈΠ²ΡƒΡ‰ΠΈΡ… Π½Π° Ρ‚Π΅Ρ€Ρ€ΠΈΡ‚ΠΎΡ€ΠΈΠΈ Π·Π°ΠΏΠΎΠ²Π΅Π΄Π½ΠΈΠΊΠ°. Π­Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΡ€Π°Π²Π½ΠΈΡ‚ΡŒ ΠΈΡ… количСство ΠΌΠ΅ΠΆΠ΄Ρƒ собой ΠΈ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ, Π½Π΅ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚ΡΡ Π»ΠΈ популяция ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΈΠ· Π²ΠΈΠ΄ΠΎΠ² Π΅ΠΆΠ΅ΠΉ.

ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ дСнь Π²Ρ‹ собираСтС всСх Ρ‘ΠΆΠΈΠΊΠΎΠ² ΠΈ распрСдСляСтС ΠΏΠΎ Ρ‚Ρ€Ρ‘ΠΌ ΠΊΠΎΠΌΠ½Π°Ρ‚Π°ΠΌ.

Если Π² Π·Π°ΠΏΠΎΠ²Π΅Π΄Π½ΠΈΠΊΠ΅ 100 Ρ‘ΠΆΠΈΠΊΠΎΠ², Π·Π°Π΄Π°Ρ‡Π° каТСтся Π»Π΅Π³ΠΊΠΎΠΉ. Π‘ 1000 Π΅ΠΆΠ΅ΠΉ становится слоТнСС (Π½Π΅ Π·Π°Π±Ρ‹Π²Π°ΠΉΡ‚Π΅, ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹Π±Π΅Π³Π°Ρ‚ΡŒ). А Ссли Ρƒ вас самый большой Π² ΠΌΠΈΡ€Π΅ Π΅ΠΆΠΈΠ½Ρ‹ΠΉ Π·Π°ΠΏΠΎΠ²Π΅Π΄Π½ΠΈΠΊ, Ρ‚ΠΎ Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ ΠΆΠΈΠ²ΠΎΡ‚Π½Ρ‹Ρ… ΡƒΠΆΠ΅ Π½Π΅ ΠΏΠΎΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ β€” Π² этот ΠΌΠΎΠΌΠ΅Π½Ρ‚ ΠΎΠ½ΠΈ станут большими Π΄Π°Π½Π½Ρ‹ΠΌΠΈ. Π’Π°ΠΌ придётся ΠΎΠ±Π·Π°Π²Π΅ΡΡ‚ΠΈΡΡŒ инструмСнтом ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… β€” ΡƒΠΌΠ½Ρ‹ΠΌ автоматичСским сортировщиком Π΅ΠΆΠ΅ΠΉ. Он Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ распрСдСлит ΠΈ посчитаСт ΠΆΠΈΠ²ΠΎΡ‚Π½Ρ‹Ρ…, Π½ΠΎ ΠΈ Π½Π°ΠΉΠ΄Ρ‘Ρ‚ Π½ΠΎΠ²Ρ‹Π΅ зависимости, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, сСзонныС колСбания Π² Π΅ΠΆΠΈΠ½ΠΎΠΉ популяции.

Π‘Π»ΠΎΠΊΡ‡Π΅ΠΉΠ½
ΠžΡ‚ Π°Π½Π³Π». Blockchain

Π‘Π»ΠΎΠΊΡ‡Π΅ΠΉΠ½ β€” это Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€ΠΎ ΠΊΡ€ΠΈΠΏΡ‚ΠΎΠ²Π°Π»ΡŽΡ‚Ρƒ! Π­Ρ‚ΠΎ тСхнология хранСния ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Π² Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ΅ Π±Π»ΠΎΠΊΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· Π±Π»ΠΎΠΊΠΎΠ² содСрТит Π΄Π°Π½Π½Ρ‹Π΅ ΠΎ всСй ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ΅: извСстно, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠ΅Π½Π½ΠΎ хранится Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… Π±Π»ΠΎΠΊΠ°Ρ…, ΠΊΡ‚ΠΎ ΠΈ ΠΊΠΎΠ³Π΄Π° создал ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ, пСрСмСстил Π΅Ρ‘ ΠΈΠ»ΠΈ ΠΈΠ·ΠΌΠ΅Π½ΠΈΠ». ВсС свСдСния Π΄ΡƒΠ±Π»ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π°Ρ…, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π² Ρ€Π°Π·Π½Ρ‹Ρ… странах. Благодаря этому ΠΏΠΎΠ΄Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΈΡ… просто Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ.

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Ρƒ вас Π΅ΡΡ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠΉ Π΄Ρ€ΡƒΠ³ β€” Ρ‘ΠΆ Π‘ΠΎΠ½ΠΈΠΊ. ΠŸΡ€ΠΈΠ±Π΅Π³Π°Π΅Ρ‚ сосСд, грозится Π²Ρ‹Π·Π²Π°Ρ‚ΡŒ ΠΏΠΎΠ»ΠΈΡ†ΠΈΡŽ ΠΈ ΠΊΡ€ΠΈΡ‡ΠΈΡ‚, Ρ‡Ρ‚ΠΎ Ρƒ Π½Π΅Π³ΠΎ Π΅ΡΡ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎ, Π³Π΄Π΅ Π‘ΠΎΠ½ΠΈΠΊ Π΄Π²Π° дня Π½Π°Π·Π°Π΄ ΠΊΡ€Π°Π΄Ρ‘Ρ‚ ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹ΠΉ Π°Π»ΠΌΠ°Π·, Π·Π°ΠΊΠΎΠΏΠ°Π½Π½Ρ‹ΠΉ Π² саду. Но Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ: вСсь Π²Π΅Ρ‡Π΅Ρ€ Π²Ρ‹ с Π΅ΠΆΠΎΠΌ смотрСли сСриалы ΠΈ Π΅Π»ΠΈ ΠΏΠΈΡ†Ρ†Ρƒ.

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, всС записи с ΠΊΠ°ΠΌΠ΅Ρ€ наблюдСния Ρ€Π°ΠΉΠΎΠ½Π° хранятся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ Π±Π»ΠΎΠΊΡ‡Π΅ΠΉΠ½: запись ΠΎΠ΄Π½ΠΎΠ³ΠΎ дня с ΠΎΠ΄Π½ΠΎΠΉ ΠΊΠ°ΠΌΠ΅Ρ€Ρ‹ β€” ΠΎΠ΄ΠΈΠ½ Π±Π»ΠΎΠΊ, Π² Π½ΠΎΠ²ΠΎΠΌ Π±Π»ΠΎΠΊΠ΅ содСрТится видСозапись Π½ΠΎΠ²ΠΎΠ³ΠΎ дня ΠΈ ΠΊΠΎΠ΄-ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ Π±Π»ΠΎΠΊΠ°. ΠŸΠΎΠ»ΠΈΡ†Π΅ΠΉΡΠΊΠΈΠΉ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ доступ ΠΊΠΎ всСм ΠΊΠ°ΠΌΠ΅Ρ€Π°ΠΌ, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²ΠΈΠ΄Π΅Π½ сад сосСда. Π—Π°Ρ‚Π΅ΠΌ ΠΎΠ½ ΠΈΡ‰Π΅Ρ‚ ΠΊΠΎΠ΄ с Π½ΡƒΠΆΠ½ΠΎΠΉ ΠΊΠ°ΠΌΠ΅Ρ€Ρ‹, смотрит Π½Π° ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ Π²ΠΈΠ΄Π΅ΠΎ, Π³Π΄Π΅ Π‘ΠΎΠ½ΠΈΠΊ ΠΊΡ€Π°Π΄Ρ‘Ρ‚ Π°Π»ΠΌΠ°Π· ΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π²ΠΈΠ΄Π΅ΠΎ сфабриковано. Π’Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΠΎΠΆΠ½ΠΎ дальшС счастливо Π΅ΡΡ‚ΡŒ ΠΏΠΈΡ†Ρ†Ρƒ, Π° сосСд Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΡ‚Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ Π½Π°ΠΊΠ°Π·Π°Π½ΠΈΠ΅ Π·Π° ΠΊΠ»Π΅Π²Π΅Ρ‚Ρƒ!

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Оно ТС МО, Machine Learning, ML

Π­Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹, ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΠ»ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ учитСля. Выглядит это ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ‚Π°ΠΊ:

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² машинного обучСния ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Ρ‹ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ Ρ‘ΠΆΠΈΠΊΠΎΠ² ΠΈΠ»ΠΈ Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ…. НиТС расскаТСм ΠΏΡ€ΠΎ Π΄Π²Π° Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° с ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ.

1. Π“Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ бустинг

ΠžΡ‚ Π°Π½Π³Π». Gradient Boosting

Π­Ρ‚ΠΎ способ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ построСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½ΠΎΠ²Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ создаётся, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ нСдостатки ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅Π³ΠΎ.

НапримСр, ΠΌΡ‹ ΠΏΡ€ΠΈΠ΄ΡƒΠΌΡ‹Π²Π°Π΅ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‰ΠΈΠΉ ΠΏΠΎΡ€ΠΎΠ΄Ρƒ Π΅ΠΆΠ΅ΠΉ. Для Π½Π°Ρ‡Π°Π»Π° смотрим ΠΈΡ… Ρ€Π°Π·ΠΌΠ΅Ρ€Ρ‹: большой Ρ‘ΠΆ, срСдний ΠΈΠ»ΠΈ малСнький. Π­Ρ‚ΠΎ нашС ΠΏΠ΅Ρ€Π²ΠΎΠ΅ простоС Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. Π—Π°Ρ‚Π΅ΠΌ Π΅Ρ‰Ρ‘ нСсколько:

Π”Π°Π»Π΅Π΅ соСдиняСм всС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π² ΠΎΠ΄Π½ΠΎ Π΄Π΅Ρ€Π΅Π²ΠΎ ΠΈ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ Π·Π°Π³ΠΎΡ‚ΠΎΠ²ΠΊΡƒ, словно ΠΌΡ‹ Π΄Π΅Π»Π°Π΅ΠΌ тСст «Какой Π²Ρ‹ Ρ‘ΠΆΠΈΠΊΒ». ВсС ΠΏΠΎΡ€ΠΎΠ΄Ρ‹ Ρ‚Π°ΠΊΠΎΠΉ тСст Π½Π΅ ΠΏΠΎΠΊΡ€ΠΎΠ΅Ρ‚, поэтому придётся ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π΅Ρ‰Ρ‘ ΠΎΠ΄Π½ΠΎ Π΄Π΅Ρ€Π΅Π²ΠΎ с ΡƒΡ‡Ρ‘Ρ‚ΠΎΠΌ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΠ΅ΠΉΡΡ ошибки. КаТдоС Π½ΠΎΠ²ΠΎΠ΅ Π΄Π΅Ρ€Π΅Π²ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΈ Ρ‚ΠΎΡ‡Π½Π΅Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ΄Ρƒ Π΅ΠΆΠ΅ΠΉ.

2. НСйронныС сСти

ΠžΡ‚ Π°Π½Π³Π». Artificial neural network

Π­Ρ‚ΠΎ Π°Π½Π°Π»ΠΎΠ³ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй чСловСчСского ΠΌΠΎΠ·Π³Π°. Много ΠΌΠ°Π»Π΅Π½ΡŒΠΊΠΈΡ… Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² Ρ€Π΅ΡˆΠ°ΡŽΡ‚ свои ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠΈΠ΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ. Они взаимосвязаны ΠΈ вмСстС Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‚ слоТныС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΠΌΡ‹ ΠΌΠ½ΠΎΠ³ΠΎ Ρ€Π°Π· сфотографировали ΠΈ нарисовали Π΅ΠΆΠ΅ΠΉ, ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Ρƒ ΠΈ сказали: Β«Π‘ΠΌΠΎΡ‚Ρ€ΠΈ, всё это Ρ‘ΠΆΠΈΠΊΠΈΒ». Он ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π» ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ, Π½Π°Π»ΠΎΠΆΠΈΠ» ΠΈΡ… Π΄Ρ€ΡƒΠ³ Π½Π° Π΄Ρ€ΡƒΠ³Π° ΠΈ Π²Ρ‹Π΄Π΅Π»ΠΈΠ» ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π΅ΠΆΠ°. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎΡΡŒ прСдставлСниС β€” Π΅Π³ΠΎ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ слоСм свёртки. Π§Π΅Π»ΠΎΠ²Π΅ΠΊ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ посмотрит Π½Π° Π½Π΅Π³ΠΎ, скорСС всСго, Π½Π΅ ΠΏΠΎΠΉΠΌΠ΅Ρ‚, ΠΏΠΎΡ‡Π΅ΠΌΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Ρ‚Π°ΠΊ Π²ΠΈΠ΄ΠΈΡ‚ Ρ‘ΠΆΠΈΠΊΠΎΠ². Он ΡƒΠ²ΠΈΠ΄ΠΈΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°Π±ΠΎΡ€ пиксСлСй. Π’Π°ΠΊΠΎΠΉ свСрточной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎ ΠΈΠ· Π·Π°ΠΏΠΎΠ²Π΅Π΄Π½ΠΈΠΊΠ°, Π° ΠΎΠ½Π° посчитаСт, сколько Π΅ΠΆΠ΅ΠΉ Ρ‚Π°ΠΌ ΠΆΠΈΠ²Π΅Ρ‚.

МодСль машинного обучСния
Она ТС ML model

Π­Ρ‚ΠΎ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹ΠΉ ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ. МодСль со своим Π½Π°Π±ΠΎΡ€ΠΎΠΌ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (Ρ„ΠΈΡ‡) Ρ€Π΅ΡˆΠ°Π΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚ΠΎΡ‚ Ρ‚ΠΈΠΏ Π·Π°Π΄Π°Ρ‡, для ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Π±Ρ‹Π»Π° построСна. Как Ρ‘ΠΆΠΈΠΊ, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Π½Π°ΡƒΡ‡ΠΈΠ»ΠΈ Π»ΠΎΠ²ΠΈΡ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½Ρ‹ΠΉ Π²ΠΈΠ΄ гусСниц.

Π€ΠΈΡ‡Π°
ΠžΡ‚ Π°Π½Π³Π». feature β€” ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒ, характСристика, свойство

Π­Ρ‚ΠΎ слСнговоС ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‰ΠΈΡ…ΡΡ Π² модСлях. ΠŸΠΎΠΌΠ½ΠΈΡ‚Π΅, ΠΌΡ‹ Π² Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠΌ бустингС строили Π΄Π΅Ρ€Π΅Π²ΡŒΡ для опрСдСлСния ΠΏΠΎΡ€ΠΎΠ΄Ρ‹ Π΅ΠΆΠ°? Π’Π°ΠΊ Π²ΠΎΡ‚, Ρ„ΠΎΡ€ΠΌΠ° ΡƒΡˆΠ΅ΠΊ β€” это Ρ„ΠΈΡ‡Π°. Как ΠΈ Π΄Π»ΠΈΠ½Π° ΠΈΠ³ΠΎΠ»ΠΎΠΊ.

Если Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΡƒΠ·Π½Π°Ρ‚ΡŒ, ΠΊΠ°ΠΊ устроСно машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, Π³Π΄Π΅ ΠΌΡ‹ сталкиваСмся с Π½ΠΈΠΌ Π² ΠΆΠΈΠ·Π½ΠΈ ΠΈ ΠΊΠ°ΠΊ ΠΎΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π΅, ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΈΡ‚Π΅ Π½Π° ΡΡ‚Π°Ρ‚ΡŒΡŽ Β«Π’Ρ‚ΠΎΡ€ΠΆΠ΅Π½ΠΈΠ΅ машинного обучСния: ΠΎΡ‚ Π·Π°ΠΊΠ°Π·Π° такси Π΄ΠΎ пСрсонализации ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π°Β».

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Как ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния Π½Π° случайных GPU

Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΡΠΏΡ€ΠΎΡΠΈΡ‚ΡŒ: ΠΏΠΎΡ‡Π΅ΠΌΡƒ эти полумагичСскиС ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Ρ‚Π°ΠΊ Ρ…ΠΎΡ€ΠΎΡˆΠΎ? ΠšΠΎΡ€ΠΎΡ‚ΠΊΠΈΠΉ ΠΎΡ‚Π²Π΅Ρ‚: эти ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‡Ρ€Π΅Π·Π²Ρ‹Ρ‡Π°ΠΉΠ½ΠΎ слоТны ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ Π½Π° ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠΌ количСствС Π΄Π°Π½Π½Ρ‹Ρ…. На самом Π΄Π΅Π»Π΅, Lambda Labs Π½Π΅Π΄Π°Π²Π½ΠΎ подсчитала, Ρ‡Ρ‚ΠΎ для обучСния GPT-3 Π½Π° ΠΎΠ΄Π½ΠΎΠΌ GPU ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎΡΡŒ Π±Ρ‹ 4,6 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° Π΄ΠΎΠ»Π»Π°Ρ€ΠΎΠ² β€” Ссли Π±Ρ‹ Ρ‚Π°ΠΊΠΎΠ΅ Π±Ρ‹Π»ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ.

Π’Π°ΠΊΠΈΠ΅ ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΡ‹, ΠΊΠ°ΠΊ PyTorch ΠΈ Tensorflow, ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ эти ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ Ρ€Π°Π±ΠΎΡ‡ΡƒΡŽ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ ΠΏΠΎ сотням (ΠΈΠ»ΠΈ тысячам) GPU ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ. К соТалСнию, этим ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ°ΠΌ трСбуСтся ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ графичСских процСссоров (ΠΎΠ½ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡƒΡŽ ΠΏΠ°ΠΌΡΡ‚ΡŒ ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ). Но ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ тысячи ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Ρ… GPU. ΠœΠ°Π»Ρ‹Π΅ ΠΈ срСдниС ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΏΠΎΠΊΡƒΠΏΠ°ΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½Ρ‹Π΅ систСмы, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ Π½Π΅ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½ΠΎΠΉ инфраструктурС, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π½Π΅Π»Π΅Π³ΠΊΠΎ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ для вычислСния Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ этих условиях ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π΄Π°ΠΆΠ΅ срСднСго Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°Π½ΠΈΠΌΠ°Ρ‚ΡŒ Π½Π΅Π΄Π΅Π»ΠΈ ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ мСсяцы. Если Π½Π΅ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ ΠΌΠ΅Ρ€Ρ‹, унивСрситСты ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ нСбольшиС ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ€ΠΈΡΠΊΡƒΡŽΡ‚ ΠΏΠΎΡ‚Π΅Ρ€ΡΡ‚ΡŒ ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚ΠΎΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π² ΠΏΠΎΠ³ΠΎΠ½Π΅ Π·Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΎΠΉ Π½ΠΎΠ²Ρ‹Ρ…, Π»ΡƒΡ‡ΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния. Но это ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ.

Π’ этом постС прСдставлСна прСдыстория ΠΈ практичСскиС шаги ΠΏΠΎ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ BERT с нуля Π² унивСрситСтС с использованиСм ΠΏΠ°ΠΊΠ΅Ρ‚Π° HetSeq. Π­Ρ‚ΠΎ адаптация популярного ΠΏΠ°ΠΊΠ΅Ρ‚Π° PyTorch, которая прСдоставляСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ большиС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Π½Π° Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ³Π΅Π½Π½ΠΎΠΉ инфраструктурС.

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ эту ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ, ΠΌΡ‹ Π½Π΅Π΄Π°Π²Π½ΠΎ выпустили ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½Ρ‹ΠΉ ΠΏΠ°ΠΊΠ΅Ρ‚ ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ HetSeq β€” Π°Π΄Π°ΠΏΡ‚Π°Ρ†ΠΈΡŽ популярного ΠΏΠ°ΠΊΠ΅Ρ‚Π° PyTorch, которая прСдоставляСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ большиС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Π½Π° Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ³Π΅Π½Π½ΠΎΠΉ инфраструктурС.

ЭкспСримСнты ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ систСму Π½Π° Π±Π°Π·Π΅ BERT ΠΌΠΎΠΆΠ½ΠΎ Π·Π° дСнь ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π±ΠΎΠ»Π΅Π΅ Ρ‡Π΅ΠΌ 8 GPU, Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π°ΠΌ ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Β«ΠΏΠΎΠ·Π°ΠΈΠΌΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒΒ» Π² Π½Π΅Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰ΠΈΡ… лабораториях. ΠŸΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΌΡ‹ прСдставим HetSeq, Π½ΡƒΠΆΠ½Π° нСбольшая прСдыстория.

Π’ΠΈΠΏΠΎΠ²ΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° ΠΎΠ΄Π½ΠΎΠΌ GPU

Π­Ρ‚ΠΎΡ‚ ΠΊΠΎΠ΄ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ этап обучСния Π±Π°Π·ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ обучСния Π½Π° Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй. Учитывая Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ, эта Π·Π°Π΄Π°Ρ‡Π° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‡Π΅Ρ€Π΅Π· SGD Π½Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ прСдсказанными экзСмплярами ΠΈ наблюдаСмой истиной.

ЀактичСски процСсс обучСния состоит ΠΈΠ· Ρ‡Π΅Ρ‚Ρ‹Ρ€Ρ‘Ρ… ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… этапов: (1) Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…, (2) прямой ΠΏΡ€ΠΎΡ…ΠΎΠ΄, (3) ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄, (4) ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅.

1. Π—Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…

ΠŸΡ€ΠΈ СдинствСнном GPU ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ (ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ случайны) ΠΈ Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΠ΅Ρ€Π΅Π΄Π°ΡŽΡ‚ΡΡ Π½Π° графичСский процСссор, ΠΈ это ΠΏΠ΅Ρ€Π²ΠΎΠ΅, Ρ‡Ρ‚ΠΎ происходит. Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… содСрТит большоС количСство ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… экзСмпляров, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ΡƒΠΌΠ΅Ρ‰Π°ΡŽΡ‚ΡΡ Π½Π° ΠΎΠ΄Π½ΠΎΠΌ графичСском процСссорС. Π’ этом ΠΎΠ±Ρ‰Π΅ΠΌ случаС ΠΌΡ‹ раздСляСм Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° нСсколько ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² ΠΈ Π·Π°Π³Ρ€ΡƒΠΆΠ°Π΅ΠΌ ΠΈΡ… ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ.

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΡ€ΡΠΌΠΎΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ с ΠΎΠ΄Π½ΠΈΠΌ GPU

2. ΠŸΡ€ΡΠΌΠΎΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ шаг β€” вычислСниС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Для этого ΠΏΠ°ΠΊΠ΅Ρ‚ Π΄Π°Π½Π½Ρ‹Ρ… пСрСдаётся Ρ‡Π΅Ρ€Π΅Π· модСль (ΠΎΡ‚ΡΡŽΠ΄Π° ΠΈ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ β€” «прямой ΠΏΡ€ΠΎΡ…ΠΎΠ΄Β») ΠΈ сравниваСтся с ΠΌΠ΅Ρ‚ΠΊΠ°ΠΌΠΈ обучСния наблюдаСмой истины. Π’ Π±Π»ΠΎΠΊΠ΅ прямой ΠΏΡ€ΠΎΡ…ΠΎΠ΄ состоит ΠΈΠ· Π΄Π²ΡƒΡ… этапов: Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ спрогнозированной ΠΌΠ΅Ρ‚ΠΊΠΈ (Π²Ρ‹Π²ΠΎΠ΄) ΠΈ измСрСния Ρ€Π°Π·Π½ΠΈΡ†Ρ‹ (ΠΏΠΎΡ‚Π΅Ρ€ΠΈ) ΠΌΠ΅ΠΆΠ΄Ρƒ Π²Ρ‹Π²ΠΎΠ΄ΠΎΠΌ ΠΈ Ρ†Π΅Π»ΡŒΡŽ.

3. ΠžΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄

ВычислСнная Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΌ шагС потСря опрСдСляСт, насколько Π½ΡƒΠΆΠ½ΠΎ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ; это называСтся Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ примСняСтся ΠΊ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π² ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ (ΠΎΡ‚ΡΡŽΠ΄Π° Π½Π°Π·Π²Π°Π½ΠΈΠ΅ β€” ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄, ΠΈΠ»ΠΈ ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ΅ распространСниС).

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ обновлСния с СдинствСнным GPU

4. ОбновлСниС

ΠŸΠΎΠΌΠ½ΠΈΡ‚Π΅, Ρ‡Ρ‚ΠΎ Ρ†Π΅Π»ΡŒ всСго процСсса β€” ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΈ ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎ Π½ΠΈΠΌ ΠΎΠ½ΠΈ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π²Π°ΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ обновлялись Π² соотвСтствии со значСниями Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π°.

ΠšΡ€Π°Ρ‚ΠΊΠΎΠ΅ описаниС этапов обучСния

Π’ Ρ†Π΅Π»ΠΎΠΌ ΠΎΠ΄Π½Π° итСрация Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, прямой ΠΏΡ€ΠΎΡ…ΠΎΠ΄ ΠΎΠ΄Π½ΠΎΠ³ΠΎ экзСмпляра Π΄Π°Π½Π½Ρ‹Ρ…, Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΎΠ΄Π½ΠΈΠΌ шагом. Как Ρ‚ΠΎΠ»ΡŒΠΊΠΎ всС ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… Π²ΠΎ всСм Π½Π°Π±ΠΎΡ€Π΅ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π°Π½Ρ‹, ΠΌΡ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌ, Ρ‡Ρ‚ΠΎ Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½Π° ΠΎΠ΄Π½Π° эпоха. НаконСц, Π±Ρ‹Π»ΠΎ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ, Ρ‡Ρ‚ΠΎ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния Π΄ΠΎΠ»ΠΆΠ½Π° ΠΈΠ·ΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ ΠΏΠΎ ΠΌΠ΅Ρ€Π΅ увСличСния количСства эпох.

Π§Ρ‚ΠΎ Π΄Π΅Π»Π°Ρ‚ΡŒ, Ссли Ρƒ нас нСсколько GPU?

ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… нСзависимы Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°, довольно просто Ρ€Π°ΡΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΡ‚ΡŒ этот процСсс, ΠΎΡ‚ΠΏΡ€Π°Π²ΠΈΠ² Ρ€Π°Π·Π½Ρ‹Π΅ ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Ρ€Π°Π·Π½Ρ‹Π΅ GPU. Π—Π°Ρ‚Π΅ΠΌ, Ссли ΠΌΡ‹ смоТСм ΠΊΠ°ΠΊΠΈΠΌ-Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ вычислСнныС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΈ ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±Π½ΠΎΠ²Π»Ρ‘Π½Π½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚ΠΎΠ³Π΄Π° получится ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ быстрСС.

Класс ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСния Π΄Π°Π½Π½Ρ‹Ρ…

Π­Ρ‚ΠΎ Π½Π΅ новая идСя. Π’ PyTorch ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ для ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ torch.nn.parallel.DistributedDataParallel (DDP) вмСсто модуля torch.nn.Module. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ GPU β€” это ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ процСсс, ΠΈ связь ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ осущСствляСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ стандартного IPC. Но это Π΅Ρ‰Ρ‘ Π½Π΅ всё. Π§Π΅Ρ‚Ρ‹Ρ€Π΅ шага Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ настройки.

1. Π—Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ DDP

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ DDP ΠΌΡ‹ раздСляСм ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΏΠ°ΠΊΠ΅Ρ‚ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° мноТСство Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… GPU β€” ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ, сколько Ρƒ нас Π΅ΡΡ‚ΡŒ. Π’ этом случаС ΠΎΡ‡Π΅Π½ΡŒ Π²Π°ΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρƒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ графичСского процСссора Π±Ρ‹Π»ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π­Ρ‚ΠΎ основная идСя ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ распрСдСлСния Π΄Π°Π½Π½Ρ‹Ρ… (DDP): ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ GPU ΠΈΠΌΠ΅Π΅Ρ‚ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½ΠΎ ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ….

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΡ€ΡΠΌΠΎΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ с нСсколькими GPU

2. ΠŸΡ€ΡΠΌΠΎΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ с DDP

ПослС Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… Π² Ρ€Π°Π·Π½Ρ‹Π΅ процСссоры ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ шаг β€” Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ прямого ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π° ΠΈ вычислСниС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ случая с ΠΎΠ΄Π½ΠΈΠΌ процСссором Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΎΠ±Ρ‰ΡƒΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŽ всСх ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ сумму всСх ΠΏΠΎΡ‚Π΅Ρ€ΡŒ для всСх процСссоров. ΠŸΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ наша Ρ†Π΅Π»ΡŒ β€” Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΡΡ€Π΅Π΄Π½ΡŽΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŽ для шага Π² ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΌ Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ. Π’Π°ΠΆΠ½ΠΎ Π² ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ вывСсти количСство экзСмпляров (Π²Ρ…ΠΎΠ΄ΠΎΠ²). Π‘ΡƒΠΌΠΌΠΈΡ€ΡƒΠ΅ΠΌ ΠΏΠΎΡ‚Π΅Ρ€ΠΈ, Π° Ρ‚Π°ΠΊΠΆΠ΅ количСство экзСмпляров.

3. ΠžΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ с DDP

ΠœΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ срСдниС ΠΏΠΎΡ‚Π΅Ρ€ΠΈ для получСния Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅. ΠŸΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ Π½Π°Ρ‡Π°Ρ‚ΡŒ, Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡΠΎΠΎΠ±Ρ‰ΠΈΡ‚ΡŒ ΠΎ срСдних потСрях Π½Π° Ρ€Π°Π·Π½Ρ‹Π΅ GPU, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠ³Π»ΠΈ ΠΎΡΡ‚Π°Π²Π°Ρ‚ΡŒΡΡ синхронизированными. Как Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΈ ΠΈ Ρ‚Π΅ ΠΆΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… графичСских процСссорах ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ свои Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹, выполняСтся синхронизация послСдних, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΈ Π±Ρ‹Π»ΠΈ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹.

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

4. ОбновлСниС с DDP

ПослС синхронизации Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½ΠΎ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ процСссорС.

Π‘Π»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ шаг обучСния ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Ρ‡ΠΈΠ½Π°Ρ‚ΡŒ сразу. Однако, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΏΠΎΡ‡Ρ‚ΠΈ всС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Β«ΠΏΠ»Π°Π²Π°ΡŽΡ‚Β» ΠΈ Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… GPU ΠΌΠΎΠΆΠ΅Ρ‚ Π²ΠΎΠ·Π½ΠΈΠΊΠ°Ρ‚ΡŒ ошибка вычислСний, особСнно ΠΊΠΎΠ³Π΄Π° выполняСтся ΠΌΠ½ΠΎΠ³ΠΎ шагов обучСния, ΠΌΡ‹ ΠΈΠ½ΠΎΠ³Π΄Π° синхронизируСм ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π² Π½Π°Ρ‡Π°Π»Π΅ ΠΈΠ»ΠΈ Π² ΠΊΠΎΠ½Ρ†Π΅ шага.

Π­Ρ‚ΠΈ измСнСния ΠΎΡ‚Ρ€Π°ΠΆΠ΅Π½Ρ‹ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ псСвдокодС. ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ρ‡Ρ‚ΠΎ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ устройства (Ρ‚. Π΅. ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ GPU), модСль Π΄ΠΎΠ»ΠΆΠ½Π° Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΏΠ΅Ρ€Π΅Π΄ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ прямым ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΎΠΌ, функция ΠΏΠΎΡ‚Π΅Ρ€ΡŒ Π΄ΠΎΠ»ΠΆΠ½Π° ΡƒΡΡ€Π΅Π΄Π½ΡΡ‚ΡŒΡΡ ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΎΠΌ, ΠΈ, Π½Π°ΠΊΠΎΠ½Π΅Ρ†, Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ усрСднСны ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΌΠΎΠ΄Π΅Π»ΠΈ.

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… GPU

ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ β€” нСсколько ΡƒΠ·Π»ΠΎΠ² с нСсколькими GPU

Π”ΠΎ сих ΠΏΠΎΡ€ ΠΌΡ‹ Π³ΠΎΠ²ΠΎΡ€ΠΈΠ»ΠΈ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ нСсколько GPU Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΡƒΠ·Π»Π΅. Π­Ρ‚ΠΎ Π·Π΄ΠΎΡ€ΠΎΠ²ΠΎ, Π½ΠΎ Π½Π΅ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Ρ‚ Π΄Π°Π»Π΅ΠΊΠΎ. Если ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΏΠΎ-настоящСму ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ, Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‡ΡƒΡŽ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ ΠΌΠ΅ΠΆΠ΄Ρƒ нСсколькими ΡƒΠ·Π»Π°ΠΌΠΈ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΈΠΌΠ΅Π΅Ρ‚ нСсколько процСссоров.

К ΡΡ‡Π°ΡΡ‚ΡŒΡŽ, Ρ‚ΠΎΡ‚ ΠΆΠ΅ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для адрСсации процСссоров Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΡƒΠ·Π»Π΅, ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΠΏΡ€ΠΎΡΡ‚Ρ€Π°Π½ΠΈΡ‚ΡŒ Π½Π° нСсколько ΡƒΠ·Π»ΠΎΠ². Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ просто ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ индСкс ΡƒΠ·Π»Π°, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ rank Π² Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ init_process_group глобально, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ GPU ΠΈΠΌΠ΅Π» ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ всСх ΡƒΠ·Π»ΠΎΠ².

ΠšΠΎΠΌΠΌΡƒΠ½ΠΈΠΊΠ°Ρ†ΠΈΡ β€” Π²ΠΎΡ‚ Π³Π΄Π΅ Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‚ слоТности

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Внутриузловая ΠΈ мСТузловая коммуникация

Когда Ρƒ вас Π΅ΡΡ‚ΡŒ нСсколько ΡƒΠ·Π»ΠΎΠ² с нСсколькими процСссорами, связь Π΄ΠΎΠ»ΠΆΠ½Π° Π±Ρ‹Ρ‚ΡŒ Π½Π°Π»Π°ΠΆΠ΅Π½Π° ΠΌΠ΅ΠΆΠ΄Ρƒ процСссорами Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΡƒΠ·Π»Π΅ ΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ ΡƒΠ·Π»Π°ΠΌΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²ΠΎ врСмя ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ обучСния совмСстно ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ вычислСнныС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ ΠΈ обновлСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ².

ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, мСТузловая связь Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ ΠΌΠ΅Π΄Π»Π΅Π½Π½Π΅Π΅, Ρ‡Π΅ΠΌ внутриузловая. А совмСстноС использованиС Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² прСвращаСтся Π² ΠΏΠΎΠ»Π½Ρ‹ΠΉ бСспорядок, ΠΊΠΎΠ³Π΄Π° ΡƒΠ·Π»Ρ‹ ΠΈ GPU Π½Π΅ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Ρ‹ β€” ΠΊΠ°ΠΊ Π² случаС, ΠΊΠΎΠ³Π΄Π° Ρƒ вас Π½Π΅Ρ‚ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π° Π΄ΠΎΠ»Π»Π°Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡ‚Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π½Π° Ρ†Π΅Π½Ρ‚Ρ€ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… с настраиваСмым Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΎΠ±ΠΎΡ€ΡƒΠ΄ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ.

Когда Ρ€ΠΎΠ΄ΠΈΡ‚Π΅Π»ΠΈ Π·Π°ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ вас Π΄Π΅Π»ΠΈΡ‚ΡŒΡΡ ΠΈΠ³Ρ€ΡƒΡˆΠΊΠ°ΠΌΠΈ

Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ унивСрситСтских Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠ² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΠ΅ Π»Π°Π±ΠΎΡ€Π°Ρ‚ΠΎΡ€ΠΈΠΈ совмСстно ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ свои Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ рСсурсы. Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ это дСлаСтся, Π½ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ИВ-администраторы Π±Π΅Ρ€ΡƒΡ‚ Π½Π° сСбя Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π½Π°Π΄ систСмами ΠΈ Π½Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΡƒΡ‡Ρ‘Π½Ρ‹ΠΌ ΡƒΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°Ρ‚ΡŒ (ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ ΠΈΠ»ΠΈ ΡƒΠ΄Π°Π»ΡΡ‚ΡŒ обновлСния) Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ³ΠΎ обСспСчСния.
Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Ссли Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ модСль, Ρ‚ΠΎ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Π±Π΅Π΄Π½Ρ‹ΠΌ аспирантам Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ привСсти Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ обучСния Π² соотвСтствиС с инфраструктурой. А это слоТно ΠΏΠΎ нСскольким ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π°ΠΌ:

ΠœΡ‹ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌ эту систСму HetSeq. Она Π±Ρ‹Π»Π° Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΈΠ· популярного ΠΏΠ°ΠΊΠ΅Ρ‚Π° PyTorch ΠΈ обСспСчиваСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ обучСния Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Π² Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ³Π΅Π½Π½ΠΎΠΉ инфраструктурС. Π•Ρ‘ ΠΌΠΎΠΆΠ½ΠΎ Π»Π΅Π³ΠΊΠΎ Π½Π°ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Ρ‡Π΅Ρ€Π΅Π· ΠΎΠ±Ρ‰ΡƒΡŽ Ρ„Π°ΠΉΠ»ΠΎΠ²ΡƒΡŽ систСму Π±Π΅Π· Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² ΠΈ административных ΠΏΡ€ΠΈΠ²ΠΈΠ»Π΅Π³ΠΈΠΉ. Π’ΠΎΡ‚ ΠΊΠ°ΠΊ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ BERT с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ HetSeq.

BERT Π² унивСрситСтС с HetSeq

Начнём с Anaconda. Π‘ΠΎΠ·Π΄Π°Π΄ΠΈΠΌ Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½ΡƒΡŽ срСду ΠΈ установим Python.

Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ установим ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ ΠΈ привязки HetSeq: Π·Π°Π³Ρ€ΡƒΠ·ΠΈΠΌ HetSeq с GitHub, установим ΠΏΠ°ΠΊΠ΅Ρ‚Ρ‹ ΠΈΠ· requirements.txt, Π° Ρ‚Π°ΠΊΠΆΠ΅ HetSeq ΠΈ Π±ΠΈΠ½Π΄ΠΈΠ½Π³ΠΈ ΠΈΠ· setup.py.

ПослСдний шаг ΠΏΠ΅Ρ€Π΅Π΄ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ β€” это Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Ρ„Π°ΠΉΠ»ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… BERT, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ корпус обучСния, ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ BPE ΠΎΡ‚ΡΡŽΠ΄Π°. Π—Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚Π΅ DATA.zip, распакуйтС Π΅Π³ΠΎ ΠΈ помСститС Π² ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³ preprocessing/.

ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ BERT с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ HetSeq

ΠšΡ€ΡƒΡ‚Π°Ρ Π²Π΅Ρ‰ΡŒ Π² HetSeq: ΠΎΠ½Π° абстрагируСт всС Π΄Π΅Ρ‚Π°Π»ΠΈ ΠΎ распрСдСлённой ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΊΠΎΠ΄ обучСния для 100 GPU ΠΏΠΎΡ‡Ρ‚ΠΈ Ρ‚Π°ΠΊΠΎΠΉ ΠΆΠ΅, ΠΊΠ°ΠΊ для ΠΎΠ΄Π½ΠΎΠ³ΠΎ! Π”Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ!

Π’ этом случаС ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Ρ‡Ρ‚ΠΎ Ρƒ нас Π΅ΡΡ‚ΡŒ Π΄Π²Π° Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΡƒΠ·Π»Π°.

Π”Π²Π° Π±Π»ΠΎΠΊΠ° ΠΊΠΎΠ΄Π° Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Π½Π° Π΄Π²ΡƒΡ… Ρ€Π°Π·Π½Ρ‹Ρ… ΡƒΠ·Π»Π°Ρ…. АдрСс TCP/IP Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±Ρ‹Ρ‚ΡŒ установлСн ΠΊΠ°ΠΊ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· IP-адрСсов ΡƒΠ·Π»Π°. Как Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ Π·Π°ΠΏΡƒΡ‰Π΅Π½Ρ‹, Π²Ρ‹ смоТСтС Π½Π°Π±Π»ΡŽΠ΄Π°Ρ‚ΡŒ Π·Π° Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ΠΌ ΠΊΠΎΠ΄Π° Π½Π° 8 процСссорах ΠΈ 2 Ρ€Π°Π·Π½Ρ‹Ρ… ΡƒΠ·Π»Π°Ρ…!

Π’Π°ΠΊ насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚? ΠœΡ‹ ΠΏΡ€ΠΎΠ²Π΅Π»ΠΈ нСсколько экспСримСнтов (подробности Ρ‚ΡƒΡ‚) Π½Π°Π΄ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹ΠΌΠΈ (Π³ΠΎΠΌΠΎΠ³Π΅Π½Π½Ρ‹ΠΌΠΈ, hom) ΠΈ Π½Π΅ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹ΠΌΠΈ (Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ³Π΅Π½Π½Ρ‹ΠΌΠΈ, het) установками.

nodesGPUstraining_timespeed_up
147.19day1.00
2(het)84.19day1.72
2(hom)84.26day1.69
4(het)162.23day3.22
4(hom)162.19day3.28
8(het)321.21day5.94

Π’ ΠΎΠ±Ρ‰Π΅ΠΉ слоТности ΠΌΡ‹ смогли ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ 32 GPU Π² 8 Π½Π΅ΠΎΠ΄Π½ΠΎΡ€ΠΎΠ΄Π½Ρ‹Ρ… ΡƒΠ·Π»Π°Ρ…, сокращая врСмя обучСния языковой ΠΌΠΎΠ΄Π΅Π»ΠΈ BERT с сСми Π΄Π½Π΅ΠΉ Π΄ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ ΠΎΠ΄Π½ΠΎΠ³ΠΎ дня.

Под ΠΊΠ°ΠΏΠΎΡ‚ΠΎΠΌ HetSeq

big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ big data машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° HetSeq

ΠŸΠ°ΠΊΠ΅Ρ‚ HetSeq содСрТит Ρ‚Ρ€ΠΈ основных модуля, ΠΏΠΎΠΊΠ°Π·Π°Π½Π½Ρ‹Ρ… Π½Π° рисункС слСва: train.py, task.py ΠΈ controller.py для ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ†ΠΈΠΈ основных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ², ΠΏΠΎΠΊΠ°Π·Π°Π½Π½Ρ‹Ρ… справа. ΠœΠΎΠ΄ΡƒΠ»ΡŒ train.py ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½ΡƒΡŽ систСму ΠΈ Π΅Ρ‘ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹.

ΠœΠΎΠ΄ΡƒΠ»ΡŒ task.py опрСдСляСт Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π·Π°Π³Ρ€ΡƒΠ·Ρ‡ΠΈΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Π°; ΠΎΠ½ Ρ‚Π°ΠΊΠΆΠ΅ выполняСт Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ прямого ΠΈ ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠ³ΠΎ распространСния. ΠœΠΎΠ΄ΡƒΠ»ΡŒ controller.py дСйствуСт ΠΊΠ°ΠΊ Π³Π»Π°Π²Π½Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»Π»Π΅Ρ€ обучСния. Он Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΊΠ°ΠΊ модСль, ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ ΠΈ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ скорости обучСния; Π·Π°Π³Ρ€ΡƒΠΆΠ°Π΅Ρ‚ ΠΈ сохраняСт Ρ‡Π΅ΠΊΠΏΠΎΠΈΠ½Ρ‚Ρ‹, сообщаСт ΠΎ ΠΏΠΎΡ‚Π΅Ρ€Π΅ ΠΈ обновляСт ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹.
Но я Ρ…ΠΎΡ‡Ρƒ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅ BERT!

Но я Ρ…ΠΎΡ‡Ρƒ ΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π΅ BERT!

НСт ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ. Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ HetSeq с любой Π΄Ρ€ΡƒΠ³ΠΎΠΉ модСлью. Но Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½ΠΎΠ²ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ с ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΉ модСлью, Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€ΠΎΠΌ. ΠΈ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊΠΎΠΌ скорости обучСния. Π•ΡΡ‚ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ MNIST со всСми Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½Π½Ρ‹ΠΌΠΈ классами. ΠŸΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½Ρ‹Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ‚ΠΎΡ€Ρ‹, ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊΠΈ скорости обучСния, Π½Π°Π±ΠΎΡ€Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ Π² Π΄Ρ€ΡƒΠ³ΠΈΡ… прилоТСниях. Для получСния Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΡŒΡ‚Π΅ΡΡŒ с ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠΌ HetSeq ΠΈ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΠ΅ΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *