Што і як трэба вучыцца, каб стаць аналітыкам дадзеных / навукоўцам дадзеных? Ці ёсць розніца паміж імі?


адказ 1:

Асабліва гэта тычыцца такіх тэхналогій, як навука дадзеных, машыннае навучанне і AI, якія выкарыстоўваліся, залішне выкарыстоўваліся і часам раскрываліся для дасягнення маркетынгавых мэтаў. Важна разумець, што гэтыя палі перакрываюцца, але не з'яўляюцца ўзаемазаменнымі.

Кажучы простай мовай: навука дадзеных стварае разуменне, а машыннае навучанне стварае прагнозы. ІІ, з іншага боку, стварае дзеянні.

Уяўленне аб навуцы дадзеных

Навука аб даных - адна з лепшых дысцыплін для атрымання розных відаў разумення - апісальнага, эксперыментальнага, інфекцыйнага, выпадковага, прадказальнага і механістычнага. Навука аб даных ўключае статыстычныя высновы, планаванне эксперыментаў, распрацоўку праграмнага забеспячэння, візуалізацыю дадзеных, пэўныя веды аб дамене і эфектыўную сувязь.

Што адрознівае навуку дадзеных ад сумежных абласцей, такіх як машыннае навучанне і ІІ, гэта неабходнасць удзелу чалавека ў цыкле. Заўсёды неабходна, каб хто-небудзь разумеў разуменне, разумеў графіку і лічбы і прымаў пераканаўчыя рашэнні, абапіраючыся на атрыманыя ад іх ідэі.

Надзейныя прагнозы машыннага навучання

Машыннае навучанне гарантуе, што прагнозы вялікай колькасці сабраных дадзеных з'яўляюцца максімальна дакладнымі. Навука дадзеных і машыннае навучанне моцна перасякаюцца. Напрыклад, лагістычная рэгрэсія выкарыстоўваецца як у навуцы дадзеных, так і ў машынным навучанні. Аднак у навуцы дадзеных ён выкарыстоўваецца для атрымання разумення ўзаемасувязі паміж рознымі фактарамі, у той час як дае прагнозы ў машынным навучанні.

Эксперты галіны часта пераключаюцца паміж дзвюма дысцыплінамі, а навукоўцы дадзеных часта выкарыстоўваюць машыннае навучанне. Напрыклад, у дадатку для электроннага навучання дадзеныя аб трафіку могуць быць змадэляваны, каб вызначыць, якія кліенты могуць шукаць той ці іншы прадукт. Гэта дадатак машыннага навучання. Калі рэзюмэ і візуалізацыі ствараюцца на аснове трафіку, гэта дадатак навукі аб даных.

Аўтаматызаваць дзеянні са штучным інтэлектам

У ІІ камп'ютэрах вучаць чалавечаму кагнітыўнаму інтэлекту. Любая машына, якая разумна выконвае задачу ці дзеянне з выкарыстаннем алгарытмаў, павінна выкарыстоўваць AI. Важным адрозненнем паміж ІІ і дзвюма іншымі дысцыплінамі з'яўляецца частка "дзеяння". AI шырока выкарыстоўваецца ў робататэхніцы, тэорыі кіравання, алгарытмах гульняў, ботах і навучанні падмацавання.

Разгледзім аналіз дадзеных кліентаў для канкрэтнага прадукту. Дапусцім, што пэўныя кліенты, верагодна, купляюць больш, чым іншыя (разуменне). Атрымліваюцца лічбавыя і графічныя вынікі, якія дазваляюць кіраўнікам рабіць прагнозы і / або рабіць высновы. Аднак гэта не павінна прывесці да канкрэтных дзеянняў. Гэта было б дадаткам да навукі дадзеных з сумессю машыннага навучання, але не ІІІ.

Спалучэнне навукі дадзеных, машыннага навучання і AI

Дапусцім, што ўбудаваны тэрмарэгулятар з функцыямі самарэгулявання. Тры тэхналогіі могуць быць выкарыстаны наступным чынам:

  1. Машыннае навучанне: вялікі набор дадзеных экалагічных значэнняў для распрацоўкі алгарытму, які прадказвае патрэбныя тэмпературныя дыяпазоны і прыводзіць да фіксаванага значэння. Штучны інтэлект: як толькі выканана пэўная экалагічная ўмова, тэрмарэгулятар ажыццяўляе аўтаматызаванае дзеянне - адаптацыю да фіксаванага значэння тэмпературы з адпаведнай вобласці.

Навука дадзеных: Тэсты з тэрмастатам часам выяўляюць, што тэмпература не падыходзіць людзям у іх дамах, асабліва рана раніцай. Вывучыўшы дадзеныя тэстаў, атрыманы веды аб тым, што розныя тэмпературы цела не ўлічваліся. Таму неабходна стварыць больш якасны набор дадзеных, які змяшчае дадзеныя аб тэмпературы цела. Затым увесь працэс паўтараецца.

Для тых, хто зацікаўлены, я магу адправіць ліст на [email protected]