У чым галоўная розніца паміж праблемамі класіфікацыі і праблемамі рэгрэсіі ў машынным навучанні?


адказ 1:

У абодвух выпадках дадзеныя жывуць у пэўнай зале. Мэтай рэгрэсіі з'яўляецца пошук паверхняў у гэтай прасторы, якія найбольш адпавядаюць агульнаму распаўсюджванню дадзеных. Гэтыя паверхні могуць быць выкарыстаны для прагназавання таго, дзе можа існаваць новая дата. Мэтай класіфікацыі з'яўляецца пошук паверхняў, якія лепш аддзяляюць розныя кластары дадзеных. Гэтыя "абмежаванні рашэння" потым дазваляюць адрозніваць класы дадзеных і класіфікаваць кожную новую дату.


адказ 2:

Хоць класіфікацыя і рэгрэсія групуюцца пад адной дахам кіраванага машыннага навучання і падзяляюць агульную канцэпцыю выкарыстання больш ранніх дадзеных для прагнозаў і прыняцця рашэнняў, іх падабенства заканчваецца тут.

Патлумачу на прыкладзе:

Вы ніколі не задумваліся, як Gmail можа адсартаваць што-небудзь як спам ці не як спам?

За гэтым працэсам - навучыць мадэль ідэнтыфікацыі ўваходнай электроннай пошты, навучаючы яе з мільёнамі лістоў, якія ўжо былі ідэнтыфікаваны як спам ці іншым чынам. Для класіфікацыі электроннай пошты як спаму ўлічваюцца наступныя моманты:

  1. Паказвае, ці ўтрымлівае электронны ліст такія тэрміны, як "латарэя". Ці былі адрасаваныя электроннай поштай спамы карыстальнікамі. Як часта яны атрымліваюцца

КЛАСЫФІКАЦЫЯ

З гэтымі лістамі мадэль зараз навучаецца ідэнтыфікаваць новыя лісты.

Вось малюнак працэсу:

Пасля таго, як сістэма навучыцца ідэнтыфікаваць паведамленні, новыя паведамленні, якія паступаюць у вашу паштовую скрыню, аўтаматычна класіфікуюцца як спам альбо не як спам.

У выпадку праблем з класіфікацыяй элементы павінны быць падзелены на розныя катэгорыі на аснове папярэдніх дадзеных. У пэўным сэнсе мы вырашаем праблему "так / не". Ці адпавядае нешта патрабаваным стандартам, альбо парушана гэта, альбо не, і гэтак далей.

Рэгрэсія

У выпадку праблемы з рэгрэсіяй зараз сістэма спрабуе прадказаць значэнне ўводу на аснове папярэдніх дадзеных. У адрозненне ад класіфікацыі, мы прагназуем значэнне, заснаванае на папярэдніх дадзеных, а не класіфікаваць яго на розныя катэгорыі.

Выкажам здагадку, што вы хацелі прадказаць, ці будзе дождж, і, калі так, то колькі дажджоў вы атрымаеце.

Верагоднасць таго, колькі дажджоў мы б сёння атрымалі, можна вылічыць, вымяраючы іншыя фактары надвор'я, такія як тэмпература, вільготнасць, ціск, хуткасць ветру і кірунак ветру, а затым вызначыўшы, як яны карэлююць з дажджом у мінулым. Калі вымярэнні, праведзеныя сёння, моцна карэлююць з дажджлівымі днямі, то шанцы на тое, што сёння будзе дождж, высокія.

Я спадзяюся, што гэта дапаможа вам зразумець. Калі вы хочаце даведацца больш пра машыннае навучанне і атрымаць паглыбленыя веды, прачытайце нашу падрыхтоўку па сертыфікацыі машыннага навучання.


адказ 3:

Хоць класіфікацыя і рэгрэсія групуюцца пад адной дахам кіраванага машыннага навучання і падзяляюць агульную канцэпцыю выкарыстання больш ранніх дадзеных для прагнозаў і прыняцця рашэнняў, іх падабенства заканчваецца тут.

Патлумачу на прыкладзе:

Вы ніколі не задумваліся, як Gmail можа адсартаваць што-небудзь як спам ці не як спам?

За гэтым працэсам - навучыць мадэль ідэнтыфікацыі ўваходнай электроннай пошты, навучаючы яе з мільёнамі лістоў, якія ўжо былі ідэнтыфікаваны як спам ці іншым чынам. Для класіфікацыі электроннай пошты як спаму ўлічваюцца наступныя моманты:

  1. Паказвае, ці ўтрымлівае электронны ліст такія тэрміны, як "латарэя". Ці былі адрасаваныя электроннай поштай спамы карыстальнікамі. Як часта яны атрымліваюцца

КЛАСЫФІКАЦЫЯ

З гэтымі лістамі мадэль зараз навучаецца ідэнтыфікаваць новыя лісты.

Вось малюнак працэсу:

Пасля таго, як сістэма навучыцца ідэнтыфікаваць паведамленні, новыя паведамленні, якія паступаюць у вашу паштовую скрыню, аўтаматычна класіфікуюцца як спам альбо не як спам.

У выпадку праблем з класіфікацыяй элементы павінны быць падзелены на розныя катэгорыі на аснове папярэдніх дадзеных. У пэўным сэнсе мы вырашаем праблему "так / не". Ці адпавядае нешта патрабаваным стандартам, альбо парушана гэта, альбо не, і гэтак далей.

Рэгрэсія

У выпадку праблемы з рэгрэсіяй зараз сістэма спрабуе прадказаць значэнне ўводу на аснове папярэдніх дадзеных. У адрозненне ад класіфікацыі, мы прагназуем значэнне, заснаванае на папярэдніх дадзеных, а не класіфікаваць яго на розныя катэгорыі.

Выкажам здагадку, што вы хацелі прадказаць, ці будзе дождж, і, калі так, то колькі дажджоў вы атрымаеце.

Верагоднасць таго, колькі дажджоў мы б сёння атрымалі, можна вылічыць, вымяраючы іншыя фактары надвор'я, такія як тэмпература, вільготнасць, ціск, хуткасць ветру і кірунак ветру, а затым вызначыўшы, як яны карэлююць з дажджом у мінулым. Калі вымярэнні, праведзеныя сёння, моцна карэлююць з дажджлівымі днямі, то шанцы на тое, што сёння будзе дождж, высокія.

Я спадзяюся, што гэта дапаможа вам зразумець. Калі вы хочаце даведацца больш пра машыннае навучанне і атрымаць паглыбленыя веды, прачытайце нашу падрыхтоўку па сертыфікацыі машыннага навучання.


адказ 4:

Хоць класіфікацыя і рэгрэсія групуюцца пад адной дахам кіраванага машыннага навучання і падзяляюць агульную канцэпцыю выкарыстання больш ранніх дадзеных для прагнозаў і прыняцця рашэнняў, іх падабенства заканчваецца тут.

Патлумачу на прыкладзе:

Вы ніколі не задумваліся, як Gmail можа адсартаваць што-небудзь як спам ці не як спам?

За гэтым працэсам - навучыць мадэль ідэнтыфікацыі ўваходнай электроннай пошты, навучаючы яе з мільёнамі лістоў, якія ўжо былі ідэнтыфікаваны як спам ці іншым чынам. Для класіфікацыі электроннай пошты як спаму ўлічваюцца наступныя моманты:

  1. Паказвае, ці ўтрымлівае электронны ліст такія тэрміны, як "латарэя". Ці былі адрасаваныя электроннай поштай спамы карыстальнікамі. Як часта яны атрымліваюцца

КЛАСЫФІКАЦЫЯ

З гэтымі лістамі мадэль зараз навучаецца ідэнтыфікаваць новыя лісты.

Вось малюнак працэсу:

Пасля таго, як сістэма навучыцца ідэнтыфікаваць паведамленні, новыя паведамленні, якія паступаюць у вашу паштовую скрыню, аўтаматычна класіфікуюцца як спам альбо не як спам.

У выпадку праблем з класіфікацыяй элементы павінны быць падзелены на розныя катэгорыі на аснове папярэдніх дадзеных. У пэўным сэнсе мы вырашаем праблему "так / не". Ці адпавядае нешта патрабаваным стандартам, альбо парушана гэта, альбо не, і гэтак далей.

Рэгрэсія

У выпадку праблемы з рэгрэсіяй зараз сістэма спрабуе прадказаць значэнне ўводу на аснове папярэдніх дадзеных. У адрозненне ад класіфікацыі, мы прагназуем значэнне, заснаванае на папярэдніх дадзеных, а не класіфікаваць яго на розныя катэгорыі.

Выкажам здагадку, што вы хацелі прадказаць, ці будзе дождж, і, калі так, то колькі дажджоў вы атрымаеце.

Верагоднасць таго, колькі дажджоў мы б сёння атрымалі, можна вылічыць, вымяраючы іншыя фактары надвор'я, такія як тэмпература, вільготнасць, ціск, хуткасць ветру і кірунак ветру, а затым вызначыўшы, як яны карэлююць з дажджом у мінулым. Калі вымярэнні, праведзеныя сёння, моцна карэлююць з дажджлівымі днямі, то шанцы на тое, што сёння будзе дождж, высокія.

Я спадзяюся, што гэта дапаможа вам зразумець. Калі вы хочаце даведацца больш пра машыннае навучанне і атрымаць паглыбленыя веды, прачытайце нашу падрыхтоўку па сертыфікацыі машыннага навучання.