MyndunFramhaldsskólanám og skólum

Næsta nágranni aðferð: dæmi um vinnu

Næsta nágranni aðferð er einfaldasta mæling flokkar sem byggist á mati á líkt mismunandi hlutum.

Greind hlut tilheyrir flokki sem þeir tilheyra einstaklingum af sýninu þjálfun. Leyfðu okkur að finna út hver er næstur. Reyndu að skilja flókið mál, dæmi um mismunandi aðferðir.

tilgátu aðferð

Næsta nágranni aðferð getur talist algengustu reiknirit notað til flokkunar. Object gangast flokkun tilheyrir flokki y_i, sem næst hlutur læra x_i sýnishorn.

Sértæki aðferðir næstu nágranna

k næstur aðferð geta bætt nákvæmni flokkun. Greind hlut tilheyrir sama flokki og megnið af nágranna sína, það er, k nærri það hluti af greind sýni x_i. Í að leysa vandamál með tvo flokka fjölda nágranna verður skrýtið að koma í veg fyrir aðstæður á tvíræðni, ef sami fjöldi nágranna mun tilheyra mismunandi flokkum.

The tækni á bið nágranna

PostgreSQL-greind aðferð tsvector Næsta nágranna er notað þegar fjöldi flokka amk þremur, og þú getur ekki notað oddatala. En tvíræðni kemur jafnvel í þessum tilvikum. Þá er i-ta nágranni fær w_i þyngd, sem minnkar með náunga stöðu i. Það vísar á bekknum af hlutnum, sem mun hafa hámarks heildar þyngd meðal loka nágranna.

Tilgáta compactness

Í hjarta allra ofangreindra aðferða er tilgáta compactness. Það bendir á tengingu milli mælikvarði á líkt hlutum og tilheyra þeirra í sama flokki. Í þessu ástandi, sem mörkin milli mismunandi gerðir er einfalt form og búa til flokka af hlutum í geimnum samningur farsíma svæði. Undir slíkum svæðum í stærðfræðigreiningu tekið að þýða lokaður afmarkast sett. Þessi tilgáta er ekki í tengslum við daglegu skynjun þess orðs.

Grunn uppskrift

Við skulum skoða meira næstu nágranna. Ef tillaga þjálfun sýnið tegund "hlut-svar» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; ef flöldi hlutum til að skilgreina fjarlægð virka \ Rho (x, X '), sem er táknuð á formi fullnægjandi líkan svipaðs af hlutum með því að auka verðmæti skerðist líkt á milli hluta x, x'.

Fyrir hvaða hlut, u verður að byggja upp þjálfun sýnishorn hluti x_i með vaxandi fjarlægð til u:

\ Rho (u, x_ {1; u}) \ Leq \ Rho (u, x_ {2; u}) \ Leq \ cdots \ Leq \ Rho (u, x_ {m; u}),

þar sem x_ {I; u} einkennir hlut læra sýni, sem er i-ta nágranni fengið hlut u. Slík merki og að nota til að svara i-ta náungans: y_ {I; u}. Þess vegna finnum við að allir mótmæla u vekur renumbering eigin sýnishorn.

Ákvörðun um fjölda k nágranna

Næsta nágranni aðferð þegar k = 1 er fær um að gefa rangra flokkun, ekki aðeins á hluti-losun, heldur einnig fyrir aðra flokka sem eru nálægt.

Ef við tökum k = m, reiknirit vilja vera eins stöðugt og mun margföld í föstu gildi. Það er ástæðan fyrir áreiðanleika er mikilvægt að koma í veg fyrir Extreme vísitölur k.

Í reynd, eins ákjósanlegur vísitalan K notuð viðmiðun renna stjórn.

sýningar losun

The hluti af rannsókn eru að mestu ójöfn, en meðal þeirra eru þeir sem hafa einkenni flokki og er vísað til sem stöðlum. Á nálægð við efni til hugsjón líkan af miklum líkum á að tilheyra þessum flokki.

Hvernig rezultativen aðferð við næstu nágranna? Dæmi má á grundvelli útlæga og ekki fræðandi flokka af hlutum. Gert er ráð fyrir þétt umhverfi hlutarins aðra fulltrúa í þessum flokki. Þegar þú fjarlægir þá frá flokkun sýnatöku gæði mun ekki þjást.

Fá inn ákveðinn fjölda af sýnum kann hávaði springur sem eru "á vettvangi" á bekknum. Fjarlægi verulega jákvæð áhrif á gæði flokkun.

Ef sýnið tekið úr uninformative og útrýma hávaða hlutum, getur þú treyst á nokkrum jákvæðum niðurstöðum á sama tíma.

Fyrsti innskot aðferð við næsta náunga flokkun leyfa að bæta gæði, draga úr the magn af birgðir gögn, draga úr þeim tíma flokkun, sem er varið í vali á næstu stöðlum.

Notkun Ultra-fjöldi í úrtak

Næsta nágranni aðferð byggist á raunverulegum geymslu læra hluti. Til að búa til mjög stórum stíl sýni með því að nota tæknileg vandamál. Markmiðið er ekki bara til að spara umtalsvert magn af upplýsingum, en einnig í lágmarki tíma til að hafa tíma til að finna hvaða hlut u k meðal nánustu nágranna.

Til að takast á við þetta verkefni, eru tvær aðferðir notaðar:

  • þynna sýni gegnum afsogsröri utan gagnahlutum;
  • Skilvirk notkun sérstakt gagnagrind og kóðar fyrir augnablik leit að næstu nágranna.

Reglur um aðferðir við val

Ofangreind flokkun var talið. Næsta nágranni aðferð er notuð í að leysa hagnýt vandamál, sem er þekkt fyrirfram fjarsölu virka \ Rho (x, x '). Lýsa hlutum tölugildi vektorar nota Euclidean mæligildi. Þetta val hefur enga sérstaka réttlætingu, en felur í sér mælingu á öllum merkjum "í sama mæli." Ef þessi þáttur er ekki tekið tillit til, þá mæling mun yfirgnæfandi eiginleiki sem hefur hæstu talnagildi.

Ef það er mikið magn af lögun, reikna fjarlægð eins summu frávikanna á sérstökum einkennum birtast alvarleg vandamál vídd.

Í mikilli víddar rúm langt frá hvert öðru með alla hluti. Á endanum, allir sýni verður við hliðina á hlut að rannsakað k nágranna. valið fáeinum upplýsandi aðgerðir til að koma í veg fyrir þetta vandamál. Reiknirit til að reikna út mat byggt á grundvelli mismunandi sett af merkjum, og fyrir hvern einstakling byggja nálægðar hlutverki sínu.

niðurstaða

Útreikninga taka oft notkun á ýmsum aðferðum sem hafa eigin sérstaka þeirra einkenni, kosti og galla. Skoðað næstur aðferð getur leyst nokkuð alvarlegt vandamál, vegna eiginleika stærðfræðilegra hluta. Tilrauna hugtak, byggt á aðferð greinda er virkur notaður í gervigreind.

Í sérfræðingur kerfi það er nauðsynlegt ekki bara að flokka hluti, en einnig sýna notandanum skýringu á flokkun sem um ræðir. Í þessari aðferð, skýringu á þessu fyrirbæri eru gefin í tengslum við hlut tiltekins flokks auk staðsetningu þess miðað við sýninu er notað. Legal iðnaður sérfræðingar, jarðfræðingar, læknar, taka þetta "fordæmi" rökfræði virkan nota það í rannsóknum sínum.

Í því skyni að greina aðferð var áreiðanlegur, duglegur, sem gefur tilætluðum árangri, verður þú að taka að lágmarki tala k, en einnig forðast losun meðal greind hlutum. Þess vegna er notkun á stöðlum og val aðferð, sem og hagræðingu tölfræði.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 is.atomiyme.com. Theme powered by WordPress.