Kio estas k-signifas Kalkulado?

Datuma minado kun la k-signifa algoritmo

La k- ( meznombroj, meznombras, signifas) agordanta algoritmo estas datuma minado kaj maŝin-ilo uzita por agordi observojn en grupoj de rilataj observoj sen antaŭa scio de tiuj rilatoj. Per specimeno, la algoritmo provas montri en kiu kategorio, aŭ raketo, la datumoj apartenas al, kun la nombro da grupoj kiujn difinas la valoro k.

La k- ( meznombroj, meznombras, signifas) algoritmo estas unu el la plej simplaj grupaj teknikoj kaj ĝi estas kutime uzita en medicinaj bildoj, biometrikoj kaj rilataj kampoj. La avantaĝo de k- signifas agordado estas ke ĝi rakontas pri viaj datumoj (uzante sian nekontervitan formon) prefere ol vi devos instrui la algoritmon pri la datumoj al la komenco (uzante la kontrolitan formon de la algoritmo).

Ĝi estas iam nomata kiel Algoritmo de Lloyd, precipe en komputikaj cirkloj ĉar la norma algoritmo estis unue proponita de Stuart Lloyd en 1957. La termino "k-rimedoj" estis stampita en 1967 fare de James McQueen.

Kiel la k-signifas Algoritmo-Funkcioj

La k- ( meznombroj, meznombras, signifas) algoritmo estas evolua algoritmo kiu gajnas ĝian nomon de ĝia metodo de operacio. La algoritmo kolektas observojn en k- grupoj, kie k estas provizita kiel enmeta parametro. Ĝi tiam atribuas ĉiun observon al grupoj en funkcio de la proksimeco de la observado al la meznombro de la grupo. La meznombro de la racimo estas tiam rekompencita kaj la procezo denove komencas. Jen kiel la algoritmo funkcias:

  1. La algoritmo arbitre elektas k- punktojn kiel la komencaj raketoj (la rimedoj).
  2. Ĉiu punkto en la datumaro estas atribuita al la fermita racimo, bazita sur la Eŭklida distanco inter ĉiu punkto kaj ĉiu grupa centro.
  3. Ĉiu grupa centro estas rekompencita kiel la mezumo de la punktoj en tiu grupo.
  4. Paŝoj 2 kaj 3 ripetas ĝis la raketoj konverĝas. Konverĝo povas esti difinita malsame laŭ la efektivigo, sed ĝi kutime signifas, ke aŭ neniu observo ŝanĝas grupojn kiam ripetiĝas paŝoj 2 kaj 3, aŭ ke la ŝanĝoj ne fariĝas diferenca materialo en la difino de la grupoj.

Elektante la Nombro de Kalkuloj

Unu el la ĉefaj malavantaĝoj al k- signifas agordado estas la fakto, ke vi devas specifi la nombron de grupoj kun enigo al la algoritmo. Kiel desegnita, la algoritmo ne kapablas determini la taŭgan nombron de grupoj kaj dependas de la uzanto identigi tion antaŭen.

Ekzemple, se vi havus grupon de homoj, kiuj devas esti kolektitaj laŭbaze de binara seksa identeco kiel viro aŭ virino, nomante la k- signifas algoritmo per la enigo k = 3 devigos la homojn en tri grupojn kiam nur du, aŭ enigo de k = 2, havus pli natura ĝustigita.

Simile, se grupo de individuoj facile kolektiĝis bazita sur hejma stato kaj vi nomis la k- signifas algoritmon kun la enigo k = 20, la rezultoj povus esti tro ĝeneraligitaj por esti efikaj.

Tial, ofte estas bona ideo eksperimenti kun malsamaj valoroj de k por identigi la valoron, kiu plej taŭgas al viaj datumoj. Vi ankaŭ eble volas esplori la uzadon de aliaj datumoj pri minindustriaj algoritmoj en via serĉo pri maŝinaj scioj.