Dè a tha k-a 'ciallachadh stòrasachadh?

Tha mèinneadh dàta leis an algairim k-a 'ciallachadh

Tha an k- a ' ciallachadh algorithm cnuimheachadh na mèinneadh dàta agus inneal ionnsachaidh innealan a thathar a' cleachdadh gus beachdan a chruinneachadh ann am buidhnean de bheachdan co-cheangailte gun eòlas ro-làimh air na dàimhean sin. Le samplachadh, bidh an algorithm a 'feuchainn ri nochdadh anns an roinn, no cluster, a tha aig an dàta, leis an àireamh de bhualaidhean a tha air am mìneachadh leis an luach k.

Is e an algairim k- aon de na dòighean co-chòrdaidh as sìmplidh agus tha e gu tric air a chleachdadh ann an ìomhaighean meidigeach, bith-innealan agus raointean co-cheangailte. Is e a 'bhuannachd a th' ann an k- ciallachadh gum bi e ag innse mun fhiosrachadh agad (a 'cleachdadh an fhoirm gun stiùir) an àite a bhith ag iarraidh an algorithm a stiùireadh mun dàta aig a' chiad dol a-mach (a 'cleachdadh foirm stiùiridh an algairim).

Thathar a 'toirt iomradh air uaireannan mar Algorithm Lloyd, gu h-àraid ann an cearcallan saidheans coimpiutair oir chaidh an algorithm àbhaisteach a mholadh le Stuart Lloyd an toiseach ann an 1957. Chaidh an abairt "k-means" a chosnadh ann an 1967 le Seumas McQueen.

Mar a tha an k-a 'ciallachadh Gnìomhan Algorithm

Tha an algairim k- a ' ciallachadh algorithm adhartach a tha a' faighinn a h-ainm bhon dòigh obrach aige. Bidh na h-algorithm a 'toirt sùil air buidhnean k , far a bheil k air a thoirt seachad mar parameter ionmhas. Bidh e an uairsin a 'sònrachadh gach beachd gu clubaichean a tha stèidhichte air cho faisg agus a tha iad a' coimhead ri meanbh-chuileagan. Tha brìgh a 'chnuimhe an uairsin air ath-chuideachadh agus bidh am pròiseas a' tòiseachadh a-rithist. Seo mar a tha an algairim ag obair:

  1. Bidh an algorithm a 'taghadh gu h-obann puingean k mar na ciad ionadan cluster (na dòighean).
  2. Tha gach puing anns an t-siostam-dàta air a shònrachadh don cho-bhanca dùinte, stèidhichte air astar Euclidean eadar gach puing agus gach ionad cluster.
  3. Tha gach ionad cluster air a chleachdadh mar chuibheasachd nan puingean anns a 'chluba sin.
  4. Bidh ceumannan 2 agus 3 a 'dol a-rithist gus am bi na clubaichean a' tighinn còmhla. Faodar co-rèiteachadh a mhìneachadh ann an dòigh eadar-dhealaichte a rèir a 'bhuileachadh, ach mar as trice tha e a' ciallachadh nach bi beachdan sam bith ag atharrachadh bhratagan nuair a thèid ceumannan 2 agus 3 ath-aithris, no nach eil na h-atharrachaidhean a 'dèanamh eadar-dhealachadh susbainteach anns a' mhìneachadh air na geamaichean.

A 'taghadh àireamh nan gèamaichean

Is e aon de na prìomh eas-bhuannachdan a thaobh k- ciallachadh bacadh a bhith ann gum feum thu àireamh nan clubaichean a chomharrachadh mar chuideachadh don algorithm. Mar a chaidh a dhealbhadh, chan eil an algairim comasach air a bhith a 'dearbhadh an àireamh iomchaidh de bhùthan-obrach agus tha e an urra ris an neach-cleachdaidh seo a chomharrachadh ro làimh.

Mar eisimpleir, nam biodh buidheann de dhaoine agad a tha gu bhith stèidhichte air an dearbh-aithne gnèitheach mar fhear no boireann, a 'gairm gu bheil algairim k- a ' cleachdadh an ionaid k = 3 a 'toirt na daoine a-steach do thrì bhualaidhean nuair nach biodh ach dà, no steach de k = 2, a 'toirt a-steach freagarrachd nas nàdarra.

Mar an ceudna, ma bha buidheann de dhaoine fa leth air an cruinneachadh le stàite dachaigh agus an t-ainm a th 'air an algorithm k - k leis an toradh k = 20, dh'fhaodadh na toraidhean a bhith ro choitcheann airson a bhith èifeachdach.

Air an adhbhar seo, is e deagh bheachd a th 'ann gu tric feuchainn ri luachan eadar-dhealaichte de k gus an luach as fheàrr a fhreagras air an dàta agad a chomharrachadh. Is dòcha gum bi thu cuideachd airson sgrùdadh a dhèanamh air cleachdadh algorithm mèinnearachd dàta eile anns a 'cheis agad airson eòlas air innealan ionnsachadh.