Dè tha dìreach 'Dàta Mòr'?

Agus carson a tha e na Big Deal?

Is e 'dàta mòr' an saidheans ùr mu thuigse agus a 'ro-innse giùlan daonna le bhith a' sgrùdadh mhòran mòra de dhàta neo-structaraichte. Is e 'analytics predictive' cuideachd a th 'air dàta mòr.

Tha mion-sgrùdadh air postan Twitter, feeds Facebook, rannsachaidhean eBay, luchd-rianachd GPS, agus innealan ATM cuid de dh'obraichean dàta mòra. A 'sgrùdadh bhideothan tèarainteachd, dàta trafaig, pàtranan aimsir, itealan a-steach, logaichean tùir fòn cealla, agus crèadhairean reata cridhe na riochdan eile. Tha dàta mòr na saidheans ùr teachdaireil a bhios ag atharrachadh gach seachdain, agus chan eil ach beagan eòlaichean ga thuigsinn.

Dè a th 'ann an cuid de na h-eisimpleirean de dhàta mòr ann am beatha làitheil?

screenshot http://project.wnyc.org/transit-time

Ged a tha a 'mhòr-chuid de phròiseactan dàta fìor chinnteach, tha eisimpleirean soirbheachail ann de dhàta mòr a bheir buaidh air beatha làitheil dhaoine, chompanaidhean agus riaghaltasan:

Tha briseadh a 'bhìoras a' nochdadh: le bhith a 'sgrùdadh dàta sòisio-phoilitigeach, dàta sìde agus clìomaid, agus dàta ospadail / clionaigeach, tha na saidheansan sin a-nis a' toirt a-mach a-mach às a 'bhriseadh dengue le 4 seachdainean ro-làimh.

Watch Homicide: tha am pròiseact dàta mòr seo a 'toirt cunntas air luchd-fulaing a' mhurt, luchd-amhairc agus eucoirich ann an Washington, DC. Tha an dà chuid mar dhòigh air urram a thoirt don neach a chaochail agus mar ghoireas mothachaidh do dhaoine, tha am pròiseact data mòr seo inntinneach.

Transit Travel Planning, NYC: Rinn am prògramadair rèidio WNYC, Steve Melendez, clàr-ama subway air-loidhne le bathar-bog itealain siubhail. Le bhith a 'cruthachadh le New Yorkers, briog air an àite aca air a' mhapa, agus nochdaidh àm siubhail ro-làimh airson trèanaichean agus subway.

Lùghdaich Xerox an call an luchd-obrach: tha obair a 'chonaltraidh a' faireachdainn gu faireachdainneil. Tha Xerox air sgrùdaidhean de dhàta a sgrùdadh le cuideachadh bho anailísichean proifeasanta, agus a-nis is urrainn dhaibh innse dè na h-ionadan gairm a tha buailteach fuireach leis a 'chompanaidh as fhaide.

A 'toirt taic dha ceannairc: le bhith a' sgrùdadh meadhanan sòisealta, clàran ionmhasail, làraichean-slighe itealaich, agus dàta tèarainteachd, faodaidh co-èigneachadh lagha a bhith a 'ro-innse agus a bhith a' lorg amharas uamhasach mus dèan iad an gnìomhan eucorach.

A 'luachadh margaidheachd branda stèidhichte air lèirmheasan meadhanan sòisealta : bidh daoine gu sgiobalta agus a' roinn an cuid bheachdan air-loidhne air taigh-seinnse, taigh-bidhe no club fallaineachd. Tha e comasach na milleanan de na h-obraichean meadhanan sòisealta a sgrùdadh agus fiosrachadh a thoirt don chompanaidh air na tha daoine a 'smaoineachadh air na seirbheisean aca.

Cò a chleachdas dàta mòr? Dè a tha iad a 'dèanamh leis?

Bidh mòran de chompanaidhean monolithic a 'cleachdadh dàta mòr gus an tabhartasan agus na prìsean aca atharrachadh gus sàsachd luchd-cleachdaidh a mheudachadh.

Carson a tha an dàta mòr seo mar Big Deal?

Tha 4 rudan a 'dèanamh dàta mòr cudromach:

1. Tha an dàta gu math mòr. Cha bhith e a 'freagairt air aon dhràibhear cruaidh , mòran nas lugha na bata USB . Tha an tomhas de dhàta fada nas àirde na an inntinn daonna a dh'fhaodas fhaicinn (smaoinich air billean billean megabytes, agus an uairsin iomadachadh sin le barrachd mhilleanan).

2. Tha an dàta meallta agus neo-structarail. Tha 50% gu 80% de dh'obair dàta mòr ag atharrachadh agus a 'glanadh an fhiosrachaidh gus am bi e furasta a lorg agus a rèiteachadh. Chan eil ach beagan mhìltean de eòlaichean air a 'phlanaid againn làn fhios mar a nì sinn an dàta seo a ghlanadh. Bidh na h-eòlaichean sin cuideachd ag iarraidh innealan fìor speisealta, leithid HPE agus Hadoop, gus an cuid ciùird a dhèanamh. 'S dòcha ann an 10 bliadhna, bidh eòlaichean dàta mòr gu bhith nan dusan, ach airson an-dràsta, is e gnè de sgrùdaiche ainneamh a th' annta agus tha an obair fhathast gu math mì-thoilichte agus tinn.

3. Tha dàta air fàs gu bhith na thodhar ** a dh'fhaodar a reic agus a cheannach. Tha margaidhean dàta ann far am faod companaidhean agus daoine fa leth terabytes de mheadhanan sòisealta agus dàta eile a cheannach. Tha a 'mhòr-chuid den dàta stèidhichte air sgòthan, oir tha e ro mhòr airson a bhith a' freagairt air aon chlàr cruaidh sam bith. Tha dàta ceannach gu tric a 'gabhail a-steach cìs fo-sgrìobhaidh far a bheil thu a' cur a-steach do thuathanas frithealaiche sgòthan

** Is e ceannardan innealan agus beachdan dàta mòra Amazon, Google, Facebook, agus Yahoo. Leis gu bheil na companaidhean sin a 'frithealadh uiread de mhilleanan de dhaoine le na seirbheisean air-loidhne aca, tha e a' dèanamh ciall gum biodh iad mar an àite cruinneachaidh agus na lèirsinn air cùlaibh anailis dàta mòr.

4. Tha na roghainnean aig dàta mòr gun chrìochnachadh. Is dòcha gum bi dotairean a 'ro-innse aon latha a' toirt ionnsaighean cridhe agus stròcan airson seachdainean fa leth mus tachair iad. Dh'fhaodadh tubaist phort-adhair agus carbadan a bhith air an lùghdachadh le sgrùdaidhean ro-innseach air an dàta meacanaigeach agus air pàtran trafaig agus sìde. Dh'fhaoidte gun tèid làraichean air-loidhne a leasachadh le bhith a 'toirt seachad fiosrachadh mòr air cò a tha nan daoine co-chòrdail dhut. Dh'fhaodadh luchd-ciùil faighinn a-mach dè an obair ciùil as fheàrr a tha a 'còrdadh ri luchd-èisteachd targaid. Dh'fhaodadh gum bi beathachadh-beatha comasach air ro-innse dè am measgachadh de bhiadh a bhios a 'ceannach stòras a bheir crìonadh no cuideachadh do dhroch thinneas duine. Cha deach an sgrìob a sgròbadh a-mhàin, agus tha lorgan ann an dàta mòr a 'tachairt gach seachdain.

Tha Dàta Mòr a 'Moladh

Monty Rakusen / Getty

Tha dàta mòr ann an anailis ro-innseach: atharrachadh de dhàta neo-thruailleadh mòr a-steach do rudeigin a ghabhas rannsachadh agus a rèiteachadh. Is e àite spioradail a tha seo a tha feumach air eòlas sònraichte agus foighidinn.

Gabh mar eisimpleir an t-seirbheis lìbhrigeadh UPS monolithic. Bidh na prògraman aig UPS a 'sgrùdadh dàta bho GPS an dràibhearan agus fònaichean sgairteil gus sgrùdadh a dhèanamh air na dòighean as èifeachdaiche gus a bhith a' freagairt ri dragh trafaic. Tha an dàta GPS agus fòn sgairteil seo gargantuan, agus chan eil e deiseil airson anailis. Bidh an dàta seo a 'tilgeil a-steach bho ghrunn GPS agus stòran-dàta mapa, tro innealan bathar cruaidh eadar-dhealaichte. Tha sgrùdairean UPS air mìosan a chosg a 'tionndadh a h-uile dàta sin gu cruth a dh'fhaodar a lorg gu furasta agus air an òrdachadh. Ach tha e air a bhith na dh 'fhiach an oidhirp. An-diugh, tha UPS air còrr is 8 millean gallan de chonnadh a shàbhaladh bhon thòisich iad a 'cleachdadh na mion-sgrùdaidhean dàta seo.

A chionn 's gu bheil dàta mòr mì-chinnteach agus gu bheil uidhir de dh' oidhirp air a ghlanadh agus ullachadh airson an cleachdadh, tha luchd-saidheans dàta air a bhith air an ainmeachadh mar 'luchd-glanaidh dàta' airson a h-uile obair a tha iad a 'dèanamh. Deer

Tha saidheans a thaobh dàta mòr agus anailis ro-innleachdail a 'fàs nas fheàrr gach seachdain, ge-tà. A 'sùileachadh gum bi fiosrachadh mòr ri fhaighinn gu furasta don a h-uile duine ron bhliadhna 2025.

A bheil Am Fiosrachadh Mòr na Bagairt Threasmhor air Prìobhaideachd?

Feingersh / Getty

Tha, mura h-eil na laghan againn agus dìon prìobhaideachd fa leth air an riaghladh gu faiceallach, bidh dàta mòr a 'toirt a-steach prìobhaideachd pearsanta. Mar a tha e, tha Google agus YouTube agus Facebook mar-thà a 'cumail sùil air na cleachdaidhean làitheil agad air-loidhne . Tha am fònaichean sgairteil agad agus beatha coimpiutaireachd a 'fàgail lorg-coise didseatach a h-uile latha, agus tha companaidhean sàr-mhath ag ionnsachadh nan lorgan sin.

Tha na laghan mu dhàta mòr ag atharrachadh. Tha prìobhaideachd na staid gum feum thu a-nis uallach pearsanta a ghabhail oir chan urrainn dhut a bhith a 'sùileachadh gum bi e mar dhlighe bunaiteach.

Na as urrainn dhut a dhèanamh gus do phrìobhaideachd a dhìon:

Is e an aon cheum as motha as urrainn dhut a ghabhail a bhith a 'gleidheadh ​​do chleachdaidhean làitheil le ceangal lìonra VPN . Bidh seirbheis VPN a 'sgoltadh do chomharran gus am bi do dhearbh-aithne agus an t-àite agad air a chòmhdach gu ìre mhòr bho luchd-rianaidh. Cha dèan seo 100% gun urra ort, ach bidh VPN a 'lùghdachadh gu mòr na tha an saoghal a' coimhead air na cleachdaidhean air-loidhne agad.

Càite am faigh mi barrachd fiosrachaidh mu dheidhinn dàta mòr?

Monty Raskusen / Getty

Tha dàta mòr na rud inntinneach dha daoine le inntinnean anailis agus gràdh do theicneòlas. Ma tha sin agad, bidh thu gu cinnteach a 'tadhal air an duilleag seo de phròiseactan inntinneach mòra dàta.