Kio Ĝuste Estas 'Grandaj Datumoj'?

Kaj kial ĝi estas granda oferto?

'Grandaj datumoj' estas la nova scienco kompreni kaj antaŭdiri homan konduton per studado de grandaj volumoj de nestrukturitaj datumoj. Grandaj datumoj ankaŭ estas konataj kiel 'prognozaj analizoj'.

Analizante afiŝojn de Twitter, poŝtelefonoj de Facebook, serĉoj de eBay, spuroj de GPS kaj maŝinoj de ATM estas iuj ekzemploj de grandaj datumoj. Studante sekurecajn filmetojn, trafikajn datumojn, veterkapablojn, flugajn alvenojn, poŝteletajn turojn, kaj kuraĝaj spuristoj estas aliaj formoj. Grandaj datumoj estas malklara nova scienco, kiu ŝanĝas ĉiusemajne, kaj nur kelkaj spertuloj komprenas ĉion.

Kio Estas Kelkaj Ekzemploj de Grandaj Datumoj en Regula Vivo?

ekrankopio http://project.wnyc.org/transit-time

Dum plej grandaj projektoj de datumoj estas tre malklaraj, ekzistas sukcesaj ekzemploj de grandaj datumoj, kiuj efikas la ĉiutagan vivon de individuoj, kompanioj kaj registaroj:

Antaŭdiri virinajn eksplodojn: per studado de soci-politikaj datumoj, vetero kaj klimataj datumoj kaj hospitaloj / klinikaj datumoj, ĉi tiuj scienculoj nun antaŭdiras denguebridajn eksplodojn kun 4 semajnaj antaŭvido.

Rigardado pri Hommortigo: ĉi tiu granda datuma projekto profilas mortigi viktimojn, suspektojn kaj krimulojn en Vaŝingtono. Tiel kiel honori la mortinton kaj kiel konsciencan rimedon por homoj, ĉi tiu granda datuma projekto estas fascinanta.

Transit Travel Planning, NYC: la programisto de radioaparato de WNYC Steve Melendez kombinis la horaron de metro en linio kun programaro de vojaĝoj. Lia kreado lasas al Novjorkanoj alklaki ilian lokon sur la mapo, kaj antaŭdiro de vojaĝtempo por trejnoj kaj subteraĵoj aperos.

Xerox reduktis sian laborfortan perdon: nomata centro-laboro estas emocie elĉerpa. Xerox studis amaskomunikilojn kun helpo de profesiaj analizistoj, kaj nun ili povas antaŭdiri, kiuj telefonaj kontraktantoj probable restos kun la kompanio la plej longa.

Subtenante kontraŭmorismon: studante sociajn amaskomunikilojn, financajn rekordojn, flugajn rezervojn, kaj sekurecajn datumojn, rajtigo povas antaŭdiri kaj trovi terorismajn suspektojn antaŭ ol ili faru siajn malbonajn agojn.

Ĝustigante markonmarkadon bazitan sur sociaj rimedoj-revizioj : homoj malofte kaj rapide dividas siajn interretajn pensojn en drinkejo, restoracio, aŭ gimnazio-klubo. Eblas studi ĉi tiujn milionojn da sociaj amaskomunikiloj kaj provizu sugestojn al la firmao pri tio, kion homoj opinias pri siaj servoj.

Kiu Uzas Grandajn Datumojn? Kion ili faras kun ĝi?

Multaj monolitaj korporacioj uzas grandajn datumojn por ĝustigi siajn oferojn kaj prezojn por maksimumigi la klientan kontentigon.

Kial Estas Granda Dato Tia Granda Interkonsento?

4 aĵoj faras grandajn datumojn signifa:

1. La datumo estas amasa. Ĝi ne taŭgas per unu malmola disko , multe malpli USB-stick . La volumo de datumoj multe superas kion la homa menso povas percepti (pensu pri miliardoj da miliardoj da mejabetoj, kaj tiam multobligu tion per pli ol mil milionoj).

2. La datumoj estas malĝojaj kaj nestrukturitaj. 50% al 80% de grandaj datumoj laboras konverti kaj purigi la informojn por ke ĝi estas serĉebla kaj sortebla. Nur kelkaj mil spertuloj pri nia planedo scias tute kiel fari ĉi tiun datumpurigon. Ĉi tiuj spertuloj ankaŭ bezonas tre specialajn ilojn, kiel HPE kaj Hadoop, por fari siajn metiojn. Eble en 10 jaroj, grandaj datumaj spertuloj fariĝos ĉirkaŭ dekduo, sed nuntempe ili estas tre maloftaj specioj de analizisto kaj ilia laboro estas ankoraŭ tre malklara kaj teda.

3. Datumoj fariĝis varo ** kiu povas esti vendita kaj aĉetita. Ekzistas merkatoj de datumoj kie kompanioj kaj individuoj povas aĉeti terabytes de sociaj amaskomunikiloj kaj aliaj datumoj. La plimulto de la datumoj estas bazitaj en nubo, ĉar ĝi estas tro granda por kongrui al iu ajn malmola disko. Aĉetaj datumoj komune implikas abonan kotizon, kie vi enmetas en nula servilo-bienon.

** La gvidantoj de grandaj datumaj iloj kaj ideoj estas Amazon, Google, Facebook kaj Yahoo. Ĉar ĉi tiuj kompanioj utilas tiom da milionoj da homoj kun siaj interretaj servoj, ĝi havas sencon, ke ili estus la kolekto-punkto kaj la visionarioj malantaŭ grandaj datumoj-analizoj.

4. La ebloj de grandaj datumoj estas senfinaj. Eble doktoroj antaŭdiros antaŭdirojn kaj atakojn por individuaj semajnoj antaŭ ol ili okazos. Aviadilo kaj aŭto-frakasoj povus esti reduktitaj per antaŭdiskaj analizoj de iliaj mekanikaj datumoj kaj trafiko kaj vetero-ŝablonoj. Enreta datado povus esti plibonigita per grandaj datumoj-prognozoj pri kiuj estas kongruaj personecoj por vi. Muzikistoj povus kompreni, kio muzika komponado estas la plej plaĉa al la ŝanĝiĝantaj gustoj de la objektiva publiko. Nutriistoj povus antaŭdiri, kian kombinon de butikumitaj manĝaĵoj pligravigos aŭ helpos medicinajn kondiĉojn de persono. La surfaco nur estis gratita, kaj malkovroj en grandaj datumoj okazas ĉiun semajnon.

Grandaj datumoj estas malĝojaj

Monty Rakusen / Getty

Grandaj datumoj estas prognozaj analizoj: la konvertiĝo de amasaj nestrukturitaj datumoj en ion serĉebla kaj komprenebla. Ĉi tio estas malplena kaj ĥaosa spaco, kiu postulas specialan specon kaj paciencon.

Prenu ekzemple la monolita UPS-transdono. La programistoj ĉe UPS studas datumojn de siaj GPS kaj inteligentaj telefoniloj por analizi la plej efikajn manierojn adaptiĝi al trafika kongesto. Ĉi tiuj GPS kaj inteligentaj datumoj estas gajaj, kaj ne aŭtomate pretaj por analizo. Ĉi tiuj datumoj elspezas de diversaj GPS kaj mapoj de datumbazoj, tra malsamaj aparatoj de aparataro. UPS-analizistoj pasigis monatojn konvertante ĉiujn tiujn datumojn en formaton, kiu povas facile serĉi kaj ordo. Tamen la penado valoris. Hodiaŭ, UPS savis pli ol 8 milionojn da karbono de brulaĵo ekde kiam ili komencis uzi ĉi tiujn grandajn analitikajn datumojn.

Ĉar grandaj datumoj estas mallaboremaj kaj bezonas tiom da penado por purigi kaj prepari por uzado, datumaj sciencistoj fariĝis apoditaj 'datumaj janitoroj' pro la tuta teda laboro. Deer

Tamen la scienco pri grandaj datumoj kaj prognozaj analizoj plibonigas ĉiun semajnon. Atendu grandajn datumojn por esti facile alireblaj por ĉiuj de la jaro 2025.

Ĉu Granda Dato ne estas Entuziasma Minaco pri Privateco?

Feingersh / Getty

Jes, se niaj leĝoj kaj individuaj sekurecaj defensoj ne zorgeme administras, tiam grandaj datumoj entrudiĝos en personan privatecon. Kiel ĝi staras, Google kaj YouTube kaj Facebook jam spuras viajn ĉiutagajn interretajn kutimojn . Via inteligenta vivo kaj komputila vivo lasas ciferecajn spurojn ĉiutage, kaj sofisticaj kompanioj studas tiujn piedojn.

La leĝoj ĉirkaŭ grandaj datumoj evoluas. Regularo estas stato de esti, ke vi devas nun preni respondecon pri tio, ĉar vi ne plu povas atendi ĝin kiel defaŭltan rajton.

Kion vi povas fari por protekti vian privatecon:

La plej granda sola paŝo, kiun vi povas preni, estas por vesti viajn ĉiutagajn kutimojn per reto de reto VPN . VPN-servo funkcios vian signalon tiel ke via identeco kaj loko estas almenaŭ parte maskitaj de spuroj. Ĉi tio ne faros vin 100% anonima, sed VPN reduktos substance kiom la mondo povas observi viajn interretajn kutimojn.

Kie mi povas lerni pli pri grandaj datumoj?

Monty Raskusen / Getty

Granda datumo estas fascinanta afero por homoj kun analizaj mensoj kaj amo por teknologio. Se tio estas vi, vi sendube vizitos ĉi tiun paĝon de interesaj grandaj datumaj projektoj.