Ūdens spīdzināšana - Analytics analoģija ir pārāk tālu

pilienu analītika

Dati, tāpat kā ūdens, ir dažādi. Cilvēka prāts ir attīstījies, lai filtrētu lielāko daļu mūsu rīcībā esošo datu, jo to ir vienkārši tik daudz.

Atverot acis un ausis, dati ir visur. Sienas krāsa, gaisa kondicionētāja skaņa un kaimiņa kafijas smarža tiek uzskatīta par mitrumu. Ūdens visu laiku atrodas gaisā, bet nav lietderīgi tam pievērst lielu uzmanību.

Kad ūdens kondensējas miglā, tas liek jums to redzēt un apgrūtina apkārtējās pasaules izpratni. Nepilnīgas datu kopas, bojāti dati, slikta zinātne, nepatiesi secinājumi un kognitīvais neobjektivitāte liek jums apmaldīties miglā.

Dati krīt kā lietus. Kad to ir nedaudz, tas ir ārkārtīgi neapmierinoši - tieši tik daudz, lai padarītu jūsu automašīnu netīru un sajauktu sarunu. Jūs pamanāt, ka jūs noslaucāt vietu uz brillēm, kad kāds izspiež kādu nejaušu datu punktu, kas iegūts no kāda neskaidra avota.

  • Novecojis ūdens seklajā dīķī ir bīstams. Dati, kas savākti no neuzticamas piegādes, nav attīrīti vai normalizēti un atstāti stagnēt, var viegli izdarīt kļūdainus secinājumus.
  • A vienmērīgs piliens ūdens var būt pietiekams, lai aizpildītu ēdnīcu vai uzturētu meža ekosistēmu. Tikai trīs datu punkti (nosūtīto e-pastu skaits, salīdzinot ar atvērtajiem un noklikšķinātajiem) var uzturēt mārketinga programmu.
  • A veselīgāka plūsma datus neliela līkuma veidā var izmantot peldēšanai. Nepārtraukta datu plūsma ļauj salīdzināt un salīdzināt vēsturiski. Galvenās lapas optimizāciju var veikt ar stabiliem reklāmguvumu datiem.
    A pieticīga upe var darbināt dzirnavas koku zāģēšanai vai kviešu malšanai. Ieteikumu dzinējam ir vajadzīgs tikai nedaudzu pieteku uzticams ieguldījums, lai nodrošinātu iepirkumu grozu vērtības pieaugumu.
  • A ūdenskritums var dzīt milzīgu ūdensratu un pietiekams informācijas pieplūdums var vadīt reāllaika dinamisku satura sistēmu.
  • A upe tas ir pietiekami plašs un dziļš, var atbalstīt visu transporta nozari. Pietiekami daudz datu var peldēt uz liellaivām un kravas kuģiem sīkfailu kolekcijas veidā no reklāmas tīkliem, lojalitātes karšu programmu datu apkopotājiem un datu brokeriem.

Kad dati nonāk paredzētajā laikā paredzētajā apjomā, tos var tvert, novirzīt un nodot lietošanai. Apūdeņošanas sistēmas, aizsprosti un rezervuāri nodrošina vadības sajūtu un ļauj būvēt arvien plašāku infrastruktūru ar kanāliem, slēdzenēm un aizsprostiem. Datu noliktavas ir veidotas uz mazāk uzticamām plūsmām.

Tīrība ir blakus dievbijībai

Tīrs ūdens ir būtisks, lai gūtu panākumus dzīvē, apūdeņošanā, elektrostaciju darbināšanā utt. “Tīra” definīcija šim nolūkam var mainīties; tas ir labi, ja ūdenī ir aļģes, kas atdzesē spēkstaciju, un tas nav pieņemami, ja dzeramajā ūdenī ir vairāk nekā 10 mililitru daļas arsēna.

Dati ir vienādi. Tiešā pasta lietojumprogrammā nav nozīmes tam, vai jums ir personas vārds (kungs, kundze, kundze) ... ja vien jūs nenosūtāt vēstules ārstiem. Bet netīri dati katru reizi izjauks.

Kā ASV galvenais datu zinātnieks DJ Patils, ielieciet to pirmās kārtas CTO samitā: “Ja jūs jau pašā sākumā nedomājat, kā saglabāt savus datus tīrus, jūs esat f ^ ¢ & ed. Es to garantēju. Mēģinājums to sakopt pēc fakta prasīs vismaz mēnešus. ”

Ja jūs uzkarsējat ūdeni līdz vārīšanās temperatūrai, tas var darbināt visu rūpniecisko revolūciju. Šķiet, ka dati dara to pašu. Kopš brīža, kad datori varēja glabāt, kā arī aprēķināt, dati tika savākti tik ātri, cik to varēja izveidot, glabājot aprīkojumu.

Datu ezers

Kad dati no šīm pietekām līst caur dzirnavu motoriem, tas viss nonāk ezerā, aiz aizsprosta. Tā kā dati tiek izlaisti kontrolētā veidā, tie darbina datu nozares turbīnas; tie milzīgie datu apstrādes dzinēji ar tādiem nosaukumiem kā Google un Facebook. Šeit nebūs sausuma.

Un, visbeidzot, ir dziļš ūdens baseins, kas gaida, kamēr analītiķis ienirs. Akvalangs un šķēpa lielgabals rokās, analītiķis pēta dziļumu, kartē jaunu zemi un atklāj jaunas sugas. Ir ļoti aizraujošs laiks būt datu pētniekam.

Tāpēc tik daudzi no viņiem ir parādījušies eMetrics samits kopš 2002. Nākamā iespēja ir Bostonā, no 27. gada 1. septembra līdz 2015. oktobrim.

eMetrics samita reģistrācija

Bridge Too Far

Un kā ir ar datu spēku nākamā Lielā kanjona izciršanai? Kā ir ar strukturēto datu ledāju kušanu? Kā mēs attīrīsim notekūdeņus pasaulē, kas arvien vairāk apzinās privātumu?

Tie ir jautājumi citam laikam un ūdens zem tilta.

Ko jūs domājat?

Šī vietne izmanto Akismet, lai samazinātu surogātpastu. Uzziniet, kā tiek apstrādāts jūsu komentārs.