https://frosthead.com

Големи данни или твърде много информация?

Всички знаем, че има много повече информация в нашите светове, отколкото преди. Що се отнася до това колко повече, добре, повечето от нас са доста непознати.

Свързано съдържание

  • Инфографика през вековете подчертават визуалната красота на науката
  • Защо тенденциите на грипа в Google не могат да проследят грипа (все пак)

Ето безценен самород за цялата тази информация, комплименти на Дейв Турек, човекът, отговарящ за развитието на суперкомпютъра в IBM: От 2003 г. и работещи назад до началото на човешката история, ние сме генерирали, според изчисленията на IBM, пет екзабайта - това е пет милиарда гигабайта – информация. До миналата година изваждахме толкова много данни на всеки два дни. До следващата година, прогнозира Турек, ще го правим на всеки 10 минути.

Но как е възможно това? Как данните станаха такава цифрова kudzu? Казано по-просто, всеки път, когато мобилният ви телефон изпраща GPS местоположението си, всеки път, когато купувате нещо онлайн, всеки път, когато щракнете върху бутона Харесване във Facebook, слагате друго цифрово съобщение в бутилка. И сега океаните са доста покрити с тях.

И това е само част от историята. Текстови съобщения, клиентски записи, транзакции на банкомати, изображения на камери за сигурност ... списъкът продължава и продължава. Езикът за описание на това е „Големи данни“, макар че това едва ли отговаря на мащаба на чудовището, което сме създали.

Това е най-новият пример за технология, изпреварваща капацитета ни да го използваме. В този случай ние не сме започнали да настигаме способността ни да улавяме информация, поради което в днешно време любим тройка на управленските казуси е, че бъдещето принадлежи на компании и правителства, които могат да осмислят всички данни, които те събиране, за предпочитане в реално време.

Фирмите, които могат да интерпретират всяка дигитална галерия, която клиентите им оставят след себе си, ще имат предимство, мисленето продължава - не само кой е купил какво къде през изминалия час - но дали са туитвали за това или публикували снимка някъде във вихъра на социалните мрежи. Същото важи и за градовете, които могат да събират данни от хилядите сензори, които сега изпъкват градски пейзажи и превръщат капризите на живота на града, като трафик на трафик, в наука.

Не е изненадващо, че политическите кампании вече пориват, яростно извличайки данни като част от фокуса си върху „наноцелевизирането“ на избирателите, така че те да знаят точно как да ги насочат към своите гласове и пари. Сред изводите, които анализаторите правят, според колониста на New York Times Томас Едсол, е, че републиканците показват предпочитание към ресторантите „Офисът“ и Cracker Barrel, докато демократите са по-склонни да гледат „Късна нощ с Дейвид Летърман“ и да ядат в Чък Е . Сирене.

Това бързане за интерпретация на цифров флот обяснява защо Google миналата седмица обяви, че ще започне да продава продукт, който нарича BigQuery, софтуер, който може да сканира терабайти информация за секунди. И защо стартъп на име Splunk, който има технология, която може да анализира огромни количества данни за клиенти и транзакции, видя стойността на акциите си да скочи почти 90 процента в деня, в който стана публично достояние миналия месец. Това за компания, загубила 11 милиона долара миналата година.

Възход на данните учен

Но дори достъпът до най-добрите инструменти за дешифриране на данни не е гаранция за голяма мъдрост. Много малко компании имат хора с персонал, който се обучава не само да оценява планините от данни - включително множество неструктурирани парченца от милиони Facebook страници и смарт телефони - но и всъщност да направи нещо с него.

Миналата година McKinsey Global Insitute издаде доклад, описващ „Big Data“ като „следващата граница за иновации“, но също така прогнозира, че до 2018 г. компаниите в САЩ ще имат сериозен недостиг на таланти, когато става въпрос за необходимите аналитични умения - толкова 190 000 души. И твърди, че още 1, 5 милиона мениджъри ще трябва да бъдат обучени да вземат стратегически решения с поредицата от данни, идващи на пътя им.

Не всички обаче вярват в магията на Big Data. Питър Фейдър, професор по маркетинг в Университетската бизнес школа на Пен, не е убеден, че повече данни са по-добри. Не че той смята, че една компания не трябва да се опитва да научи колкото може повече за своите клиенти. Просто сега има толкова много фокус върху обобщаването на всеки бит данни, че според него обемът се оценява над истинския анализ.

Ето извода на Фейдър от скорошно интервю с технологичния преглед на MIT : „Дори и с безкрайни познания за миналото поведение, често няма да имаме достатъчно информация, за да направим смислени прогнози за бъдещето. Всъщност, колкото повече данни имаме, толкова по-невярна увереност ще имаме ... Важната част е да разберем какви са нашите граници и да използваме възможно най-добрата наука за попълване на пропуските. Всички данни в света никога няма да постигнат тази цел за нас. “

Кой е вашите данни?

Ето извадка за това как Big Data се използва за решаване на големи проблеми:

  • Те знаят кога са били лоши или добри: Докато повечето компании се фокусират върху анализа на своите клиенти, Amazon събира точки, като използва Big Data, за да помогне на техните.
  • Проучването на родословни: Искате ли да знаете кои бикове раждат най-продуктивните млечни крави? Млечната промишленост е измислила начин да съкрати числата.
  • Диагностика по данни: Изследователи от SUNY Buffalo анализират масивни масиви от данни в опит да установят дали има връзка между множествената склероза и факторите на околната среда, като например недостатъчно излагане на слънчева светлина.
  • Търсите проблеми: Компания, наречена Recorded Future, извлича информация от социалните мрежи и правителствени и финансови сайтове, за да прави прогнози за това как ръстът на населението, недостигът на вода и екстремното време биха могли да доведат до бъдещи политически вълнения и тероризъм.

Видео бонус: Събирането на данни е едно. Направете го да изглежда привлекателно и разбираемо е съвсем друго предизвикателство. Дейвид Маккандълс восъци за силата на "информационни карти" в този TED разговор.

Големи данни или твърде много информация?