https://frosthead.com

Софтуерът създава една снимка, която казва всичко

Всеки ден потребителите качват повече от 350 милиона снимки във Facebook. Този приток на изображения накара анализаторите да преценят, че 10 процента от 3, 5 трилиона снимки в света са направени през последната година. Всички тези данни, заливащи мрежата, означават, че ако търсите определено изображение или обект - как изглежда например оранжевата табби котка, вие сте положително залят с резултати от търсенето.

Миналия месец изследователи от Калифорнийския университет, Бъркли представиха нов софтуер, AverageExplorer, който ще позволи на потребителите да видят „средното“ изображение, което представлява това, което търсят. Вместо картина на стойност хиляда думи, тя е снимка на стойност хиляда или повече - снимки.

„Когато въведете търсене на изображения в Google, ще пресявате страници и страници от изображения“, обяснява Джун-Ян Джу, аспирант от Университета на Беркли и главен автор на доклада, представен на тазгодишната международна конференция и изложба по компютърна графика и интерактивни техники във Ванкувър. „Това е огромно и трудно да се обобщи; не можеш да разбереш какво се случва. "

За първоначалното си предлагане Джу и неговият екип събраха снимки чрез търсене на изображения във Flickr, Google и Bing. Софтуерът е с достатъчно ниска мощност, за да работи на среден работен плот и може да стисне около 10 000 изображения едновременно.

Потребителите прецизират търсенията си по няколко различни начина. Те могат да скицират и оцветяват фигура, подобно на рисунката в Adobe Photoshop или Illustrator, за да изострят резултата от средното изображение. Например, оцветяването на фона на средно изображение на Айфеловата кула ще самоизбере средното изображение, за да изтегли само снимки, направени през нощта. Или можете да нарисувате ъглови линии, за да контролирате ориентацията на пеперуда в композита.

Мост на въздишките, от ден на нощ Чрез прецизиране на цветовете в изображение на AverageExplorer на Моста на въздишките, можете да промените сцената от ден на здрач до вечер. (С любезност UC Berkeley)

След като се създаде средно изображение, процес, който може да отнеме до минута, потребителите могат допълнително да прецизират резултата, използвайки това, което екипът нарича Режим на Explorer. В този режим щракването върху определена част от изображението - например, котешки нос - ще разкрие други общи опции или уточнения за това петно ​​- може би сини или черни носове, или такива, които са заоблени вместо ъглови. Например в демонстрационно видео, екипът усъвършенства изображение на деца в скута на Дядо Коледа, като избира само изображения, където Дядо Коледа има по едно дете на всяка ръка.

Където системата ще стане особено мощна, казва Джу, е инструмент за обучение на алгоритми за компютърно виждане, като тези, използвани от Google Goggles или Amazon Firefly, които могат да идентифицират към какво се насочва камерата. „В областта на компютърното зрение хората харчат много пари за коментиране на обекти“, обяснява той. „Сега можете да приложите пояснението към средното изображение. Идеята е, че трябва да работите само върху едно изображение, за да разпространявате всички изображения в набор от данни. “

Намиране на породи котки Чрез прецизиране на режимите на резултат от търсенето изследователите могат да намерят специфични породи котки, включително (отляво надясно) Ragdoll, сиамски, мейн кун и сфинкс. (С любезност UC Berkeley)

Създаването на произведения на изкуството е ниско висящият плод за AverageExplorer. Екипът черпи вдъхновение от нови медии художници като Джейсън Салавон, който старателно създава усреднени снимки на ръка. Може да се използва и за създаване на плъгин за Facebook, който позволява на потребителите да се занимават със средното изображение на себе си.

Стремежът на изследователите е още по-широк и въздействащ. Социолозите биха могли да използват системата за откриване и изследване на социалните тенденции; например средно изображение може да докаже, че булките най-често стоят вдясно от младоженеца в сватбени портрети. AverageExplorer може също да бъде полезен инструмент за медийни анализатори, които се опитват да разчленят телевизионното отразяване - променя ли се позата на Стивън Колбърт, когато говори за Джордж Буш срещу Барак Обама?

Позволявайки на потребителите да си взаимодействат интуитивно с визуални данни, вместо да се мъчат да въведат правилния низ от ключови думи, потребителите ще могат да преодолеят това, което съветникът на Джу и създателят на AverageExplorer, Алексей Ефрос, нарича „езиковото препятствие“.

Екипът си представя набор от персонализирани инструменти, създадени за специфични, трудни за артикулиране задачи. Приложение за пазаруване, например, ще позволи на потребителя да паяжи в мрежата за чифт токчета с точния цвят, формата на петата и височината, която е след това. Джу предвижда инструмент, който да се интегрира с работния процес на художниците на скици, позволяващ на свидетеля да търси в базите данни на лицето за функции, които съответстват на извършителя и да конструира композитен портрет.

Основна версия на AverageExplorer ще излезе тази есен.

Софтуерът създава една снимка, която казва всичко