Журнал «Компьютерра» № 17 от 09 мая 2006 года - Компьютерра (бесплатные онлайн книги читаем полные версии .txt) 📗
В Университете Бингемтон (штат Нью-Йорк) разработана технология, которая позволяет практически безошибочно определить, какой камерой сделана та или иная цифровой фотография. Конечно, правы будут те, кто скажет, что для этих целей в снимки специально добавляются метаданные EXIF. Однако изобретенный метод предназначен совсем для иных целей, а именно для вооружения борцов с порнографией.
Зачастую самым отъявленным извращенцам удается избежать кары только потому, что не удается собрать убедительных доказательств их деятельности. Например, педофилы иногда пользуются нехитрой уловкой, позволяющей откреститься от подсудных фотографий. Путем элементарного монтажа голова ребенка заменяется на снимке головой взрослого человека. С помощью разработанной системы, имея на руках несколько изображений или саму камеру, можно не только уличить порнодельца в запрещенных фотосессиях, но и выявлять подобные «коллажи» (как, впрочем, и другие поддельные образы, прошедшие через графическое ПО).
Метод во многом схож с баллистической экспертизой. Подобно тому как микроскопические неровности в стволе оружия оставляют уникальные отметины на пулях, цифровые снимки несут родовой отпечаток, обусловленный изъянами матрицы. Даже самая совершенная технология не способна обеспечить полную однородность пикселов, а значит, в картинке всегда будет небольшая зашумленность, присущая только данной камере. Исследовав этот узор, можно сделать заключение о принадлежности снимка к конкретному аппарату. На испытаниях метод показал себя очень хорошо: во время анализа 2700 фотографий, сделанных девятью камерами, система ни разу не дала осечки.
Конечно, у технологии имеются и недостатки. В первую очередь, это необходимость в достаточно большом количестве снимков для сравнения. К тому же порнодельцы, быстро сообразив, чем грозит включение рассмотренной системы в арсенал спецслужб, наверняка придумают трюки, способные существенно затруднить работу следователей. – А.З.
«Каждый пишет, как он дышит» – это наблюдение на сто процентов применимо к блоггерам, щедро выплескивающим свои сиюминутные чаяния на страницы онлайновых опусов. Чем же в текущий момент «дышит» блогосфера и какие «тараканы» бродят в ее бескрайней голове? Над разгадкой этой тайны бьются сотрудники Амстердамского университета во главе с аспирантом Джиладом Мишне (Gilad Mishne).
Разработанная голландцами программа Moodviews сканирует необъятные просторы «Живого журнала» (LiveJournal.com), «выцарапывая» из постов значки-эмотиконы, выражающие настроение авторов, и анализируя циклы их появления. Репрезентативность подобной выборки довольно велика: как-никак, число «членов редколлегии ЖЖ» перевалило за десять миллионов. Каждый день поступает четверть миллиона новых записей, при этом заветный значок содержат три поста из пяти. Как показал «разбор полетов», в настроении «жежистов» и впрямь прослеживается ряд устойчивых тенденций: так, к началу уик-энда резко возрастает число блоггеров «под шофе», а в День Святого Валентина достигает пика число любителей пофлиртовать (увы, в сей светлый праздник как никогда много и тех, кто чувствует себя покинутым). Ряды блоггеров, испытывающих стресс, редеют в летние месяцы и заметно растут к концу года – не иначе, сказывается ретивость жестоких боссов, дерущих со своих подчиненных три шкуры в преддверии годовых отчетов.
На первый взгляд амстердамцы не открыли ничего нового – многие из обнаруженных ими закономерностей как под копирку совпадают с неписаными правилами офлайновой жизни. Впрочем, это лишь начало большого пути: всласть поиграв с эмотиконами, исследователи взялись за более серьезный труд. Ныне они стремятся найти взаимосвязь между эмоциональными приливами в блогосфере и текущими новостями. Для этого создана другая программа – Moodsignals, вооруженная «искусственным интеллектом» и сопоставляющая настроения блоггеров с содержанием их постов. Так, прошерстив архивы за июль прошлого года, софтина обнаружила, что причину повсеместного воодушевления блоггеров в тот период лучше всего описывают четыре слова – «Harry», «Potter», «shop» и «book» – именно тогда на прилавки книжных магазинов легло очередное творение Джоан Роулинг.
По мнению голландцев, их детище способно удовлетворить не только научный, но и коммерческий интерес. Например, перед тем как вложить свои кровные в какое-нибудь рискованное дело, потенциальному инвестору будет любопытно взглянуть на спектр эмоций, которые сей проект вызывает у неподкупного племени блоггеров. Не исключено, что «эмоциональный» подход пригодится и на поисковом поприще: вообразите поисковик, выдающий на заданный фильм рецензию, в которой настроение критика описывается выбранным вами «эмотиконом». Интересно, кстати, какие гримасы у профессиональных социологов и создателей веб-поисковиков вызовут труды голландцев? – Д.К.
Калифорнийская компания MusicIP оформила патент и вывела на рынок новую эффективную технологию идентификации для цифровой музыки, способную отыскивать нужную песню менее чем за секунду в огромной базе данных из 17 млн. наименований.
Как и другие технологии подобного рода, метод MusicIP построен на основе вычисления особого «отпечатка», или хеш-значения, уникальным образом сохраняющего характеристики музыкального файла в виде короткой последовательности байтов. Особенность новинки в том, что идентификацию удалось сделать чрезвычайно быстрой, а размер массива, в котором ведется поиск, объявлен «самым крупным среди коммерчески доступных баз данных». В MusicIP уже написан соответствующий софт, предлагающий пользователям проанализировать всю музыку на их компьютерах и выдающий рекомендации по расширению коллекции в любом интересующем направлении. Теперь эта же услуга будет предлагаться другим компаниям для включения в их продукты в качестве доступного сервиса.
Чтобы вычислить «отпечаток» аудиотрека в любом формате, MusicIP сканирует двухминутный фрагмент и снимает частотные характеристики сигнала через каждые 185 мс. Полученный результат пересчитывается и преобразуется в короткий хеш-файл длиной 512 байт. Одновременно выделяются и замеряются четыре доминирующих тона в тридцатисекундном музыкальном фрагменте. Эта информация используется для сужения зоны поиска в базе данных, причем алгоритм показал себя достаточно чувствительным, чтобы отличать версии одной и той же песни даже при одном и том же исполнителе, но в разных записях – например, в студии или на концерте.
Подобные услуги, сводящиеся к идентификации песен и поиску «похожих» в уже имеющейся коллекции или более крупных базах данных, сегодня предлагает целый ряд фирм и сетевых сервисов: www.gracenote.comи, www.shazam.com, www.last.fm, www.pandora.com. Компания MusicIP, выходящая со своим продуктом на уже застолбленный конкурентами участок, надеется привлечь клиентов «сверхзвуковыми» скоростями и впечатляющими размерами своей музыкальной базы данных. Доступ пользователей к этой базе объявлен бесплатным. – Б.К.
«Игры в альтернативной реальности» (alternate-reality game, aRG) все чаще используются в рекламных акциях для продвижения разных коммерческих проектов («КТ» #628). Погрузив людей в выдуманный мир, гораздо проще навязать им нужную идею. Однако участниками подобных забав обычно становятся лишь фанаты конкретной компании. А вот трое энтузиастов из Сан-Франциско создали aRG-игру San Francisco Zero, не гонясь за коммерческой выгодой. И как нередко случается, игра, придуманная из чистой любви к искусству, оказалась более интересной, чем «корыстные» аналоги.