Логин:
Пароль:
Регистрация · Восстановление пароля

23 октября 2015

Open Data Day и ежегодный хакатон по открытым данным Open Data Hackathon – 2015.

организаторы

В Open Data Day и хакатоне приняли участие: Руслан Артамонов, аналитик Дирекции по экспертно-аналитической работе НИУ ВШЭ, член Совета по открытым данным; Зинаида Васильева, исполнительный директор Центра исследований науки и технологий Европейского университета в Санкт-Петербурге; Диана Вест, доктор истории и теории архитектуры (Ph.D., Принстон), заместитель директора Центра исследований науки и технологий ЕУСПб; Виталий Власов, руководитель Фонда «Открытый город»; Святослав Гайкович, заслуженный архитектор России, руководитель бюро «Студия-17»; Юрий Гатчин, доктор технических наук, профессор Университета ИТМО, председатель постоянной комиссии по промышленности, экономике и собственности Законодательного собрания Петербурга; Джоэл Гурин, основатель и президент Center for Open Data Enterprise; Сергей Житинский, основатель и директор компании Git in Sky; Константин Задумкин, заместитель главы г.Вологды по стратегическому развитию; Стив Каддинс, сооснователь движения «Красивый Петербург»; Александр Карпов, кандидат биологических наук, руководителя Центра экспертиз ЭКОМ, член Градостроительного совета при Правительстве Санкт-Петербурга; Михаил Карягин, ведущий эксперт проекта «Инфометр»; Валентин Макаров, президент НП «Руссофт»; Энрик Массип-Бош, основатель архитектурного бюро EMBA; Аксель Менье, руководитель проекта EMAPS, Medialab (Sciences Po, Париж); Сергей Орлов, руководитель проекта «Открытые данные Санкт-Петербурга» Комитета по информатизации и связи администрации Санкт-Петербурга; Василий Пушкин, заместитель руководителя Аналитического центра при Правительстве РФ, руководитель направления «Открытые данные» (Москва); Вячеслав Романов, директор по аналитике проекта «Инфометр»; Алексей Сидоренко, руководитель Теплицы социальных технологий; Александр Чистяков, технический директор компании Git in Sky и другие.

видеозапись выступлений

текст выступлений

Василий Пушкин: Первое, что я хочу сказать: открытые данные – это круто. Мы увидели, что это круто не только внутри сообщества, это круто внутри государства. Мы провели два хакатона, взяв опыт Виталия и опыт Правительства Москвы. Мы сделали два хакатона в этом году на основе открытых данных РФ и смогли собрать людей, которые жаждут сделать что-то новое. Я рад, что вы все здесь собрались, потому что именно те люди, которые хотят что-то сделать, рождают новые идеи и создают новые проекты.

Несколько слов скажу об открытых данных, потому что последние два года мы очень плотно занимались этой тематикой, особенно с точки зрения нормативно-правового обеспечения, организации семинаров и обучения органов власти. Здесь кто-нибудь представляет органы власти? Нет.

Из зала: Представляют относительно – подведомственные учреждения.

Василий Пушкин: Хорошо. Не обижайтесь – чиновники не умеют работать с данными, не понимают, что такое данные и чего вы от них хотите. Мы провели большое исследование, спрашивая представителей органов власти – муниципалитетов, регионов и федеральных органов власти: как они работают, что они делают, почему они это делают? Им спустили указание сверху работать с открытыми данными и внедрять информационные технологии. Для них это наказание, и вы должны их понять. Они не дают вам данные не потому, что не хотят, а потому, что они не могут и не хотят.

Презентация

Но многое меняется. За последние несколько лет произошел сдвиг и заметно серьезное движение вперед. Все знают, что такое открытые машиночитаемые данные? [см. презентацию, слайд 2] Чиновники этого не знают. Для них открытые данные – это данные, размещенные в интернете. Как только данные разместили в интернете, уже все хорошо, задание выполнено, можно отчитываться. Потом они задают вопрос: почему же то, что мы размещаем, не работает? Мы разговаривали с Росгидрометом – вы слышали о такой организации, которая собирает информацию о погоде по всей стране, которая никому не дает этой информации. У них есть свой сайт – такие организации как «Фобос», «Гисметео», другие крупные организации, которые работают с данными о погоде и сервисами погоды, покупают данные за рубежом. Они не покупают и не берут ни одного байта информации в Росгидромете. Это большая проблема, которая связана с тем, что чиновники не понимают, зачем кому-то давать свою информацию – это наше. И очень сложно объяснить чиновнику, , почему нужно делиться информацией и выдавать ее наружу – не просто опубликовать на своем сайте, а дать ее в формате для дальнейшего, повторного использования, в машиночитаемом формате.

Много чего было сделано. Самое главное – нужно знать, что был Указ Президента. Это не просто поручение – это Указ, в котором Президент сказал, что все федеральные государственные информационные системы должны публиковать информацию в формате открытых данных. К сожалению, сейчас мы видим, что большинство информационных систем этого не делают, но работа ведется. Мы надеемся, что планомерно, шаг за шагом, в процессе модернизации и развития информационных систем каждая система будет выдавать максимум информации.

В дополнение к Указу Президента было два федеральных закона: «Об информации, информационных технологиях и о защите информации» и «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления» [слайд 3], а также несколько постановлений Правительства [слайд 4] и решений Правительственной комиссии. В рамках выполнения Указа Президента была создана Правительственная комиссия по координации деятельности Открытого правительства, которое поставило перед собой задачу – раскрывать данные, информацию и обеспечивать открытость. Благодаря деятельности Правительственной комиссии, появилось большое количество некоммерческих организаций, общественных фондов, инициатив, связанных с развитием гражданского общества. Ведется активная деятельность, в контексте которой выполняется очень большой блок по открытым данным. Создан Совет по открытым данным, в рамках которого была разработана дорожная карта по открытым данным. В этой дорожной карте есть масса данных, которые должны быть в ближайшем будущем опубликованы. К сожалению, сейчас их нет ни в каком виде – пока это только обещания чиновников, что они опубликуют. Но к счастью, это тот документ, с которым можно апеллировать к чиновникам – посмотрите, вы же обещали, мы отправляли вам его на согласование, и вы, вроде как, согласились. Мы сейчас активно работаем с органами власти, чтобы эти данные публиковались. Там очень много полезных и потенциально интересных наборов данных, связанных с движением транспорта, картографией, погодой, образованием, здравоохранением, то есть это данные из всех информационных систем, которые так или иначе ведут органы власти.

Второй главный документ, который был принят и который постепенно модернизируется, – это «Методические рекомендации» [слайд 5]. В эти рекомендации заложены правила публикации данных органами власти: как они должны публиковаться, где, в каком формате, что должно быть учтено – к сожалению, там очень мало сказано о единообразии атрибутов, общем классификаторе, общем справочнике. Тем не менее, это общий документ, на который ориентируются органы власти, благодаря которому мы собрали на одном портале почти 4 тыс наборов данных в более или менее одинаковом формате. У каждого набора данных есть паспорт, где представлены данные об органе власти и описание набора и всех полей этого набора (отдельным файлом), а также файл с набором открытых данных. Это позволило в единообразном формате собрать достаточно большой массив данных в одном месте. Может быть, вы, заходя на портал открытых данных РФ, сразу не увидите, что там есть какие-то интересные наборы – они кроются внутри. Если вас будут интересовать какие-то большие массивы данных, обращайтесь – мы подскажем и расскажем. Там есть интересные вещи.

В соответствии с методическими рекомендациями сейчас данные публикуются в формате файлов открытых данных, то есть это набор открытых данных [слайд 6]. Потихонечку начали внедряться API. Основные данные публикуются на Портале открытых данных РФ, порталах открытых данных органов власти и регионов [слайд 7]. Лидерами по количеству наборов данных (может быть, не по качеству, но по крайней мере, по количеству) традиционно является Росстат [слайд 8]. Там много информации, хотя она узкоспециальная и не очень интересная, на мой взгляд. Минобрнауки – думаю, что потенциально он выдаст самые большие объемы данных по науке, по исследованиям, которые велись в РФ, по всему, что связано с обучением, развитием школ, вузов, НИИ, научными разработками. Росавтодор – многие говорят, что качество данных не очень, но тем не менее начали публиковаться данные о дорогах, их использованию и ремонту. Также – Росалкогольрегулирование и Федеральная таможенная служба.

Среди регионов лидирует Тульская область (по количеству наборов данных), Москва, Чувашская Республика, Ульяновская область, Волгоградская область. Почему-то Санкт-Петербург не вошел – не знаю, почему, уточню. Сегодня проверили данные – Санкт-Петербург тоже в лидерах, но он не такой активный, как Тула и Москва.

Есть масса положительных эффектов от публикации открытых данных [слайд 9]. Мы выявили хорошую закономерность, о которой здесь будет говориться, которую надо учитывать при работе с открытыми данными. Открытые данные – это вершина айсберга, которая позволяет вытащить массу информации и систематизировать работу с информацией, которая есть в органах власти и у государства. Упоминая большие данные, мы на самом деле говорим об открытых данных, потому что именно открытые данные являются первым шагом на пути к большим данным. Сотовые операторы, банки и другие владельцы больших данных, к сожалению, замкнуты внутри своих массивов данных. Для того чтобы из больших данных делать сервисы для населения, для людей, их нужно объединять с открытыми данными, которые принадлежат государству. Именно государство является регулятором деятельности бизнеса и человеческой жизни по факту, собирает эти полезные данные, агрегирует их у себя, оперирует ими.

Наверное, основной целью открытия информации было повышение качества госуправления, госуслуг. За счет того, что мы начали открывать данные, органы власти, наконец, посмотрели на себя. Благодаря вам – я надеюсь, вы укажите на недостатки наборов данных, которые будете использовать, – мы сможем выявить проблемы в работе органов власти, просто чтобы подсказать им, на что обратить внимание.

Важно, что зачастую чиновники боятся публиковать данные, потому что за публикацией стоит административная и даже уголовная ответственность за то, что опубликованная информация может быть не так интерпретирована или опубликована ошибочно. Но на самом деле публикация данных – это огромная возможность для движения вперед.

В Высшей школе экономике – Руслан Артамонов, думаю, расскажет подробнее – подсчитали экономический эффект от транспортных данных [слайд 10]. Он был оценен в 60 млрд руб. ежегодно – это эффект от публикации всех данных, связанных с транспортом: географических координат остановок, транспортных маршрутов, турникетов, положений транспортных средств – всего, что связано с транспортировкой граждан. Большую работу в прошлом году проделало Правительство Москвы по оценке передвижения потоков людей по территории Москвы и Московской области с использованием данных сотовых операторов. Это имело колоссальный эффект, который позволил полностью пересмотреть данные по демографии и выяснить, сколько людей живет здесь на самом деле.

Из интересных данных – наиболее часто встречаются такие наборы данных: расписание транспорта Москвы (есть и в Санкт-Петербурге) [слайд 11], культурный навигатор Тульской области, который использует открытые данные по объектам культурного наследия [слайд 12], «Домашний фармацевт» использует данные по аптекам и лекарственным средствам [слайд 13], «Барьеров нет» – это данные по досуговым объектам, которые накладываются на карту [слайд 14]. Есть масса других примеров, которые используя открытые данные, расширяют кругозор по выбору места для жизни, выбору школы и детского сада, улучшению качества жизни.

Если кому интересны результаты нашего последнего хакатона, который прошел недавно, можете зайти на портал открытых данных или сайт Аналитического центра, где выложен полный список участников и команд – можно посмотреть на идеи, которые были реализованы в рамках хакатона и презентованы в результате [слайд 15]. Среди лучших идей – приложение «Московские школы». Кто не слышал – ребята проделали колоссальную работу в обход открытых данных Москвы. Они перелопатили отчеты школ и вытащили оттуда результаты ЕГЭ. Потом через соцсети проанализировали всех выпускников этих школ – в какие вузы они попали. Они смогли создать сервис, который сопоставляет школы с вузами и выстраивает рейтинги школ в привязке к вузам, то есть рейтинг школ не просто по ЕГЭ, а по целевому индикатору, целевому назначению. Есть о чем задуматься. Я думаю, что и органы власти увидят эти результаты. Многие родители посвятили часы изучению школ в Москве – в какую школу лучше вести ребенка, почему эта школа, чем эта школа отличается от другой и т.д.

Лучшее бизнес-решение – Team Greece. Команда сделала небольшое приложение по получению информации о товаре по штрих-коду. Они взяли базу данных Росаккредитации по всем сертификатам соответствия, которые были выданы производителям, заложили это в приложение, дополнили информацию штрих-кодами и общей информацией о продукте. По штрих-коду можно понять, сертифицирован продукт в РФ или нет, а также получить информацию о товаре. Потенциально  приложение можно развивать. Они взяли за основу американских пример по рейтингу товаров и их сравнению по характеристикам.

Лучшее техническое решение – это «Экомониторинг», данные по экологии, загрязненности воздуха, которые публикуются на сайтах. Ребята собрали все эти данные и сделали рейтинг территорий города, определяющий, в какой части города меньше проблем с загрязнением воздуха. Они это реализовали в рамках хакатона в виде приложения для Yota Phone.

Лучшая визуализация – это громадный массив данных, который используется по госзакупкам. Ребята положили на карту данные по результатам проведенных торгов, по видам товаров, в частности, по бензину. Они сделали сравнение по разным регионам и увидели, что некоторые регионы и органы власти покупают 92-й бензин по 50 руб., причем тысячами тонн. Члены жюри, которые представляли проверяющие органы, очень сильно заинтересовались этим, потому что сходу это не бросается в глаза.

У нас была специальная номинация Роструда, который выложил громадный массив данных о вакансиях по регионам России. Информация по всем службам занятости выложена на портале открытых данных и на портале Trudvsem. Разработчик смог визуализировать потребность в трудовых ресурсах в России – получилось достаточно интересное приложение, пока не очень востребованное с точки зрения бизнеса, но полезное, с точки зрения человека, который ищет работу в России и планирует переезд.

Несколько примеров международных приложений, о которых вы, может быть, уже слышали. Все говорят о Climate Corporation, которую продали за $1 млрд [слайд 16]. Мы все хотим стать такой компанией – я бы тоже не отказался создать такую компанию и продать ее. Но пока у нас в России почему-то не создаются такие стартапы. Это приложение работает для страховых компаний – оценивает риски по урожайности. Seulbus – видите, что не только в России создают приложения по транспорту [слайд 17].

В целом, может быть, вы слышали, экономический эффект от внедрения открытых данных составляет $3-5 трлн в год [слайд 18]. Новых цифр международные консультанты, к сожалению, не дают, но все ориентируются на эти триллионы и надеются получить такой эффект. Мы в любом случае видим, что открытые данные дают новые стимулы государству пересмотреть подходы к работе. Вместо создания неудобных, некачественных сервисов, государство начинает концентрироваться на улучшении качества самих данных, для того чтобы разработчики, компании, общественные организации могли разрабатывать те сервисы, которые нужны людям.

Несколько слов о мероприятии по открытым данным, которое сейчас проходит в России [слайд 19]. Мы являемся организаторами и операторами Всероссийского конкурса открытых данных РФ – этот конкурс инициирован Открытым правительством, и на сайте хакатона была о нем информация. Предлагаем присоединяться. Те приложения, которые будут созданы здесь, мы сможем включить в этот конкурс, для того чтобы их презентовать уже в декабре в рамках Саммита по открытым данным, который мы будем проводить в Москве. В рамках Саммита мы хотим собрать в конце года регионы и все федеральные органы власти и точечно обсудить открытые данные по отраслевому принципу в региональном разрезе – как сейчас развиваются открытые данные по каждому направлению: что происходит в здравоохранении, образовании, энергетике, ЖКХ. Какой бы сферы мы ни коснулись, везде есть открытые данные, с которыми можно двигаться дальше. В целом все [слайд 20], буду рад ответить на ваши вопросы – я сегодня здесь целый день, подходите.

[аплодисменты]

Вячеслав Романов: Мы занимаемся ситуацией с открытостью органов государственной власти и консультированием представителей органов власти по вопросам обеспечения доступа к официальной информации. Последние несколько лет также мы занимаемся движением в области открытых данных. Как уже было отмечено, российское законодательство в области открытых данных активно развивается не только на федеральном, но и на региональном уровне. Очень важно, чтобы его положения были воплощены в жизнь. В ходе нашего анализа и консультирования органов власти мы пришли к выводу, что размещение информации и инициатива по размещению должны исходить от тех, в чьих интересах размещаются эти данные и создаются приложения, а также тех, кто эти приложения создает, потому что сами органы власти не до конца понимают, в каком формате информация становится основой для сервиса. Наша организация не относится к разработчикам, но мы налаживаем контакт между разработчиками, стараемся получить сформулированный запрос, для того чтобы в ходе консультирования представителей федеральных министерств или региональных правительств, подведомственных им органов власти и организаций мы могли как донести экспертную позицию, так и растолковать, как нужно внедрять нормативные предписания. Сегодня я бы хотел в общих чертах поделиться информацией о результатах работы за последний год, поскольку мы анализируем то, как развивается ситуация с рынком открытых данных, какова динамика этого развития в целом.

Презентация

Название презентации широкое [см. презентацию, слайд 1]. Поскольку мы не являемся разработчиками, для нас участие в хакатоне и конференции, которая предшествует ему, крайне важно, потому что мы рассматриваем хакатон с точки зрения возможности собрать в одном месте представителей органов власти и заинтересованных ведомств, разработчиков, работающих на основе открытых данных, совместно получить доступ к тем данным, которые уже опубликованы, и на основе имеющихся идей разрабатывать и внедрять какие-то проекты [слайд 2]. В процессе создания этих приложений мы обмениваемся опытом, коммуницируем. И что очень важно, мы получаем возможность, получить какой-то feedback для органов власти, чтобы они размещали и совершенствовали наборы данных. В итоге мы получаем приложения и имеем возможность за счет донесения позиции разработчиков до органов власти повысить качество открытых данных и обеспечить их развитие.

Если говорить о том, в каких направлениях мы работали в течение этого и прошлого года, то мы занимались аудитом порталов открытых данных при помощи собственной информационной системы; мы оценивали то, насколько эффективно реализуются нормативные требования к созданию порталов, размещению на них информации; мы также занимались консультированием органов власти на индивидуальной основе по разработке и публикации перечней приоритетных наборов данных. Для нас, конечно, крайне важно получить запрос той информации, которая интересна для разработки проектов, поэтому мы ориентируемся на опыт других регионов, добившихся большего, стараемся эту практику расширять и унифицировать [слайд 3]. В последнем в этом году исследовании, которое пока еще продолжается, мы постарались проанализировать существующий российский рынок приложений на основе открытых данных – как он изменяется на каком этапе развития он находится сейчас.

Немного подробнее об аудите [слайд 4]. Два раза в год мы составляем рейтинги региональных и федеральных открытых данных, проверяем порталы и разделы с открытыми данными на сайте каждого министерства, каждого регионального правительства, выясняем, насколько выполнены нормативные предписания к открытым данным. В ряде случаев также добавляем к региональным нормативным требованиям экспертные требования. Экспертные требования мы формируем на основе feedback’a от разработчиков и опыта лидирующих регионов. Например, на одном из региональных порталов начали появляться наборы данных, но отсутствовали модули для визуализации, на другом – данные размещены в некорректном формате или у данных есть проблемы со структурой – мы анализируем все эти проблемы, проводим масштабную работу. Помимо рейтинга, мы также предоставляем органам власти консультации, как сделать лучше.

Коротко о результатах аудита [слайд 5]. Требования к федеральным открытым данным реализуются примерно наполовину, а к региональным – на треть. Нужно отметить, что до сих пор еще не все регионы представляют себе, что такое открытые данные. Несмотря на то что уже несколько лет развивается эта тема, некоторые регионы не сделали совершенно ничего. Что касается Санкт-Петербурга, он является одним из лидирующих регионов в этом контексте. У него выполнение нормативных требований – 77% и достаточно хорошее место в рейтинге.

Что касается консультаций, то в нашей системе мы консультируем по вопросу оформления наборов, о том, какие тематики должны публиковаться, отслеживаем, публикуются ли те, что являются обязательными [слайд 6]. Для 85 регионов распоряжением Правительства было установлено, что каждый регион публикует по 16 обязательных наборов открытых данных [слайд 7]. Это реестры и лицензии на медицинскую деятельность, лесной реестр, перечень органов законодательных собраний – довольно странная подборка, но она была принята в качестве федеральной. Мы заинтересовались, как она публикуется, и проанализировали, насколько хороша структура этих наборов в случае, если они уже опубликованы. Примерно так выглядят наши перечни и рекомендации, которые работают в интерактивном режиме [слайды 6-7].

В последнем периоде мы работали с 23 федеральными министерствами и консультировали 31 регион по вопросам открытых данных [слайд 8]. В предыдущем выступлении не был упомянут Пермский край – они тоже достигли выдающихся результатов. Они перешли от упора на количество, когда публиковали несколько сотен наборов, к повышению их качества, реализации интерактивных порталов.

Когда порталы открытых данных только начали появляться, на них часто не была реализована возможность запроса на открытые данные или на повышение качества данных. Взаимодействие потребителя открытых данных и тех, кто их публикует, должно быть обеспечено на максимально оперативном уровне, а не только путем рассмотрение обращения гражданина в течение 30 дней, как предусмотрено по закону.

Что касается разработки тематики Data Set, то это, конечно, вопрос довольно сложный [слайд 9]. Некоторые специалисты считают, что открытые данные должны идти от запроса, то есть пока не сформулирован запрос разработчиков, ничего публиковать не надо. Вот он появляется – и тогда власти публикуют информацию. В этом случае исчезает эффект меню – когда есть из чего выбрать, – поэтому мы придерживаемся позиции, что в любом случае размещение определенной тематики, даже не идеально опубликованной, лучше, чем ее отсутствие и необходимость ее запрашивать и разбираться, должен это кто-то публиковать или не должен.

Мы занимаемся разработкой для региональных органов власти перечней той информации, которую они должны публиковать. Мы также подсказываем, как должна быть организована структура этих наборов данных. Из последних регионов, с которыми мы работали, – это Томская область, Ленобласть (но здесь все еще в зачаточном состоянии), в прошлом году мы также работали с Санкт-Петербургом – дорабатывали ряд наборов открытых данных.

Анализируя количество опубликованных тематик Data Set в регионах, этой весной мы установили, что на порталах регионов уже опубликовано больше 6 тыс наборов открытых данных [слайд 10]. Из них о первоочередных наборах я говорил – опубликовано только 429, около трети. Качество их публикации соответствует требованиям меньше чем у половины. С точки зрения структуры, мы разработали требования к тому, чтобы основные тематические блоки, вроде идентификаторов, то есть название, коды классификаторов, ИНН были опубликованы в любом перечне организаций, чтобы публиковалась контактная информация, геоинформация в виде адреса и географических показателей – в раздельных ячейках, статистические показатели, если речь идет о показателях работы, размещенных в открытых данных, и иная информация в зависимости от самой тематики.

По этому показателю регионы развиваются еще не очень эффективно. Если обратить внимание на цифры, в Санкт-Петербурге ситуация обстоит немного лучше [слайд 11]: опубликованы все обязательные наборы и не только они, качество структуры выше среднего показателя. Также стоит обратить внимание, что в Санкт-Петербурге нормативно утвержден свой перечень приоритетных наборов и системы, которые должны переводиться в открытый формат для того, чтобы данные из этих систем могли использоваться разработчиками при создании каких-то сервисов.

Что касается самих сервисов, то мы проанализировали все приложения на федеральном уровне и на уровне всех регионов– всего их 120 [слайд 12]. Возможно, нам удастся найти еще какие-то проекты, но, к сожалению, они зачастую плохо презентованы, узкоспециальны, и их тяжело обнаружить в сети. Но точная цифра всегда будет немного выше, чем установленная. Мультиплатформенных приложений пока только восемь. Соотношение платформ можно определить по цветам: зеленый – это Android, голубой – Windows и т.д. Веб-приложений – пока 15. На данный момент эта статистика совершенствуется, и мы планируем презентовать исследование по открытым данным.

Что касается Санкт-Петербурга, то имеется 13 разработанных приложений [слайд 13]. Стоит обратить внимание, что пять из этих приложений созданы независимыми разработчиками, то есть не Информационно-аналитическим центром, не по госзаказу. Важен и необходим баланс. Развитие открытых данных и разработка сервисов в лидирующих регионах часто педалируется самим регионом. В прошлом году на это обращали внимание на Совете по открытым данным. Например, в Москве очень много приложений, но многие сделаны за счет бюджета, а это не соответствует тому подходу, при котором данные используются независимыми разработчиками. Пять таких приложений в Петербурге уже есть. Например, среди них победитель прошлогоднего хакатона – сервис Smooth. Приложений для Windows Phone пока в Санкт-Петербурге нет, основная масса, естественно, для Android.

На этом я бы хотел завершить свое выступление и добавить, что мы очень заинтересованы в том, чтобы услышать, с какими наборами вам интересно работать, с какими наборами у вас возникают проблемы, как бы вы хотели, чтобы оформлялась информация в этих наборах – для того чтобы донести ее до региональных правительств, которые эти данные публикуют. С начала следующей недели в ходе публичного дистанционного консультирования мы в течение месяца будем рассказывать представителям всех регионов, как опубликовать информацию, как оформлять свои разделы и порталы открытых данных, поэтому мы очень надеемся на положительный и мощный эффект [слайд 14].

[аплодисменты]

видеозапись выступления

текст выступления

Энрик Массип-Бош: Я работаю в Барселоне, я – архитектор, до недавнего времени я был консультантом мэра по вопросам городской среды, помимо этого, я преподаю архитектуру в Barcelona Tech. А в прошлом году мы совместно с Barcelona Tech запустили программу в Петербурге, которая связана с городской средой. Мы надеемся, что эта совместная программа будет развиваться.

Сегодня я хочу обсудить один вопрос, который меня волнует – о том, как вовлеченность граждан может улучшить город и городскую среду. Если свести это в одно слово, то я бы назвал это «открытости». Звучит неуклюже и по-английски, и по-русски, но это важное название, потому что, с моей точки зрения, есть разные способы быть открытым.

Презентация

Мне кажется, что для хакатона и для идеи открытости центральными являются три понятия [см. презентацию, слайд 2]. Первое – открытые данные, второе – открытое правительство, третье – open source. Они не только покрывают разные эпистемологические аспекты, но и показывают своего рода развитие степени вовлеченности граждан в управление. Открытые данные на этом пути – это только начало. Горизонтом, когда ты начинаешь работать с открытыми данными, является открытое правительство, а конечной, самой далекой и самой трудной целью является подход к работе с городской информацией, городской средой, который подобен тому, как программисты работают с исходным кодом.

Открытые данные – основная тема сегодняшней встречи и работы на выходных [слайд 3]. Это что-то знакомое – то, чем мы так или иначе пользуемся каждый день. Доступ к открытым данным дает нам ощущение того, что мы не только сопричастны, но и ощущение того, что мы – совладельцы этих данных.

При этом открытые данные остаются ресурсом, который, можно сказать, спускается сверху вниз. На него есть спрос, но все равно кто-то его дает, кто-то разрешает пользоваться данными, которыми он владеет. Так или иначе сохраняется ситуация, когда у данных есть самый главный хозяин, который принимает решение о степени открытости и контролирует, кто эти данные может использовать, точнее, пытается контролировать, хотя это не всегда происходит.

Как вы знаете, я занимаюсь развитием городской среды, и для меня наличие и доступность открытых данных, человека, который хочет сделать присутствие граждан более заметным, является одним из важнейших моментов. Как я уже говорил, открытые данные – это не то, к чему мы стремимся, а только первый шаг. Понятно, что мы уже пользуемся открытыми данными каждый день [слайд 4]. И это изменило наше поведение как индивидов, но не очень изменило как сообщества. Можно сказать, что открытые данные улучшили наш опыт взаимодействия с городом, улучшили качество среды – можно привести в качестве примера различные сервисы по навигации. Но и общение с природной средой также изменилось благодаря таким сервисам [слайд 5].

Несмотря на доступность многих данных, все равно мы видим, что границы имеют место [слайд 6]. Если мы посмотрим на карту, то увидим, каким «белым» является Калининград по сравнению с соседними странами. Если мы посмотрим на карту России, то увидим, что в Питере и Москве есть какая-то активность, а остальное «провисает». При этом нельзя сказать, что россиянам не нравится использовать эти данные, нельзя сказать, что россияне скучнее финнов (надеюсь, финнов нет в аудитории).

Рассмотрим теперь вторую тему – открытое правительство [слайд 7]. Если открытые данные даются сверху вниз, то открытое правительство, открытое управление делает эту дорогу двусторонней. Открытое правительство –  модное и громкое название, которое широко используется в демократических странах. Открытость создает своего уязвимости, но ключевыми моментами открытости являются прозрачность и возможность для сотрудничества.

Есть разные способы понимания двустороннего взаимодействия в рамках открытого правительства, но прежде всего у горожанина появляется ощущение сотрудничества в управлении той городской территории, где он живет. Прыгнуть выше этого уровня довольно трудно – мы принадлежим этому сообществу, сотрудничаем, но результат этого сотрудничества горожане все еще не контролируют. Мы можем сообщить о проблеме на дорогах, об угрозе терроризма, о другой проблеме – любую информацию мы можем передать нашему правительству, но результат мы по-прежнему не контролируем [слайд 8]. Тем не менее то, о чем я говорю, не должно преуменьшить значение открытого правительства, потому что оно, действительно, дает гражданам, горожанам долю ответственности за то, как управляется город. Эту долю ответственности нужно и дальше увеличивать.

Мне кажется, что шагом вперед может быть open source – вы лучше меня знаете, что это такое. Эта метафора взята из программирования и означает ситуацию, когда исходный код становится доступным. Из программирования эта идея переносится на другие области. Помимо теоретических разработок, я связан, прежде всего, с open source в создании и управлении городской средой и в архитектуре.

Open source значит еще и открытость интерпретациям. И если поискать определения в разных областях, то они будут самыми разными. Я хочу подчеркнуть два ключевых момента: мы используем данные, участвуя в их создании, мы используем их творчески [слайд 9]. Здесь я должен вас предупредить, что подходы к городской среде, архитектуре, управлению городом на основе метафоры open source кажутся новыми даже передовым западным странам – и там немногие еще к этому готовы. Здесь встают вопросы о легитимности, авторитетности и достоверности информации, которая создается.

Если вернуться к тем трем уровням, о которых я сегодня говорю – открытые данные, открытое правительство, open source, – то открытые данные создаются и контролируются неким полномочным органом, которому мы уже доверили какую-то власть, поэтому они обладают авторитетом, поскольку они происходят от этого органа. На уровне открытого правительства есть вклад условных простых людей, которые не обличены этой властью, не имеют подобного авторитета, поэтому к тому, что создается в открытом правительстве, могут быть вопросы, связанные с авторитетностью того, что в нем создается.

В подходе open source, который, я считаю, должен быть горизонтом нашего движения, вопрос о надежности данных, авторитетности источника еще острее. Поэтому возникает необходимость оценки вклада широкого общества – насколько он информативен, ценен и надежен. Пример с «Википедией» [слайд 10] – один из лучших, если не лучший, потому что это не только ресурс, который любой может отредактировать, но и ресурс, который обладает механизмом, обеспечивающим надежность данных. Когда мы говорим о городе, уровень сложности очень и очень сильно повышается. Один из вызовов, который, может быть актуальным во время хакатона – как сделать те предложения, которые у нас возникают, воплощенными в городской среде.

Я призываю вас смотреть на город не как на противоположность селу. Нет, город – это стиль жизни, который сейчас присущ большей части землян. Почти все мы так или иначе живем в городском стиле, поэтому работа в городе связана не только со сложностью среды, ее многоуровневостью, но и с тем, что город является местом, которое урегулирует конфликты различных групп людей. Самой амбициозной задачей может быть создание такого решения, которое принимало бы во внимание те вызовы городской среды, о которых я сказал.

Давайте, подробнее посмотрим на то, что можно делать с метафорой open source. Нам необходим, как мне кажется, целый ряд довольно абстрактных, упрощенных, ясных построений, а также ряд правил, как с ними работать, чтобы на основе этих правил можно было создать много чего нового в рамках первоначальных построений. Это базовый набор инструкций, который меняется, развивается, эволюционирует. Сама по себе идея не нова – ее можно показать на примере Барселоны или нескольких других городов, но не на примере Парижа или Петербурга. Это своего рода результат развития через open source.

Если вы знаете Барселону, то знаете и то, что бурный период ее развития пришелся на XIX век – три четверти города было застроено именно в это время [слайд 11-13]. Система городской застройки очень регулярная, основана на прямоугольной сетке, похожа, например, на Манхэттен. При этом сама сетка задумывалась так давно, что ее нынешнее применение сильно отличается от идей, которые стояли за ней. Если мы посмотрим на первоначальные планы, то это должен был быть город-сад, когда большая часть того, что сейчас застроено, была бы озелененным пространством. Но все закончилось тем, чем закончилось, хотя мне кажется, что мы могли прийти к своего рода Манхэттену, поскольку используемая система довольно открытая. Здесь есть резкий контраст с Петербургом, который был построен так, как был задуман. Такие же проблемы «закрытости» развились в городах средневековья, где благодаря устройству среды городу трудно становилось трудно развиваться.

Говоря о городе типа open source, как я уже сказал, нужно, прежде всего, иметь в виду набор простых правил, которые определяли бы пространственные отношения, размещение ключевых городских объектов. Это довольно абстрактные правила, которые описывают общее устройство уличной сети, размер улиц и кварталов – на основе этих правил работает своего рода когорта независимых агентов. Каждая операция по внедрению этого набора правил является индивидуальной, и на это счет есть определенная договоренность. Понятно, что в любом городе, вне зависимости от того, какая у него история, необходима адаптация к местным условиям, локальной ситуации. Но здесь как раз вся соль в степени гибкости наших правила, степени изменений, которые они разрешают, возможности различных индивидуальных акций по созданию или изменению городской среды, возможности внесения своего вклад в городской ансамбль и изменения его.

Мне кажется, что осмысление развития Барселоны в XIX веке как подход open source к городскому строительству – это очень мощная идея, которая позволит нам пересмотреть принципы создания и развития городской среды в нынешнее время [слайд 13]. Другими словами, мы с вами говорим о минимальном необходимом наборе правил, который позволил бы городу появиться и существовать в ситуации максимальной открытости к действию отдельных индивидуальных агентов. Но как нам проверить, что результаты этих индивидуальных действий создают высококачественную среду жизни для всех горожан?

Сейчас, конечно, времена изменились, и такой свободы, которая была в период развития города в XIX веке, нет. Главный вопрос, который за этим стоит: кто создает и развивает город? В Барселоне и других европейских городах ситуация поляризованная. С одной стороны, город и большие здания строят большие корпорации, большие девелоперы, с которыми так или иначе работает город. С другой стороны, есть граждане с разной степенью полномочий и уверенности, как именно нужно менять город. При этом единого социального контракта, объясняющего, как этим разным группам взаимодействовать при создании города, общих процессов, в которых все участвуют, не существует.

В изменившихся условиях, когда действует много разных глобальных факторов, когда по сравнению с XIX веком полностью изменилась структура экономики города, когда меняется роль вовлеченности горожан, нам нужно переизобрести правила, по которым различные группы и индивиды взаимодействуют друг с другом. Здесь встает политический момент, поскольку инвестиции в развитие города связаны с узким кругом людей. В такой ситуации очень трудно что-либо изменить снизу, поэтому необходимо привлечение политических ресурсов. Мы видим это, в частности в Барселоне на последних выборах, а также в других городах – к власти приходят партии, основные задачи которых неполитические. Они приходят в администрацию, чтобы изменить подход к управлению городом, работе с горожанами. Это мое личное мнение – переизобретение социального контракта, по которому горожане и другие агенты работают в городе, возможно только через изменение набора правил, по которым живет этот город. Именно те регулирующие документы, которые определяют развитие города, позволят идти к тому горизонту, о котором мы сегодня говорим.

Я хотел бы закончить свое сегодняшнее выступление размышлением на тему open source. Я думаю, все вы пришли сюда не только с личным планами, но и потому что у вас есть живой интерес к этой теме. Я бы даже сказал, страсть. Мне кажется, что желание что-то изменить, конечно, хорошо, но должно быть осознание необходимости этих изменений, потому что успеха мы сможем добиться только тогда, когда осознаем необходимость перемен и можем донести это до других. Страсть разгорается и утихает, но если вы осознали, что что-то необходимо, то это ощущение с вами останется. Я надеюсь, что именно с этим чувством мы будем работать. Спасибо.

[аплодисменты]

Иван Петрухин (основатель, компания «Улица Рубинштейна»): Хотел узнать у нашего уважаемого лектора о том, каких изменений городского пространств удалось добиться в Барселоне при помощи взаимодействия с заинтересованными группами населения, если такие примеры есть, конечно?

Энрик Массип-Бош: Это очень важный вопрос, спасибо. Барселона является лидером в эффективном преобразовании городской среды. Это происходит благодаря активному вовлечению граждан, которое началось еще в момент падения диктатуры Франка. Поначалу, когда в Испании был переходный период от диктатуры к демократии, это проявлялось, прежде всего, в насилии по отношению к различным районам Барселоны. Затем, после перехода к демократии возникли политические формы взаимодействия, которые изменили город. Мы имеем довольно большую историю, и это очень хороший пример того, как первоначальное движение преобразовалось в политические партии и структуры, которые начали менять город. Те же самые люди стали считать, что партии не справляются, и города надо переделать. Через 25 лет после первой волны, пришла вторая, которая показала, что Барселона – лидер в плане вовлечения в городское управление. Основный вектор изменений сейчас связан с тем, что появилось и работает открытое правительство – это хорошо и необходимо, но мы видим, что люди хотят все больше контроля над средой, в которой они живут. Например, последние годы в Барселоне было принято много важнейших решений с участием  горожан – партиципаторность велика, но все равно люди чувствуют, что этого недостаточно. Я думаю, именно поэтому мы сегодня здесь – мы ощущаем запрос, людям нужно дать еще больше доступа к управлению городом, улучшить эффективность изменений, одновременно обеспечивая высокое качество жизни, связанное с городской средой. Я – архитектор, создатель городской среды, и в некотором смысле то, что я говорю, работает против меня, потому что, чем больше социальная вовлеченность, тем меньше мой профессиональный вес. Тем не менее, я как профессионал, обладающий авторитетом, считаю, что не могу сам проинтерпретировать все желания и запросы горожан. Я считаю, что они должны участвовать в процессе создания города.

видеозапись выступлений

тексты выступлений

Руслан Артамонов: Спасибо большое, что пригласили и дали возможность выступить. Темой открытых данных эксперты Высшей школы экономики занимаются с самого начала ее официального появления в России – с момента выхода Указа Президента. Мы писали по заказу Минэкономразвития «Концепцию открытых данных» для РФ, первую дорожную карту, которая была исполнена в 2013 году (сейчас уже исполняется вторая версия). Мы регулярно проводим мониторинги открытых данных и делаем подходы к оценке социально-экономического эффекта. Мы – Высшая школа экономики, поэтому подход к экономике мы не сделать не могли.

Презентация

Сегодня я буду представлять оценку социально-экономического эффекта от публикации открытых данных на примере общественного транспорта Москвы. Несколько слов о предпосылках исследования [см. презентацию, слайд 2]: слева – предпосылки, которые касаются открытых данных, а справа – то, что непосредственно касается транспорта.

В ходе работы мы столкнулись с тем, что в мире нет открытых методик оценки социально-экономического эффекта от публикации данных. Они есть, их множество, есть много разных цифр (например, Василий Пушкин называл цифры $3 трлн по оценке McKinsey), но все эти методики закрытые, логика вычислений не понятна, проецировать их на российский опыт никак не получается. Также мы не сумели найти ни одной унифицированной методики, которая позволила бы оценивать различные отрасли. Как правило, все оценки ведутся либо по крупным отраслям, либо непосредственно по кейсам открытых данных, наборам. В госорганах при публикации открытых данных набор не проходит предварительную оценку востребованности и конечных социально-экономических эффектов. Нам кажется, что это неправильно. Публикуется много наборов данных, но зачастую органы власти опираются только на то, что их заставляют публиковать, или публикуют все подряд, что проще всего опубликовать – это и публикуют в первую очередь.

Публикация каждого набора данных связана с определенными финансовыми и человеческими затратами. Одно дело подготовить и опубликовать набор данных, а другое – поддерживать его на протяжении определенного времени в актуальном состоянии, обновлять и обогащать его. Для этого требуется средства и люди. Мы считаем, что ведомства должны руководствоваться востребованностью и максимальным конечным экономическим и социальным эффектом. У самих ведомств нет понимания того, какие именно эффекты могут вызывать те или иные данные. Они публикуют их, понимая, что в конечном итоге возникнут или не возникнут приложения открытых данных, а что происходит дальше, никто не понимает. В итоге получается так, что сейчас публикуются тысячи наборов данных на портале открытых данных, на региональных порталах, но прорывных приложений, которые получили бы массовое распространение и массовый резонанс, единицы.

Мы поняли, что оценку социально-экономического эффекта проводить необходимо. Мы не стали изобретать велосипед, а пошли по одной отрасли, а именно – по транспорту. И вот почему. Ввиду некоторых особенностей организации дорожного движения в Москве, очень остро стоит проблема пробок. Также число автомобилей регулярно растет и Правительство Москвы в «Программе развития транспорта Москвы» выбрало ключевым аспектом отказ от автомобильного транспорта в пользу общественного, то есть дестимуляция использования автомобильного транспорта в пиковые часы нагрузки. Нам эта идея показалась очень интересной. Также огромные ресурсы вкладываются в развитие инфраструктуры – в строительство развязок и дорог. Но все равно строительство этих объектов не успевает за ростом численности автомобилей – рост их численности идет с опережением, поэтому нужно искать другие факторы, которые могут влиять на дестимуляцию. В Москве очень широко распространены информационные мобильные приложения, поэтому мы сочли эту отрасль наиболее интересной и прорабатывали именно ее.

Как мы ее проработали в ходе расчетов? [слайд 3] Сначала мы провели анализ информационных московских систем – какие данные в них содержаться и какие данные в принципе могут быть опубликованы. К самим системам нас никто не допустил, конечно, но мы нашли несколько экспертов-транспортников и взяли у них интервью. Они нам рассказали, какие данные существуют, в каком примерно они состоянии, в каких системах хранятся, а также – какие эффекты эти данные могут вызывать. В итоге у нас получилась таблица, о которой я расскажу дальше.

Мы сделали анализ потребности пассажиров – промониторили все открытые источники, посмотрели форумы, блоги, поисковые запросы, профильные площадки, собрали оттуда всю фактуру, классифицировали ее и посмотрели, что нужно пассажирам. У нас получилось два потока входных данных. И у нас появилась гипотеза, что если наиболее значимые наборы данных в области транспорта Москвы будут опубликованы, то появится некое приложение с некими характеристиками, которое будет удовлетворять потребностям пассажиров и несколько изменит положение с дорожным транспортом и пассажирскими перевозками в Москве. Это вызовет какие-то экономические и социальные последствия.

Мы провели социологическое исследование, которое подтвердило наши гипотезы. Мы опросили и количественно все измерили, а также уточнили несколько коэффициентов, которые были необходимы нам для экономических расчетов. Мы посчитали экономические эффекты, которые можно как-то измерить в денежном эквиваленте. Отдельно мы посмотрели влияние на экологию – это сейчас очень большое, важное и резонансное направление. Также мы провели анализ других эффектов, которые нельзя посчитать, но можно проанализировать и описать.

В результате интервью с экспертами-транспортниками получилось так, что у нас оказалось двенадцать наиболее интересных наборов данных, которые могут быть опубликованы [слайд 4]. Каждый из этих наборов данных влечет за собой разные эффекты. Есть связанные наборы данных – публикация одного такого набора данных абсолютно бессмысленна без публикации другого набора данных. Например, текущее положение автобуса, его геопозиционирование с GPS- или ГЛОНАСС-приемников абсолютно не интересно, если нет описания самого маршрута. Точно так же описание маршрута малоинтересно, если нет данных о текущем позиционировании автобуса. Так как в Москве расписание транспорта соблюдается крайне плохо, автобусы опаздывают, никто даже не смотрит на это расписание.

Мы проранжировали все эти наборы данных и выбрали четыре набора, которые влекут за собой максимальные эффекты: данные текущего положения транспортных средств (это данные с GPS- или ГЛОНАСС-приемников); данные паспорта маршрута (это описание непосредственно маршрута – через какие остановки и с какой интенсивностью проходит общественный транспорт); данные паспорта остановки (где расположены, чем оборудованы, оборудованы ли для инвалидов – там много всякой информации); данные турникетов (это данные о проходе и выходе – данные турникетов особенно важны при анализе загруженности). Эти четыре набора данных влекут за собой 17 эффектов – есть положительные, есть отрицательные эффекты: повышение наполняемости общественного транспорта; уменьшение времени поездки на общественном транспорте; уменьшение времени в дороге для личного автомобиля; изменение времени в дороге после пересадки с личного автомобиля на общественный транспорт; изменение времени ожидания на остановках; уменьшение потребления бензина и падение доходов от его продажи (отрицательный эффект); уменьшение выбросов в атмосферу; уменьшение спроса на услуги по обслуживанию автомобиля и спроса на сами автомобили (отрицательный эффект); повышение интенсивности использования транспорта гражданами с ограниченными возможностями; повышение транспортной доступности города; оптимизация маршрутной сети и запуск новых маршрутов наземного транспорта; повышение качества жизни за счет высвобождения пространства от автомобилей; увеличение пунктуальности населения; рост лояльности пользователя общественного транспорта; рост туристической привлекательности; повышение производительности труда; появление возможности оценить эффективность расположения инфраструктурных и прочих объектов.

На втором этапе мы посмотрели открытые источники, как я и говорил, – это блоги, форумы. Сообщений масса, большая их часть носит негативный характер. Мы собрали их, обработали и разделили на три крупных категории. Это сообщения о недостаточной информированности – отсутствует информация о маршрутах, точном времени прибытия транспорта на остановочные пункты. Также у людей нет возможности оценить альтернативные маршруты непосредственно на остановке, где ты находишься, и невозможно понять, как добраться до нужного места, если не спросить у водителя или пассажиров.

Отдельной категорией мы выделили проблему организации маршрутов и распределения транспорта по маршрутам. Некоторые маршруты слишком перегружены, там есть очереди на посадку, в то время как другие маршруты вообще не пользуются спросом, поэтому необходима оптимизация распределения транспортных средств по маршрутам. И еще одна проблема – это отсутствие остановки в нужном месте.

Третья категория – это общегородские транспортные проблемы. Эта категория связана с пробками, большим наплывом пассажиров в определенные часы, растущим временем передвижения на общественном транспорте в моменты так называемой пиковой нагрузки. Недостаточное информирование граждан о наличии тех или иных маршрутов, возможностях поиска альтернативных маршрутов и построения связанных маршрутов подтвердили запросы «Яндекса» – мы проанализировали и выяснили, что только по Москве около 2 млн запросов направлены на уточнение маршрутов, как добраться сюда или туда.

По результатам этого анализа мы сделали предположение, что если четыре перечисленных мною набора данных появится в открытом доступе, то должны появиться приложения с функционалом, который удовлетворит определенные запросы пассажиров [слайд 5]. Это приложение должно позволять строить связанные маршруты на различных видах транспорта – связанные различными видами транспорта пересадкой. Приложение должно позволять прогнозировать время прибытия в конечный пункт с определенной точностью, то есть человек должен знать, что если он выйдет в 17 часов из дома, то в 18:30 он будет в нужном месте, причем с учетом пересадок и смены видов транспорта. Приложение должно позволять минимизировать время в пути, стоимость поездки, количество пересадок и построить маршрут для людей с ограниченными возможностями. Эти характеристики очень важны. Также приложение должно позволять минимизировать простои на остановках – если я буду знать, во сколько точно мой автобус подойдет на остановку, я в непосредственной близости от остановки поставлю себе напоминание, выйти в нужное время и сесть в автобус. Приложение должно позволять прогнозировать заполненность наземного городского транспорта. Это важно, чтобы выбирать, каким маршрутом и каким видом транспорта мне лучше добраться. При построении автомобильного маршрута приложение должно позволять построить альтернативные предложения по общественному транспорту. Если я езжу на машине, но буду понимать, что на транспорте я могу добраться в два раза быстрее, то я, скорее всего, оставлю машину и доберусь на общественном транспорте.

Следующим этапом мы предположили, что такое приложение должно появиться, и подтвердили это предположение наличием зарубежных аналогов – их множество. У меня есть печатный вариант нашей книжки – все эти приложения там перечислены. Их больше десяти. Мы провели социологическое исследование, опрос – если это приложение появится, как может количественно измениться экономика города. Исследование дало нам такие результаты: 10% людей, которые ежедневно ездят в рабочие дни на работу и с работы, гарантированно готовы отказаться от использования личного транспорта в пользу общественного. Большая доля людей – порядка 30% – допускают возможность, что откажутся от использования личного транспорта, если там будут другие условия, если будет достаточно комфортно в автобусе и не будет давок. Но 10% готовы гарантированно отказаться – мы используем эту цифру. В социологическом исследовании мы также уточнили несколько параметров, которые нам были важны: сколько в среднем поездок совершает человек на личном транспорте и на общественном, сколько в среднем человек едет в машине, какая протяженность одной поездки и т.п.

По итогам наших расчетов мы получили такие цифры [слайд 6]. Совокупный экономический эффект от публикации четырех наборов данных по транспорту Москвы даст ежегодную экономию для города более 58 млрд руб. Это пять направлений, например, повышение наполняемости общественного транспорта (Мосгортранс получит дополнительные доходы в размере 3,668 млрд руб. в год). Остальные эффекты считаются косвенно – за счет сэкономленного времени. Это уменьшение времени поездки на общественном транспорте – 8,89 млрд руб., уменьшение времени поездки на личном транспорте – 41,515 млрд руб., снижение времени ожидания на остановке – 11,967 млрд руб. Один негативный эффект – это снижение потребления бензина и доходов от его продажи (минус 7,287 млрд руб.).

Дальше мы посчитали экологический эффект [слайд 7]. Из-за того, что люди пересаживаются с личного транспорта на общественный, потребление бензина снижается – соответственно, снижается объем выхлопов. Мы посчитали уменьшение выбросов вредных веществ в атмосферу: окиси углерода – на 3585 т в год, летучих органических соединений – на 400 т в год, оксидов азота – на 967 т в год, диоксида серы – на 90 т в год.

Также мы проанализировали другие эффекты, которые измерить нам пока не удалось, потому что не хватает данных. Это повышение транспортной доступности отдельных районов города, оптимизация маршрутной сети. Сейчас, например, нет возможности посчитать, из какой точки в какую добираются люди. Понятно, что они в каком-то месте садятся в автобус и куда-то доезжают, но из какой конкретной точки они добираются, пока сказать невозможно, и это не позволяет оптимизировать маршрутную сеть. Это повышение качества жизни за счет освобождения пространства от автомобилей, увеличение пунктуальности населения, рост лояльности пользователя общественного транспорта, рост туристической привлекательности, повышение производительности труда и появление возможности оценить эффективность расположения инфраструктурных и прочих объектов.

Последним шагом мы проанализировали государственную программу Москвы по развитию транспорта и свели некоторые показатели результативности, которые там прописаны, с теми эффектами, которые можно ожидать от публикации данных и появления приложения на их основе [слайд 8]. Многие показатели не напрямую, но косвенно перекрываются. И большой потенциал заложен в этих четырех наборах данных – очень многие проблемы в городе можно решить.

Виталий Власов: В Санкт-Петербурге существует портал, который позволяет видеть движение общественного транспорта в режиме реального времени. В Москве подобного портала нет, я правильно понимаю?

Руслан Артамонов: Есть.

Виталий Власов: Уже появился.

Руслан Артамонов: Когда мы писали это исследование, весной прошлого года Департамент информационных технологий Москвы заключил соглашение с «Яндексом» и начали передавать данные о текущем положении транспорта непосредственно «Яндексу», который сделал на этом приложение. Но оно показывает только текущее положение.

Виталий Власов: Это все-таки не открытые данные.

Руслан Артамонов: Да, пока еще не отрытые данные.

Виталий Власов: В Петербурге этот портал существует достаточно давно. Разработчики просят доступ к этим данным, но правительство Москвы не дает почему-то или дает очень выборочно. Они откроются?

Руслан Артамонов: Мы очень надеемся, что они откроются. Недавно стало известно, что на этом рынке, помимо «Яндекса», появляется еще один игрок – это компания «Трафик», которая также будет делать приложения. Я так понимаю, что она тоже получает доступ к данным. В открытом доступе их пока нет, но я надеюсь, что они появятся.

Виталий Власов: Вообще рынок транспортных приложений огромен. То, что далеко не все города России открывают данные, создает проблемы для развития общественного транспорта. Мы знаем, что транспорт у нас часто ходит не по расписанию. Если бы было мобильное приложение, которое хотя бы показывало, когда он придет, то люди могли бы как-то планировать свое время. В прошлом году мы со Всемирным банком делали исследование по транспортным данным Санкт-Петербурга и выявляли различные данные, которые могут быть интересны разработчикам. Тогда мы для себя определили некоторое количество наборов данных, которые было бы полезно раскрыть. Многие из этих данных уже публикуются, но не совсем в структурированном виде. Было сказано о транспорте – хотелось бы отметить также данные по метрополитену. На данный момент во многих городах мира – в том же Лондоне и Нью-Йорке – есть данные о движении поездов в метрополитене в режиме реального времени. Есть также информация о доступности и недоступности той или иной станции метро. Было бы неплохо, чтобы в России метрополитен также раскрывал данные хотя бы о доступности станций. Мы общались с органами власти, которые занимаются этим вопросом. Они сказали, что раскрывать данные в режиме реального времени они не могут, потому что метрополитен – это режимный объект. И все остальные проблемы связаны с этим. Также интересным и важным представляется публикация данных по улично-дорожной сети, включая разметку, расстановку знаков, парковку и т.д., потому что без данных об улично-дорожной сети сложно работать независимым аналитикам, которые хотят их использовать. Еще одна проблема, которая возникает в связи с отсутствием так называемого графа улично-дорожной сети, – это то, что сами органы власти не всегда могут взаимодействовать между собой, в чем они сами признавались. Такого графа улично-дорожной сети в Санкт-Петербурге нет. Не знаю, как в Москве.

Руслан Артамонов: Тоже нет.

Виталий Власов: В общем, об этом говорят все эксперты, но до сих пор ничего не изменилось. Данные по парковкам, безусловно, интересны и по ценам, и по времени – хотелось бы, чтобы эти данные тоже публиковались в открытом доступе. Также интересны данные о задержках в работе общественного транспорта и различных ограничениях дорожного движения. В Санкт-Петербурге есть Государственная административно-техническая инспекция, которая занимается ограничением движения в случае, например, ремонта дороги. Всегда, когда вы видите, что дорога перегорожена, стоят знаки, то за это отвечают они. Информация об этом доступна в формате Excel – они публикуют ее на сайте, но было бы неплохо, чтобы она публиковалась в более современном виде. Это то, что мы хотели бы добавить – что из того, что я перечислил, можно раскрыть или уже раскрыто в Москве? Было бы интересно узнать о ситуации с раскрытием информации по парковкам и по велосипедным маршрутам – это тоже можно отнести к транспортной тематике. Насколько Правительство Москвы раскрывает данные и нужно ли это?

Руслан Артамонов: Я, к сожалению, не знаю, как обстоят дела с парковками и велодорожками.

Василий Пушкин: Велодорожки точно есть в Москве.

Руслан Артамонов: А информация о них…

Виталий Власов: Информация именно в ЗD.

Василий Пушкин: Да, информация в ЗD. На первом хакатоне в июне ребята наложили велодорожки Москвы на данные со Strava (GPS-навигатора для велосипедистов) и увидели, что не все велодорожки, которые построила Москва, по факту используются, и что есть масса маршрутов, которые не используют велодорожки Москвы в принципе. По крайней мере, данные, полученные с GPS-датчиков со Strava показывают реальные маршруты, которыми пользуются, и они не всегда совпадают с тем, что делает Москва по строительству велодорожек. Тем не менее, в строительство вкладываются и треки публикуются.

Из зала: Сколько людей пользуются Strava?

Василий Пушкин: Много – десятки тысяч маршрутов были наложены на карту.

Из зала: Сколько в процентном отношении от общего?

Василий Пушкин: От количества велосипедистов? Затрудняюсь сказать.

Из зала: Думаю, меньше трети.

Василий Пушкин: Те, кто ездит профессионально и мониторят свои маршруты – профессиональные велосипедисты – пользуются.

Из зала: Сколько у нас профессиональных велосипедистов?

Василий Пушкин: Ну, не знаю. Это надо утончить. Но там реально были десятки тысяч записей, которые накладывались на карту. В этом плане ребята выдернули достаточно большой массив данных именно со Strava, чтобы наложить на карту Москвы. Всем было интересно, визуализация получилась.

Михаил Мироненко (блогер): Скажите, пожалуйста, общались ли вы с операторами сотовой связи о том, чтобы забрать у них данные по перемещению абонентов? Они могли бы как раз помочь воссоздать реальную транспортную сеть, потому что видно, как человек перемещается, например, от дома до работы.

Руслан Артамонов: С сотовыми операторами не общались, но насколько я знаю, «Мегафон» проводил такую работу – какой-то фрагмент своих данных он открывал, и на них проводилось что-то типа хакатона.

Василий Пушкин: С сотовым операторами общались мы – буквально последние две недели как раз посвятили вопросам общения с сотовыми операторами и получению каких-то данных, а также возможности их использования и вообще использования больших данных, потому что с каждого телефона собирают порядка 40 показателей с каждого звонка. Данные в чистом виде по закону дать они не могут. Есть Закон о связи, который четко регулирует те данные, которые они могут использовать и предоставлять. Тем не менее, они могут анализировать и предоставлять информацию по перемещению – обезличенные данные по абонентам. По запросу Правительства Москвы все три оператора – и «Билайн», и «Мегафон», и МТС – выгрузили данные по точкам перемещения абонентов,. Изначально это была инициатива «Мегафона». И в принципе сотовые операторы готовы предоставлять сервис по строительству матриц корреспонденции по перемещению людей из одной точки города в другую, но не данные по конкретным людям. Укрупненно они могут такие вещи делать.

Руслан Артамонов: Они могут давать информацию не по одному человеку, а по группе пользователей, иначе появляется возможность идентификации каждого пользователя. Даже если он полностью деперсонифицирован, то по трем точкам положения человека в пространстве в течение суток можно его идентифицировать. Поэтому они могут давать информацию только по группам.

[аплодисменты]

Михаил Карягин: Цель моего доклада заключается в том, чтобы рассказать о проблемах, с которыми стакиваются, во-первых, госслужащие, во-вторых – мы. Я также затрону вопрос качества, то есть, как можно оценить качество открытых данных. Это открытая проблема – мы еще сами не совсем ее решили. Может быть, совместно и получим ответ на этот вопрос.

Презентация

Слава уже сказал – мы анализируем региональные и федеральные органы власти [см. презентацию, слайд 2]. Федеральных органов власти сейчас – 77, так как упразднили один федеральный орган, а региональных – 85. О качестве открытых данных Слава тоже уже сказал, но я попробую объяснить нашу гипотезу о том, почему федеральные открытые данные намного качественнее и лучше развиты, чем региональные [слайд 3]. Вы можете видеть информацию по категориям данных – какая категория представлена лучше [слайд 4]. Обратите внимание, что самая слабо развитая категория – это организация работы с открытыми данными. Этот перечень параметров, по которому мы анализируем, как госорганы работают с представителями разработчиков и самими разработчиками, с организациями. Как правило, госорганы не работают с ними никак, к сожалению. Очень часто, когда мы их спрашивали о том, знаете ли вы какие-нибудь компании, которые занимаются открытыми данными, они отвечают «нет». Никаких региональных хакатонов они не проводят, на контакт не выходят. Это одна из самых больших проблем и для федерального, и для регионального уровня.

На региональном уровне, помимо того, что плохо организована работа с разработчиками, еще и низкое качество самих наборов данных [слайд 5]. С чем это связано? Это связано с тем, что на региональном уровне, к сожалению, до сих пор нет развернутого перечня наборов, которые регионалы должны публиковать. Сейчас региональные органы власти должны публиковать 16 наборов данных, чтобы выполнить все требования законодательства. У федеральных органов власти есть дорожная карта, о которой уже говорили, а на региональном уровне ее нет.

Если категоризировать проблемы и вопросы, с которыми сталкивается представитель регионального органа власти, то вопросы, которые к нам чаще всего поступают, можно разделить на два блока: что публиковать и как публиковать [слайд 6]. Когда чиновник спрашивает, что публиковать, у него есть три самых популярных ответа [слайд 7]. Во-первых, он понимает, что ему можно не публиковать ничего, кроме того, что он обязан опубликовать. Так, например, поступает Камчатский край. Во-вторых, можно публиковать то, что есть в цифровом виде – хотя бы в таблицах. Они просто переводят все это в csv-формат и публикуют то, что есть. Встречаются очень странные наборы данных, и ты не понимаешь, почему они были размещены – оказывается, что эта информация просто была доступна. Третий вариант самый сложный и ресурсоемкий – анализировать свои базы данных и информационные ресурсы и выделять самые перспективные и интересные наборы, которые реально могут быть положены в основу какого-то приложения.

К вопросу, что публиковать – на федеральном уровне тоже есть свои проблемы (выше были описаны больше региональные проблемы) [слайд 8]. На федеральном уровне проблема дорожной карты имеет два аспекта. Первый – это проблема коммуникации с теми, кто принимал дорожную карту. Когда мы интервьюировали представителей федеральных органов власти и спрашивали, есть ли какие-то проблемы, они говорили: «Да, нам на утверждение представляли перечень наборов данных. Мы отвечали, что такую-то информацию не можем предоставить, такой-то информации у нас нет, но все это проигнорировали, нас не услышали. И в дорожную карту ушли наборы, которые изначально от нас запросили». Второй аспект – к сожалению, открытые данные у государственных органов власти делаются, как правило, вручную – они не грузятся из баз данных, а просто собираются из каких-то xls-файлов, переводятся в csv-формат и публикуются на сайте. Естественно, это очень часто вызывает ошибки и неточности в данных, потому что играет роль человеческий фактор. Дорожная карта закрепляет очень жесткие сроки. Одна из причин, почему данные публикуются в csv-формате, заключается в том, что по срокам пора публиковать этот набор – они собирают его руками, а потом уже думают, как же можно сделать базу данных.

С 2014 по 2016 год, согласно дорожной карте, должно быть опубликовано 242 набора. Это количество будет постепенно увеличиваться. Мы как раз закончили анализ федеральных органов власти и выяснили, что опубликовано всего 28 наборов. Сегодня должны публиковать наборы данных 29 органами власти. Восемь органов власти полностью игнорируют это – не разместили ни одного набора из дорожной карты. Шесть федеральных органов власти публикуют все наборы. Остальные органы власти частично выполняют требования – размещают какие-то наборы, но не все.

Один из основных вопросов: где публиковать? [слайд 9] Методические рекомендации закрепляют три возможных способа публикации информации. На региональном уровне, к сожалению, часто возникает вопрос, какой выбрать. Нас часто спрашивают, где публиковать открытые данные – на федеральном портале, создавать свой, в разделе у себя на сайте. К чему это приводит? Это приводит к тому, что часть информации публикуют на федеральном портале, часть – у себя в разделе. В итоге эти данные никак не синхронизируются, поэтому найти полный реестр открытых данных, которые размещает орган власти, бывает очень сложно. Более ужасная картина, когда они публикуют наборы данных у каждого органа исполнительной власти – Министерство образования и науки публикует у себя на сайте свои данные, Министерство труда публикует у себя свои данные, то есть собрать это в единый реестр просто невозможно.

Кто занимается открытыми данными? Аналитическим центром и Открытым правительством поднимался этот вопрос – существует проблема с кадрами. К сожалению, на региональном уровне открытыми данными занимаются, как правило, люди, которые просто ответственны за сайт. Человек раньше публиковал информацию на сайте, к нему пришли руководящие органы и сказали, что еще ты будешь заниматься открытыми данными. Он не всегда понимает, что это такое. Когда он не понимает, что делать, он вообще ничего не делает. Это самый простой способ.

Уже говорилось, что представители органов власти не умеют работать с открытыми данными, но это не так. Мы как никто другой сталкиваемся с людьми, которые хотят что-то сделать, но попросту не знают, с чего начать. Возможно, лекции, которые разрабатывают для госслужащих, нужно внедрять более активно.

Как можно померить качество открытых данных количественными методами? [слайд 10] Какие вообще методы можно было бы использовать? (классическая картинка – измерение в попугаях) В чем измерять качество открытых данных? Как мы решаем эту проблему, я расскажу чуть позже. Возможно, в дискуссии мы поднимем этот вопрос, и у вас будет какая-то позиция.

Я уже сказал о проблеме, а эта часть – о решении [слайд 11]. Что мы делаем для того, чтобы повышать качество открытых данных? Во-первых, мы анализируем сайты госорганов на предмет того, что они уже опубликовали. Мы делаем работу по выявлению информации, которая обладает потенциалом перевода в формат открытых данных. Как правило, для того чтобы понять, что можно разместить в формате открытых данных, мы смотрим, что уже есть в цифровом формате, что может быть интересно для разработчиков. Во-вторых – это анализ нормативно-правовых актов. У каждого региона есть свои НПА, которые регулируют вопросы работы с информацией в регионе, то есть, что должно размещаться на сайтах и т.д. Анализируя их, мы вычленяем те категории информации, которые могут быть размещены в формате открытых данных. В-третьих – региональные дорожные карты. Законодательно не закреплена обязанность региона иметь свою дорожную карту, указывать в ней наборы данных – что именно будут размещать. Это делают «пионеры», и это полезная опция. Она систематизирует сферу открытых данных и подстегивает к развитию. Задавая себе некий план-график, потом приходится его выполнять. Последнее – это региональные хакатоны. Когда мы работаем с региональными органами власти, мы всегда пропагандируем идею, что нужно общаться с теми, кто может взять у вас открытые данные и что-то на их основе сделать. Мы проводили анкетирование представителей органов власти – выяснилось, что всего лишь пара регионов (Пермь, Тула и Ханты-Мансийский автономный округ) организовывали встречи с разработчиками и общались с ними. Очень часто органы власти не знают, есть ли какой-то запрос, создано ли основе их данных какое-то приложение или нет. Они не отслеживают это.

Решение проблемы, как публиковать данные – что делаем мы? [слайд 12] Через нашу систему мы даем доступ к результатам оценок – что выполнено правильно, какой набор в более или менее нормальном состоянии, а какой – нет. Они могут задавать дополнительные вопросы, и эксперты их постоянно консультируют. Мы участвуем не только в таких мероприятиях, где собираются разработчики, но стараемся участвовать в мероприятиях, в которых участвуют и представители госорганов, для того чтобы как-то кумулировать и монетизировать идею, а также рассказать о том, что можно сделать. Один из самых эффективных методов – мы публикуем рейтинг. Соревновательный фактор для органов власти обладает подстегивающим эффектом, потому что иногда они публикуют данные, чтобы быть первыми в рейтинге. Это, конечно, подмена понятий. Публикация данных ради рейтинга – это не самый лучший эффект. Но цель достигается. Если мы исходим из того, что цель состоит в получении данных от госорганов, и это главное, то в принципе использовать метод рейтинга для достижения этой цели – не самый плохой вариант.

И по поводу решения проблемы методов [слайд 13]. В нашем исследовании мы используем качественный и количественный контент-анализ. В качестве единиц анализа выступают параметры, которые мы создаем на основе анализа нормативно-правовых актов. Естественно, само по себе наличие информации не говорит ни о чем: набор есть – отлично. Но каков он? У информации мы выделяем такие критерии: полнота, актуальность, формат, чтобы она соответствовала требованиям методических рекомендаций. С помощью этих методов мы анализируем то, насколько тот или иной орган власти выполняет требования законодательства. Но здесь есть проблема, и она – одна из основных. Она заключается в том, что право, к сожалению, не совсем эффективно описывает эту область. Простой пример: среди обязательных наборов есть перечень отделений ЗАКС. Соответственно, госорганы публикуют набор. Угадайте, сколько там структурных элементов.

Из зала: Один.

Михаил Карягин: Правильно, один – название отделения ЗАКС, и все. Набор есть, требования соблюдены, паспорт опубликован, структура опубликована, форматы нормальные – отлично. Качественный ли это набор? Смотря какие критерии. С формальной точки зрения, качественный – все исполнено. Но что с ним можно сделать? Практически ничего. Критерий эффективности – это самый важный вопрос, к которому мы вернемся. Федеральная дорожная карта как раз закрепляет, что публиковать, но, к сожалению, не закрепляет, как. Последние две недели мы работаем над структурами и понимаем, что в некоторых наборах по дорожной карте понятная структура – в них уже изначально заложено, что публиковаться информация будет согласно правилам отчетности, которая ведется в госорганах. Там уже есть категория обязательной информации и все достаточно просто. А есть наборы, где такой четкой структуры нет, госорганы такую отчетность не сдают, поэтому нельзя посмотреть, в каком формате человек вел все эти реестры. У Роструда очень много обязательных наборов, но по многим из них не понятно, какую структуру можно было бы запросить. Это проблема, над которой еще стоит поработать. Мы хотели и вас об этом спросить, ведь зачастую не всегда понятно, какая информация может пригодиться по той или иной тематике. Нужны ли здесь геоданные или нет, нужно ли указывать ИНН или нет. Это открытый вопрос, над которым мы еще работаем. Я с радостью отвечу на ваши вопросы.

Из зала: Каким образом происходит запрос каких-то данных?

Михаил Карягин: Если это федеральные органы, то мы апеллируем к нормативно-правовым актам – у каждого нашего требования есть нормативное обоснование. В нашей системе каждую нашу рекомендацию мы подкрепляем фразой, что данный набор вы должны разместить в соответствии с пунктом таким-то нормативно-правового акта такого-то. Это работает. Иногда мы еще практикуем такую вещь – на сайтах есть формы обратной связи, через которые можно попытаться запросить набор. Слава, по-моему, пробовал запросить – у тебя получилось?

Вячеслав Романов: Да, у меня получилось, но результат в плане качества был, конечно, не очень хороший.

Михаил Карягин: Через такие механизмы – либо давить на то, что это нормативные требования, либо попытаться какими-то иными способами добиться от них публикации.

Вячеслав Романов: Вне зависимости от того, идет ли речь о федеральных или региональных данных, конкретной нормативно закрепленной тематике набора (написано, что перечень органов ЗАКС размещается), вне зависимости от того, указан это набор или нет, запросить информацию можно. Эта возможность нам обеспечена как нормативно – в Законе №8-ФЗ прописано, что информация, которой владеет орган и распространение которой не ограничено, размещается в формате открытых данных. Это обеспечено и технологически, потому что на региональных сайтах и на федеральных сайтах размещаются стандартные формы обратной связи. Существуют специальные формы для запроса информации в формате открытых данных на региональных порталах. Такая форма есть и на федеральном портале открытых данных. В этом случае запрос будет отправляться людям, ответственным за публикацию открытых данных на соответствующем портале соответствующего органа власти. Поэтому единственное, что нужно знать, – обладает этой информацией орган власти или не обладает, и стараться обратиться по адресу. Например, у меня был случай, когда мы создавали довольно простой сервис, связанный с расчетом процентов за использование денежных средств. Со всех сайтов арбитражных судов исчез калькулятор, потому что вступили в силу новые правила расчета этой задолженности, и она немного усложнилась. Сайты арбитражей сейчас никто толком не обновляет, и люди были вынуждены все это считать у себя дома в Excel. Мы решили разработать калькулятор. Я подумал, почему бы нам этот калькулятор не формировать на основе набора открытых данных. Данные – это средняя ставка банковского процента, которую он утверждает. Я обратился к Минфину: «Ребята, может быть, вы распоряжаетесь этой информацией?» Они говорят: «Нет, не мы». Я пишу в казначейство: «Может быть, вы как-то с этим связаны». – «Нет, это все ЦБ РФ». А ЦБ РФ не обязан публиковать открытые данные, поэтому мы были вынуждены сделать маленькое простое приложение банально – на основе документа в xls-формате. В данном случае я попал в ситуацию, что обращаюсь не по адресу – данной информацией орган не обладает. Если же он ею обладает в любом формате открытых данных, то запросить ее можно, и рано или поздно этот запрос может быть удовлетворен.

Алексей Сидоренко: Михаил, может быть, вы говорили, – я правильно понимаю, что «Инфометр» производит множество количественных данных?

Михаил Карягин: Да.

Алексей Сидоренко: А вы публикуете их в формате открытых данных?

Михаил Карягин: Наши данные – на сайте, и вы можете зайти в систему и выгрузить все наши данные в csv-формате.

Алексей Сидоренко: И под свободной лицензией?

Михаил Карягин: Да, и сама система сделана по открытой лицензии – вы можете ее скачать, поставить у себя. Это очень хорошо.

Алексей Сидоренко: И тогда следующий вопрос: у вас есть какие-то идеи и данные, которые можно было бы использовать на хакатоне? У вас были какие-то собственные нереализованные идеи, с которыми можно было бы поиграть?

Михаил Карягин: Данные по открытости можно было бы использовать для гражданских целей. Мы анализируем не только открытые данные, но еще и сведения по борьбе с коррупцией, сведения о доходах. И у нас огромная база данных – мы еще сохраняем ссылки на информацию. Любой, кто интересуется сведениями о доходах, может зайти к нам, получить ссылки, скачать данные о доходах и как-то их проанализировать.

Алексей Сидоренко: Например, выявить корреляцию между открытостью сайта и доходами?

Михаил Карягин: Да. Используя наши данные, мы сейчас анализируем, влияет ли размещение баннеров политических партий на сайтах парламентов на политическую ангажированность. Условно говоря, влияет ли то, что на сайте размещены только баннеры «Единой России» и КПРФ на соотношение сил в самом парламенте и на соотношение голосов, которые они отдают за те или иные нормативно-правовые акты, которые голосуются. Можно использовать данные по-разному – например, просто как базу данных, для того чтобы не искать составы всех парламентов, то есть можно скачать наши данные и получить 85 ссылок на эти же самые наименования. Можно попытаться использовать как-то еще. У нас все данные выгружаются в формате открытых данных.

Вячеслав Романов: Всегда есть возможность взять результаты исследований за несколько лет, чтобы сопоставить динамику, или взять данные по открытости различных органов власти и сгруппировать их по регионам, для того чтобы выявить региональную специфику – она совершенно четко прослеживается. Если вам действительно интересны данные, вязанные с обязательной публикацией нормативной информации, то я советую обратиться к нашей системе – там достаточно четко все эти виды перечислены. Если у вас появятся какие-то вопросы или запрос на какую-то информацию, то пишите нам на нашу электронную почту или обращайтесь лично.

Александр Кирсанов (разработчик): Правильно ли я понимаю, что данные, которые вы используете, – это статичные данные, не структурированных не бывает?

Михаил Карягин: Есть разница на каждом сайте в каждом регионе. Где-то бывает, что можно скачать в разном формате, но, как правило, данные размещаются в csv-формате. Когда вы их открываете, то видите, что эти данные были созданы руками. Иногда там бывают опечатки – сразу видно, что это не систематизированный сбор.

Александр Кирсанов: В основном это таблицы?

Михаил Карягин: Да.

Александр Кирсанов: А вы не пробовали поменять слово «данные» на слово «реестр»? 

Михаил Карягин: Здесь может быть другая проблема – чиновник мыслит нормами и законами. По закону он должен размещать «открытые данные», а не «реестры». Если ему сказать, что он по закону должен размещать реестры, то он скажет: «Нет, я должен размещать открытые данные». Это сложно. Я понял мысль. Мы всегда стараемся до них донести суть. И мы работаем не только с данными. У нас есть параметр «адаптивная верстка сайта». Есть очень допотопные сайты и они плохо работают на устройствах с разной шириной экрана. Многие не понимают, что такое адаптивная верстка. Мы им рассказываем, подробно объясняем – мы всегда пытаемся до них донести информацию на более понятном языке. У меня был такой кейс – я звонил в Чечню и Ингушетию и пытался узнать, кто у них занимается открытыми данными, а они спрашивали, какими отрытыми данными, путали их с персональными данными, думали, что я хочу у них что-то получить. В итоге я так и не нашел человека, ответственного за открытые данные, потому что никто не знал, что такое открытые данные. Но мы всегда стараемся говорить с ними на одном языке.

Глеб Чипига (разработчик): Как много публикуется открытых геоданных? Есть ли хорошие примеры?

Михаил Карягин: С геоданными все не так хорошо, потому что они публикуются совершенно по-разному. Иногда широта и долгота публикуются в одной строке, иногда – в разных. Например, в Свердловской области вбивают в элемент структуры адрес, потом этот адрес как-то прогоняется и получается долгота и широта, а затем заносится в набор данных. Но они не точные, то есть адрес объекта внесен, а широта и долгота не соотносятся с этим адресом. Сами геоданные публикуются на федеральных порталах, а на региональных – хуже. Если говорить о хороших примерах, то в Туле очень многие наборы публикуются с геоданными.

Глеб Чипига: А что публикуют? Координаты?

Михаил Карягин: Чаще всего публикуют только точки. Выписывать какую-то область очень сложно.

Глеб Чипига: А знаете ли вы, публикуют ли открытые данные суды?

Михаил Карягин: Нет. Они не обязаны. Обязанность публиковать открытые данные закрепляется Законом №8-ФЗ, который на суды не распространяется. Суды не публикуют открытые данные. Максимум, на что хватает органы судебного департамента и областные суды – публиковать хотя бы в Excel, что уже хорошо, плохо, когда публикуют отсканированные pdf в графическом формате. Это просто ужас. Excel для судов – это уже неплохо. Кстати, данных у них очень много. Они могли бы, конечно, заняться этим. Элементарно – какие-то картотеки дел, статистика. Судебная статистика – это очень ценная информация.

Анастасия Кинчарова (социолог): Можно ли запросить данные в формате, который удобен нам самим, то есть сделать формочку, чтобы государственные органы ее заполнили? Или они посылают только данные в своем формате?

Михаил Карягин: Методические рекомендации не закрепляют обязательный формат – например, вы должны публиковать только в csv. Каждый выбирает на свое усмотрение, но csv проще, поэтому к нему чаще прибегают. Вы можете запросить, но сослаться на какую-то норму, которая бы их обязывала это сделать, вам вряд ли удастся. Но попросить можно.

Анастасия Кинчарова: То есть, в таких случаях они готовы идти навстречу?

Михаил Карягин: Да, во-первых, они готовы, а во-вторых, в регионах это воспринимается как имиджевый эффект: у нас есть API. Допустим, у Минкульта есть базы API. Когда я был у них, они спросили: «Вы оцениваете наши данные – все публикуют в csv, а у нас даже база данных есть?» Для них это имидж и можно попробовать давить на это.

Анастасия Кинчарова: Спасибо. Еще один вопрос по поводу использования. Мне кажется, что вопрос использования данных и запроса на данные ключевой. У вас есть свои задачи, как я поняла. Есть ли еще какие-то субъекты, которым нужны эти данные? Я не знаю коллег-социологов, которые пользовались бы этими данными. Мне кажется, в этом большая проблема, но я об этом ничего не знаю и хотела бы услышать от вас.

Михаил Карягин: Вы – социолог, да?

Анастасия Кинчарова: Да.

Михаил Карягин: Вам зачастую очень нужны количественные данные для проведения, например, регрессионного анализа. Вы можете зайти на сайт Росстата, у которого очень много открытых данных. Но еще больше у него баз, из которых пока выгрузить открытые данные, к сожалению, нельзя. Вы могли бы использовать в своем исследовательском проекте эти самые базы данных. Допустим, вы пишите о политических режимах, и вам нужно посмотреть, как уровень доходов в регионах влияет на развитие политического режима – есть ли связь и т.д. Где взять эти данные? По логике вещей, надо идти на Росстат и взять там эту информацию. Вы можете получить эту информацию в человекочитаемом формате, потом все это забивать в SPSS и как-то работать с этим. Но это время. А если вы получите их изначально в машиночитаемом формате и будете владеть не только программным обеспечением, но еще и специфическими навыками, то у вас все это получится намного быстрее. Зачем нужны открытые данные социологу – они многократно упрощают вам жизнь.

Анастасия Кинчарова: Да, я с этим совершенно согласна. Конечно, я приврала, что их никто не знает и не использует. Используют, но не так много, как хотелось бы. Вопрос в том, как ввести в материал. Есть данные, о которых исследователи не знают – не все продвинуты. Есть исследователи, которым ужасно не хватает информации, потому что открытых баз данных социального характера не так много. Спасибо Вышке, которая что-то делает, но этого все равно мало. Как это сделать? Как вы это видите?

Михаил Карягин: Всегда нужен спрос. Я – социолог, ищу данные и их не нашел. Что я делаю? Я могу просто бросить эту тему и сказать – нет данных, не могу работать. А могу попытаться получить их через социальные запросы. У нас по закону всю информацию, которая вам нужна, которая не запрещена к открытию, не имеет грифа ДСП, не является гостайной, вы имеете права запрашивать. К сожалению, пока наших чиновников не пнешь, они не будут работать.

Анастасия Кинчарова: Можно еще маленький комментарий? Я просто хочу сказать, что надо образовывать друг друга. Люди, которые имеют доступ к данным и могут их получить и социологи должны друг друга образовывать на тему того, что у нас есть, и чего мы хотим.

Михаил Карягин: Я согласен. Наверное, мы все здесь поэтому и собрались.

Василий Пушкин: Можно я добавлю несколько слов? Мы как Аналитический центр являемся операторами запросов, которые поступают на федеральный Портал открытых данных. Там есть специальная форма – мы обрабатываем запросы, формируем атрибутивный состав по каждому набору, обосновываем, почему эти данные должны быть так или иначе раскрыты, если в запросе это не указано, и направляем официальный запрос в органы власти. Это некий дополнительный стимул и возможность получения информации. К сожалению, раскрытие не очень большое. Наверное, из 100 запросов, которые поступили через портал, опубликованы органами власти порядка было десяти наборов данных. Тем не менее, у нас начала формироваться база данных запросов, в том числе не получивших ответы от органов власти. Следующим этапом мы выносим это на правительственную комиссию как ситуацию, по которой нужно принимать решение – либо обязывать органы власти публиковать эту информацию и спрашивать, когда она будет опубликована, либо принимать решение, что эти данные не могут быть опубликованы никогда по каким-то причинам – это секретные данные ограниченного доступа. Так что если есть потребность в данных, пишите на Портал открытых данных – это все попадает лично ко мне, а от нас наверх уходят письма. Мы регулярно общаемся с органами власти на предмет раскрытия дополнительных данных. Уже поступило достаточно много интересных запросов.

Александр Кирсанов: А почему стоит вопрос о публикации? По мне, публикация – это документ передачи информации третьему лицу или собственному уполномоченному органу. Почему в кабинетах подразделений возникает проблема с публикацией? Они должны сформировать документ и послать его, например, тому, кто занимается прессой. Кто должен иметь отношение к публикации? Кем должна производиться публикация от имени органа власти?

Михаил Карягин: Происходит по-разному. Это зависит от менеджмента, выстроенного в самом органе власти. Иногда публикацией занимается информационно-аналитический центр при органе власти.

Александр Кирсанов: Я ставлю вопрос: должен ли это быть документ или нет?

Михаил Карягин: Я не совсем понимаю ваш вопрос – в смысле, документ?

Александр Кирсанов: Подписанный, заверенный.

Михаил Карягин: Это зависит от регламента, который разработан на региональном уровне – процесс публикации происходит по-разному. Не думаю, что заверять набор данных обязательно. 

Александр Кирсанов: А к документу прикрепляется набор данных…

Василий Пушкин: Давайте, не путать официальную информацию, доставленную по запросу, и открытые данные, опубликованные на сайте либо где-то на портале в формате открытых данных. Это две разные вещи. За открытые данные, если смотреть правде глаза, орган государственной власти ответственности не несет. Это данные, которые собираются органом власти и публикуются для дальнейшего использования. В принципе органы власти очень трепетно относятся ко всему, что они публикуют, потому что за то, что они опубликовали, их могут «подцепить на крючок» и спросить, зачем они это сделали, а также наказать. Это с одной стороны. А с другой стороны, если вы посмотрите на все наборы данных, которые опубликованы, то к ним есть приписка, что они распространяются по открытой лицензии. В открытой лицензии, если прочитать внимательно, написано, что орган власти за использование данных, которые взяты отсюда с последующим использованием в каких-то приложениях, ответственности не несет. Но в соответствии с Постановлением Правительства, за каждым паспортом набора данных должен быть приказом назначен ответственный – какая-то внутренняя ответственность есть.

Александр Кирсанов: И для чего ответственность?

Михаил Карягин: Здесь, скорее, ответственность в том, что если вдруг набор недоступен, вы можете быстро связаться с ответственным. Там даже есть номер телефона, по которому вы можете позвонить и сказать: «У меня приложение на базе вашего набора, а он недоступен».

Глеб Суворов (журналист): А если данные искажены по каким-то причинам – не намеренно, но просто там ошибки…

Михаил Карягин: По методикам и рекомендациям на странице каждого паспорта должен быть инструмент по повышению его качества, то есть вы можете оставить комментарий, что в таком-то поле ошибка. И ее должны исправить. Административной ответственности за ошибку нет.

Глеб Суворов: А примеры исправления ошибок существуют?

Михаил Карягин: Да, вы можете на Портале открытых данных посмотреть – по популярным наборам публикуются комментарии, видна ветка комментариев. Есть кейсы, когда была ошибка, кто-то о ней написал, админ поправил, и все стало нормально. На региональных хуже – на такие вопросы не отвечают. Я сам один раз писал – был вопиющий случай, когда в поле номера телефона было написано «плюс семь», а потом – иксы. И так для всех 150 социальных номеров. Я написал, но мне, к сожалению, даже никто не ответил.

Виталий Власов: Спасибо, давайте на этом заканчивать.

[аплодисменты]

видеозапись выступлений


тексты выступлений

Александр Карпов: Я только сейчас, выйдя сюда, оценил юмор в названии своей презентации. Это шизофрения в чистом виде, потому что, с одной стороны, я – активист (как руководитель Центра экспертиз ЭКОМ), а с другой – госслужащий (как помощник депутата Заксобрания). Так что это будет полностью шизофреническая презентация – про две тенденции, которые борются в одной голове. Говорят, что это интересно.

Для того чтобы отнестись к предыдущему выступлению, я буду в основном показывать примеры, из которых вам станет ясно, почему госорганы не дают открытые данные. Здесь есть люди, которые борются за раскрытие данных, а есть такие злобные люди, наподобие меня, которые используют эти данные и отбивают у госорганов всякое желание что бы то ни было раскрывать. Это первое. Второе – как я понял, наша ситуация, может быть, еще не была проговорена. Мы работаем с полуоткрытыми данными, потому что внутри системы органов государственной власти есть такая штука как информационный обмен, урегулированный действующим законодательством. Между органами госвласти заключаются соглашения об информационном обмене. Я сравниваю эти две системы – то, что происходит между органами власти, и то, что активисты требуют у государства в плане открытых данных, и понимаю, что у нас типичная модель «двух обществ». Есть закрытая модель – «кастовая», у которой те же самые проблемы с качеством данных, недостаточностью массивов, с дублированием сбора информации, но все это функционирует не на основе открытых лицензий, а на основании соглашений об информационном обмене. Но проблемы все те же самые. Эта система закрыта для публики, не видна для неё. И проблемы, которые в ней есть, тоже не видны обществу. Коллеги рассказывали о тех экономических выгодах, которые будут от того, что мы раскроем данные – в первую очередь выгоды будут от того, что повысится качество исходных данных, используемых самими органами власти. Но именно этого они и боятся. Дальше начинаются другие проблемы.

Презентация

Теперь о том, что я хотел сказать о нашей работе. Я просто буду показывать примеры и уроки, которые можно из них извлечь. Не будет никакой теории, только в конце – немножко выводов. Я начну с истории №1 [см. презентацию, слайд 2]. Драматическая картинка, которую можно сделать еще более драматической, если вначале показать просто фото из Google без линий. Тут видно строящийся порт, природный заказник, как раскапывают на дне залива канал для прохода судов – с понятными последствиями для природы. Это Петербург, город Ломоносов – здесь дамба, а здесь конфликтный участок. Вот здесь – люди, которых буквально сейчас выселяют из их домов и отбирают у них землю. Вот это – кусок заказника, который хотят изъять из заказника. Это такой узел социальных проблем. Если кликнуть по ссылке, то можно перейти на карту Google, где будут наложены все эти границы, которые здесь нарисованы.

В чем смысл этой картинки? До нашего вмешательства в эту историю поразительным образом мало кто догадывался, что красный участок предлагают изъять из природного заказника для размещения порта. До нашего вмешательства мало кто догадывался, что граница порта, установленная федеральным законодательством, проходит по синей линии. Коричневый контур – это территория порта. Соответственно, если посмотреть, то видно, что изымаемый участок находится за официальной границей порта. Порт – здесь, заказник – здесь. Но во всех дискуссиях на эту тему говорилось, что этот участок – это часть порта, поэтому он должен быть передан порту.

Это большой морской порт в Санкт-Петербурге [слайд 3], чтобы было понятно – это официальная картинка. Но это нельзя назвать открытыми данными, потому что это jpeg. Это та история, о которой мы говорим в данный момент. Это (синим) акватория и красным – так называемые портовые районы.

А вот так утверждены границы морского порта [слайд 4]. Постановление РФ – 177 страниц координат текстом без картинок. До того, как мы вмешались в историю с этими границами, в городе не было ни одной живой карты контуров портовых районов – что акватории, что территории. Наше активистское вмешательство заключалось в том, что мы импортировали все это в ГИС, выложили на Google и т.д. Это точечное вмешательство радикальным образом изменило позиции в довольно конфликтном споре между городом и портом. Если вы поинтересуетесь потом в интернете, кто является оператором ММПК «Бронка», кто стоит за «Фениксом», кто владельцы, то увидите там много известных фамилий с интересным бэкграундом. Это такие ребята, слова которых по умолчанию вызывают уважение. Но вмешательством с такой достоверной картинкой оказалось возможным изменить даже слово этих уважаемых ребят.

Этой историей мы не ограничились [слайд 5]. Это часть Крестовского острова, его южная дорога. Синей линией показана тоже граница акватории Большого морского порта. Удивительным образом этот как бы кусок земли (это наложение Генплана и границы Большого морского порта) лежит в акватории Большого морского порта. Этого не может быть, потому что не может быть никогда. Тем не менее, до нас почему-то никто этого не выявил. Когда я опубликовал картинку в Facebook, кто-то из архитекторов пришел и написал: «Спасибо, как здорово. А мы рассматривали эту территорию для клиента как потенциальную площадку для инвестирования». Я говорю: «Теперь позвоните клиенту и скажите, что вы его спасли от миллионных потерь».

А это пробивка набережной Макарова на Васильевском острове и перспективный мост с острова Серный [слайд 5]. Все в Питере уже слышали эту историю – строят, строят и никак не могут построить. Я не уверен, что его построят. Эта пробивка тоже лежит в акватории Большого морского порта. Каким-то гениальным образом те, кто проектировал, не соотнесли две картинки, не наложили друг на друга.

Что делаем мы? Мы не только накладываем картинки, но еще и предпринимаем определенные энергичные действия. Это ответ из прокуратуры о том, что в этом случае нарушений не найдено, а в этом случае нарушения найдены и вынесено предписание внести изменения в Генеральный план Санкт-Петербурга [слайд 6]. 

Ещё одна свежая история, но из другой области: ввод жилья в Санкт-Петербурге за десять лет – с 2005 по середину 2015 года [слайд 7]. Данные о точной локации всех адресов с квартирографией, адресами и явками мы получили по запросу от Комитета по строительству (раньше 2005-го у них нет). Спасибо и на этом. Дима Воробьев сделал замечательную инфографику, которая показывает, как прирастал жилищный фонд в Петербурге за последние десять лет. Довольно драматическая картинка, потому что видно, что это очень неравномерный рост. То, что получилось черным, мы видим как территории потенциальных, а иногда и реальных социальных проблем, потому что это те территории, где не хватает инфраструктуры, где автомобильные пробки – все, что положено в связи с бурным строительным ростом.

Все истории, которые я рассказываю – это реальные истории последнего времени, что обуславливает некоторую избыточную живость моей речи, потому что для меня это дополнительный адреналин каждый раз, когда я об этом вспоминаю. Это слайд из презентации, которая только что была сделана на депутатских слушаниях Законодательного Собрания, когда Комитет по градостроительству презентовал отчёт о реализации Генерального плана Санкт-Петербурга [слайд 8]. Внезапно в этом докладе появляются такие слова: по данным Комитета имущественных отношений Санкт-Петербурга, общая площадь жилищного фонда составила 140 млн кв. м, а средняя жилищная обеспеченность, рассчитанная по данным Комитета имущественных отношений Санкт-Петербурга, составила 27 кв. м на человека. Для непосвященного человека это ничего не говорит. Но у того, кто съел не одну собаку, а целое собачье стадо, это сразу вызывает настороженность. Почему вдруг данные Комитета имущественных отношений, если в прошлом эти данные всегда давал Комитет по строительству? Почему вдруг 140 млн кв. м? Почему 27 кв. м? Знаете, почему? 27 кв. м потому, что в Петербурге есть целевой показатель – 28 кв. м жилья на человека, на который должны были выйти к 2015 году. А кроме того, этот показатель «средней температуры по больнице» используется для расчета инфраструктуры. То есть, для того чтобы определить, сколько нужно на территории детских садиков и школ, берем массу жилья, которую там собираются построить, делим на эту примерную плановую цифру и получаем расчетное население. А из численности населения получаем количество садиков и т.д. Поэтому каждый лишний метр в этой цифре снижает расчётное население – и это хорошие миллионы, не потраченные на социальную инфраструктуру. А для кого-то, наоборот, это дополнительные расходы, связанные с тем, что социальной инфраструктуры не хватает. Поэтому битва за эти показатели такая, что Наполеону и не снилась.

Начинаем анализировать. Как мы анализируем? Самый действенный инструмент аналитики – это четыре действия арифметики. Берем данные за предыдущий год, складываем с тем, что приросло – и получаем другую цифру. Разница между тем, что должно быть, и так называемыми данными КИО – 10 млн кв. м, то есть это прирост жилья за три года. Представляете, у нас вдруг в городе появляется дополнительный объем жилья, равный трехлетнему строительству. Надо проверить. «Это же по данным кадастрового учета», – говорит КГА. – «Мы не знаем. Мы получили эти данные от КИО».

Тут начинается интересное. Данные кадастровой оценки опубликованы. Это огромный массив открытых данных в таблице Excel. При помощи Open Refine’a, который мы изучали на предыдущем хакатоне, их можно проанализировать. Считаем – получается не 140 млн кв. м, а 118 млн кв. м. Средняя жилищная обеспеченность по данным о вводе жилья – 25 кв. м на человека. Ещё раз – не 27, а 25, при целевом показателе 28. Вот цена вопроса – к вопросу о социальной эффективности открытых данных.

Дальше строим картинку, как все это росло – все достаточно очевидно [слайд 9]. Строим другую картинку – тоже на открытых данных, потому что валовой региональный продукт тоже открыт [слайд 10]. Строим корреляцию, строим регрессию – она достаточно достоверна [слайд 11], строим прогноз [слайд 12]. Делаем разные сценарии роста объёмов жилья: пессимистичный и оптимистичный, включая демографию. 

Все картинки я строил сам – это заняло у меня два рабочих дня, потому что надо было данные выковыривать откуда-то, проверять и т.д. – может быть, чуть больше, может быть, чуть меньше. В НИПЦ Генплана, который готовит доклады о реализации Генплана, достоверность которых мы оцениваем, работает то ли 250, то ли 300 человек. Такое вот сопоставление масштабов мощностей активиста (с открытыми данными) и госорганизации.

У этой истории есть еще одно измерение: не я один занимаюсь пересчетом этих цифр. Как вы понимаете, есть другая сторона. Есть застройщики, которым выгодно завысить норматив по средней жилищной обеспеченности. Они тоже на этих же данных считают те же показатели – у них получается 40 кв м на человека. Здесь начинает реальная битва разных сторон гражданского общества на базе открытых данных, и это вам не Warcraft какой-нибудь.

Третья история – это обеспеченность муниципальных образований зелеными насаждениями на одного человека в процентах от норматива [слайд 13]. Если мы посмотри на город с такой точки зрения, он будет выглядеть удивительно и немножко странно, особенно если мы посмотрим на эти муниципалитеты – Серово, Ушково. По формальным показателям там кромешный ад – недообеспеченность зелеными насаждениями катастрофическая. Но с точки зрения реальной ситуации… им там скверики не очень нужны, они практически в лесу живут. Норматив обеспеченности устанавливается не на город, а на район. На весь Курортный район – единый норматив и где-то он выполняется лучше, где-то хуже, но все равно – средняя температура по больнице.

Что стоит за этим нормативом? За ним стоят деньги, которые тратит Комитет по благоустройству на  содержание зелёных насаждений. За значениями этого норматива по районам – битва несчастных жителей центральных районов за каждый скверик под окнами. Они бьются за скверик, а им говорят: «Вы знаете, в среднем по району все хорошо, а ваш скверик – ну, не повезло. Но в среднем по городу норматив выполняется на 200%». Действительно, если сложить центральные районы с парками в Петродворце, в Пушкине, с Курортным районом, – да, все будет хорошо.

До того, как мы научились строить такие карты и картинки, разговор на эту тему с органами власти был вообще бессмысленным. Они становились в позу и говорили: «Вы – не специалисты, вы ничего не понимаете». Пока у нас не было цифр, способных доказывать, мы были бессильны. Зато теперь мы можем строить какие угодно картинки со скоростью, которая сильно превышает скорость работы комитетов, потому что им нужно письмо написать друг другу, а я обхожусь без этого.

Мы видим интересные вещи, нетривиальные ситуации. Вот это, например, муниципальное образование поселок Александровская [слайд 14]. Очень плохая обеспеченность согласно нормативу. Но дело в том, что все жители поселка Александровская ходят пешком в Баболовский парк. Им  не нужны «свои» парки. Но Баболовский парк относится к другому муниципалитету, поэтому формально не учитывается в расчётной обеспеченность населения Александровской. Множество всяких таких интересных эффектов. В то же время мы видим две реально тяжелые ситуации – это муниципальные округа Ржевка и Пороховые, это, как ни странно, Шушары – огромные пространства, где ничего приспособленного для рекреации нет, это Приморский район и т.д. Предъявив эту картинку, мы можем добиваться разумных решений по нормативам, а не просто размазать среднюю обеспеченность по городу.

Четвертая история – еще одна красивая картинка, еще более драматическая [слайд 15]. Я не преувеличиваю драматизм ситуации?

Из зала: Все отлично.

Александр Карпов: Это число школ в 500 м от дома. 500-метровая пешеходная доступность считается нормативной. Для того чтобы построить эту картинку, я должен был взять и взял примерно 50 тыс жилых домов, вытащив их из баз региональной геоинформационной системы, я взял данные по школам. К сожалению, я очень долго возился с очисткой и не могу быть на 100% уверен, что я их очистил до конца – здесь возможны ошибки с распределением школ. Дальше я построил радиусы доступности и эту «температурную» поверхность. Для чего мне нужна была эта картинка? Она мне была нужна для спора о нормативах. Мы ведем постоянный спор с исполнительными органами власти, как регулировать градостроительную деятельность в Петербурге. Подход, с которым я не согласен, и который достался нам в наследство от советской градостроительно-планировочной школы заключается в том, что нормируется доступность одного объекта, который обслуживает население – один детский сад, одна школа. Каждый из нас должен идти не более 300 м до детского садика, либо 500 м до школы. Дальше трава не расти. Все остальное может быть как угодно.

Нам важны данные о реальном устройстве Петербурга. Так вот реальный Петербург устроен по-другому – так, что в некоторых местах для некоторых домов доступно семь и более школ. Это классное место с точки зрения семьи, потому что можно выбирать. А для некоторых домов в 500 м доступности нет вообще ничего – и детей в школу нужно возить. С моей точки зрения, нужно фокусироваться не только на том, чтобы обеспечить минимальную доступность, а на том, чтобы обеспечить минимальное разнообразие выбора. Для того чтобы обеспечить минимальное разнообразие выбора и вообще что-то нормировать, нужно знать, что есть сегодня. Чем мы и занимаемся.

Среди жилых зданий в зонах 3ЖД (жилой многоэтажной застройки) и Д (деловой застройки) 21-25% не имеют ни одной школы в 500-метровой доступности, 55-57% имеют одну школу и около 20% зданий имеют в пешеходной доступности до 4-7 школ [слайд 16]. А теперь обратите внимание на то, что здесь написано мелким шрифтом: это представлено на урбанистическом форуме «Города и территории завтра». Этот форум только что, в сентябре был в Петербурге. Это часть презентации, часть рутинного рабочего процесса – влияние на то, как исполнительная власть, чиновники воспринимают город. Таких картин они не видели к тому моменту. То же самое по детским садикам.

Есть еще более интересная картинка из той же серии – я сейчас быстро о ней расскажу [слайд 17]. Это число остановок общественного транспорта в 500 м от дома. Что важно? Насколько город дифференцирован и неоднороден по этому показателю. У нас есть такие места, где, не считая метро, больше 30 остановок общественного транспорта в пешеходной доступности от дома, а есть – где ничего нет и там личный автомобиль  неизбежен. С числом остановок в 300 м от дома ситуация, понятно, еще хуже [слайд 18]. Это доступность остановок общественного транспорта для зданий в разных функциональных зонах – это среднее [слайд 19]. А это межквартильный интервал – некая характеристика дифференциации [слайд 20]. Построение этих картинок заняло у меня уже несколько больше времени, потому что это нагружает компьютер. Одна картинка строится часов 14 – на моем стареньком компьютере. Все равно это оказалось гораздо быстрее, чем запрашивать данные у комитетов, потому что там полгода уходит на то, чтобы объяснить задачу – это я проиллюстрировал [слайд 21]. Что мы делаем дальше? Мы показываем более или менее очевидную вещь, что кадастровая стоимость территории, земли, недвижимости связаны с тем, как у нас организовано транспортное обслуживание территории [слайд 22].

Выводы [слайд 23]: по моим наблюдениям активисты используют открытые данные не так, как обычные горожане. Активист решает определенную задачу, причем не для организации своего повседневного быта (рутинно), а разово – возникла проблема, мы ее решили, пошли дальше. Таким образом, даже если это длительная кампания, использование данных, скорее всего, является разовым, поэтому приложения, о которых говорилось раньше, не очень вписываются в эту систему. 

Применение открытых данных активистами всегда основано на хорошем понимании системы принятия решений. Чем лучше вы понимаете, тем более вы эффективны в использовании данных. Если не понимаете, то вам все равно – открытые данные или закрытые. Но этому в школе не учат. 

Самое интересное, конечно, – это сопоставление, гибридизация, интеграция совершенно разных наборов данных. Если вам удалось открыть, как пересекаются до сих пор несвязанные наборы, может быть, вы наткнулись на золотую жилу (а может быть и нет). 

И есть ловушка доступности, в которой я все время и нахожусь. Когда кажется, что много данных, и я сейчас быстренько все посчитаю, и все будет хорошо, – то и другие тоже могут посчитать. Я считаю так, что у меня получается 25 кв. м жилья на человека, а у них – 40 кв. м на человека. Тогда начинается интересный этап – мы должны доказывать друг другу что-то. Важным становится вопрос о качестве, надежности, актуальности данных, методике, проверки и т.д. Это сжирает все время, высвобожденное в результате доступа к данным. Если у вас нет данных, у вас все время уходит на их добычу. Как только они появились, у вас огромное количество времени уходит на их верификацию.

Таким образом, базовая задача на сегодня – это инструменты проверки качества, очистки, конвертации, агрегирования, слияния данных [слайд 24]. Если мы хотим это сделать для активистов, такие инструменты должны быть доступны простому пользователю. Городские данные без географической привязки и отметки времени практически не имеют смысла. Географическая привязка может иметь разную степень точности, и с ней у нас очень плохо, потому что ее надо давать не только по координатам, к ним не все привяжешь, ее надо привязывать к каким-то объектам городской среды, а у нас онтология этих объектов пока очень плохо проработана.

Над онтологией пространственных данных мы работали на предыдущем хакатоне – я позволил себе вынести такую картинку связей [слайд 25]. Она мне помогает – держу её в качестве рабочего инструмента. По крайней мере, я для себя разграничил типы данных, которые я собираю и рекомендую собирать другим. На основании этой или другой похожей картинки можно организовать взаимодействие между разными приложениями, программами. 

И у меня есть оптимистичная новость в конце. Возможно, организовать взаимодействие и взаимопонимание между приложениями будет проще организовать, чем между людьми [слайд 26]. Спасибо.

[аплодисменты]

Оксана Жиронкина: Я правильно понимаю, что те три пункта, которые вы перечислили, – это фактически задача для тех, кто здесь находится?

Александр Карпов: Да, я постарался сформулировать задачу, чтобы был какой-то вывод из моей речи.

Михаил Мироненко (разработчик): Во-первых, огромное спасибо за очень интересную, живую и эмоциональную лекцию. Во-вторых, я хотел задать практический вопрос: какими программами вы пользуетесь для визуализации своих данных?

Александр Карпов: Map Info. Из Map Info выгружаю их на карты Google с наложенными слоями – это очень мощный и полезный инструмент. Кстати, я еще не говорил о тех данных, которые собирают сами активисты – это другой метод краудсорсиногового картирования. Мы его тоже очень активно используем, но карты Google полезны и для того, и для сего. То есть, Map Info, карты Google, Excel и статистические программы. Больше практически ничего.

Михаил Мироненко: А белая подоснова карты – это все Map Info, да?

Александр Карпов: Да. Надо пояснить. Я сказал, что в рамках информационного обмена ЗакСобрание получает довольно много слоев Региональной геоинформационной системе в городских координатах. То есть, мы довольно много чего можем посмотреть – земельные участки, здания, дороги, линии дорог, там есть Генплан, право землепользования и застройки и т.д. Но там возникает проблема перевода этого всего из местной системы координат в общемировую.

Дмитрий Воронин (разработчик): Спасибо за доклад. По третьему пункту ничего не понятно. Есть какие-то методологии валидации данных? Меня как человека технического больше интересует технический подход.

Александр Карпов: Я скажу два слова, и, может быть, кто-то из коллег меня дополнит по этому поводу. Что такое качество пространственных данных? Это в первую очередь качество привязки к существующим объектам для того, чтобы вы могли совместить разные слои, разные наборы данных. Если мы все привязываем по координатам, это очень не экономично, не эффективно и не всегда работает. Допустим, как мы кодируем отдельный дом? Точкой или контуром? Если мы кодируем контуром, то нужно сделать так, чтобы точка, которой потом мы что-то другое закодируем, попала в этот дом, чтобы мы могли выстроить отношения принадлежности. Если у нас дом сложной формы, – а они практически все сложной формы, – то центроид может попасть в совершенно произвольное место. Не говорю о том, какие бывают закрученные земельные участки – вы себе даже не представляете. Их приходится маникюрными ножницами вырезать. То есть, нам нужно, чтобы привязка данных шла к дому, адресу. Но единой системы адресов не существует до сих пор. Все пользуются разными описаниями адресов. Следующая единица после дома (а внутри дома есть жилые помещения, я даже сейчас не говорю о них) – земельный участок, дом расположен на земельном участке. Нам нужно сделать так, чтобы дома попадали на земельные участки. Тоже проблема. Следующая пространственная единица, вмещающая земельные участки – это квартал, территория между улицами. У нас нет единого реестра кварталов и единого реестра улично-дорожной сети, то есть слоя, где дороги были бы представлены не как линии, а как полигоны. Кто-то здесь говорил о проекте, чтобы заработали автоматические системы пилотирования на улицах города – для того чтобы они заработали, нужно, чтобы карта была электронная того пространства, по которому они будут двигаться. Нет ничего. Паспорта дорог обновляются, но очень медленно. Двумерной улично-дорожной сети у нас нет. А дальше, к чему мы можем привязаться, тьфу-тьфу-тьфу, – к муниципалитетам. Но агрегирование пространственных данных на уровне муниципалитета уже никакого смысла практически не имеют. И это только начало, потому что до сих пор то, о чем я говорил, мы оперируем двумерными координатами – только на плоскости. А у нас еще есть низ и верх – подземное пространство и пространство над земельными участками…

[аплодисменты]

Стив Каддинс: Всем привет. Мы из движения «Красивый Петербург» – это движение инициативных граждан за улучшение качества городской среды. Многие находящиеся здесь наверняка уже слышали об этом движении и его деятельности, поэтому я очень лаконично скажу, кто мы такие и чем занимаемся, а дальше перейду непосредственно к теме исследования, как активные и инициативные горожане могут использовать открытые данные. Конечно, во многом это пересекается с тем, что уже рассказывали предыдущие спикеры, потому что в целом городские исследования сосредоточены на проблемах, которые волнуют горожан.

Презентация

Несколько основных направлений деятельности нашего движения [см. презентацию, слайд 2]. Первое – это отправка сообщений граждан. Для этого участники нашего движения создали инструменты – это сайт «Красивый Петербург» и мобильное приложение «Красивый мир», при помощи которых любой горожанин может сфотографировать любое нарушение (будь то разбитый тротуар, неухоженный газон или проблемы с фасадами зданий и т.п.) и отправить в несколько кликов официальные обращения полномочным органам государственной власти, которые работают с этими обращениями. Этот инструменты мы изобрели еще в 2012 году. При помощи него жители отправили более 70 тыс обращений в Петербурге. За эти годы независимые филиалы открылись более чем в 40 городах.

Начиная с такой простой технологии отправки обращений, мы стали думать, что еще инициативные жители могут сделать для города. И сразу начали искать, что можно исследовать, чтобы предложить что-то новое. Когда кто-то опирается на свои житейские убеждения, пытаясь что-то предложить, порочна. Когда ты сам что-то предлагаешь, основываясь на своих житейских представлениях, тебе кажется, что ты прав, и ты активно продвигаешь свою позицию. А когда ты встречаешься с тем, что кто-то другой с таким же подходом что-то предлагает, но ты понимаешь, что это какая-то ересь, но у тебя нет аргументов, потому что у тебя такие же подходы. И ты понимаешь, что нужно переосмыслить исследования, сделать их объективными. Для этого очень хорошо подходят открытые данные, потому что есть данные, есть объективный анализ и есть очевидные из этого выводы. Сейчас мы и расскажем о таких исследованиях, которые мы проводили длительный период времени. Начнем с исследования качества работы городского общественного транспорта – об этом нам расскажет Валентина, потому что она была главным исследователем в этом проекте.

Валентина Соловьева: Это исследование основано на данных, о которых говорил предыдущий спикер, – о движении транспорта в реальном времени. Это данные, которые использует «Яндекс-транспорт» и аналогичные сервисы [слайд 3], когда мы видим в реальном времени местонахождение автобусов, троллейбусов, трамваев в нашем городе. Мы собрали такие данные за один полный день, по-моему, это был ноябрь прошлого года [слайд 4].

Что содержится в этих данных? Это id транспортного средства, что это за транспортное средство, время и местоположение (координаты). Для начала нужно сказать, что данные, которые мы собрали, оказались не очень хорошими в том плане, что их невозможно было использовать на 100%. Очень много данных пришлось отсечь, потому что какие-то из них пришли с задержками. После этого мы сравнили количество транспортных средств, которое есть в городе, с тем количеством, от которых мы получили данные. Вышло, что на таких сервисах как «Яндекс-транспорт» можно наблюдать почти 91% автобусов, 60% троллейбусов и 67% трамваев – они передают данные о своем местоположении.

Собранные данные мы нанесли на карту [слайд 5]. Получили площадь покрытия города транспортными сетями: синий – это автобусы, зеленый – троллейбусы, красный – трамваи. Дальше мы проанализировали скорость движения транспорта в нашем городе и получили карты скоростей. Это карта скоростей автобусов за сутки [слайд 6]. Видно, что за городом скорость гораздо больше, чем в центре города. Это то же самое для троллейбусов [слайд 7]. И карта скоростей трамваев, где, в том числе видны выделенные линии [слайд 8]. Заметно, что на выделенных линиях скорость трамваев, конечно же, больше, чем когда они движутся в общем потоке с автомобилями.

Средняя скорость получилась не очень утешительная: для автобуса – 13,6 км/ч, для троллейбусов еще меньше – 11,7 км/ч, для трамваев совсем печально – 11,3 км/ч [слайд 9]. Это в течение всех суток для всех маршрутов – средняя температура по больнице. Далее мы анализировали по отдельным маршрутам, отдельным улицам – получаются интересные результаты. Эту же методику применяли потом для Красноярска, а также для тех участков улиц, где предложено сделать выделенные линии для общественного транспорта. Когда мы берем участок улицы и смотрим данные только по этому участку, получаются очень интересные результаты. Если в шесть утра автобусы ходят со скоростью 35 км/ч, в течение дня – 12-13 км/ч, а в часы пик утром и вечером скорость движения – 6-7 км/ч, в таком случае мы предлагаем на этом участке улицы делать выделенное движение автобусов. Об этом, наверное, все.

Стив Каддинс: Это был пример о транспорте. Теперь немного в другую стихию [слайд 10]. Каждый год совершенно неожиданно, особенно для чиновников, наступает зима. Вдруг в декабре с неба падают непонятные объекты – они иногда летают, с ними приходится что-то делать, убирать и т.д. К такой непонятной стихии, непонятному природному явлению никто не готов, поэтому в панике на улицы постфактум выезжает огромное количество единиц уборочной техники. Она в хаосе ездит по непонятным маршрутам, сгребает туда-сюда снег, иногда вывозит, иногда активно засыпает солью, чтобы как-то с ним справиться. В момент, когда появились наши инструменты отправки обращений, горожане узнали, что за этим можно не просто пассивно наблюдать, но и выражать свое недовольство или просто сообщать о том, что надо бы и здесь убрать, а здесь никто ни разу за день не приходил убирать снег.

Когда случилась первая зима после появления нашего движения, снега было мало, но люди получили интересный инструмент для отправления сообщений о том, что где-то не убирается снег, где-то есть проблемы. И тогда же мы решили провести исследование, где есть эти проблемы. Понятно, что в целом они есть везде, но где-то они стоят так остро, что заставили жителей не просто пробежать по сугробам мимо, но и сфотографировать их и отправить через сайт. Ввиду того что две зимы были какие-то совсем осенне-весенние, снег был редким и эпизодическим, мы показали здесь исследование за зиму 2012 года, когда снега было достаточно много, были хорошо выраженные снегопады – можно было посмотреть данные. Я расскажу в деталях, что мы там увидели.

Так выглядит сайт [слайд 11]. Сейчас на нем отображаются все обращения по зимним проблемам за все время существования сайта – это больше 3 тыс обращений за три зимы. Понятно, что в первую зиму обращений было намного меньше, чем тысяча – было несколько сотен обращений. Тем не менее, это достаточные данные, чтобы сделать первый анализ и посмотреть, с одной стороны, где есть проблемы, с другой стороны, где эти проблемы волнуют людей, потому что очевидно, что не каждый горожанин готов трансформировать свое недовольство в продуктивные действия.

Мы взяли нашу прекрасную базу данных, выгрузили данные по самым актуальным зимним проблемам (сосульки, неубранный снег, гололедица) и представили их в виде тепловых карт, чтобы увидеть очаги стихийных зимних проблем [слайд 12]. Мы очень надеемся, что ближайшая зима все-таки будет настоящей зимой и можно будет взять существенный отрезок времени, когда снег будет падать регулярно, например, в течение месяца и не будет очень быстро таять, чтобы посмотреть динамику обращений горожан за месяц. Сейчас у нас десятки тысяч пользователей сайта. Если будет регулярно падать снег, его будут регулярно убирать, тогда мы получим действительно огромную статистику по городу. Мы очень ждем этого момента, мы его ждали два года, но погода не выдала нам таких открытых данных. Тем не менее, кое-какие данные были.

Самое интересное, что по этим картам нельзя сделать вывод, что плохо убирали только в определенных точках. Карты нам показали, что есть активисты, которым не все равно, которые ходили по территории около своего дома в и других районах и «автоматными очередями отстреливали» нарушения [слайд 13]. Здесь шесть самых активных человека, отправлявших обращения в ту зиму. Видно, как они локально, недалеко от своей работы или учебы – показана часть центра города – фиксировали нарушения. Конечно, в очередной раз это подтвердило цифру, которая всегда подтверждается в таких случаях: 80% всех проблем решаются силами 20% пользователей – такими «очередями» и бьют эти 20%. Остальные – разок отправят и потом ждут с вероятностью 10%, что им повезет и проблему устранят, а потом делают выводы – работает или нет. Здесь есть прекрасный видеоролик – это видео динамики отправки обращений по датам с декабря 2012 по январь 2013 года [слайд 14]. Видно, как горожане находили проблемы с уборкой снега и отправляли обращения. Если смотреть замедленно, то можно находить пики в определенные дни, когда случился снегопад, и все массово вышли на улицы фотографировать. Я верю, что после этой зимы будет еще интереснее, и на следующем хакатоне мы покажем результаты.

Это была только одна часть зимних исследований – мы увидели, что есть горожане, которых волнуют проблемы, которые сообщают об этих проблемах. Всем интересно узнать вторую сторону этой истории – как на это реагирует администрация города и исполнительные власти, которые должны решать эти проблемы. Валентина расскажет о том, как мы исследовали то, какая уборочная техника работала [слайд 15].

Валентина Соловьева: Кроме того что у нас автобусы оснащены навигаторами, которые показывают, где они находятся, точно так же вся снегоуборочная техника тоже оборудована так же. И даже есть сайт, на котором горожане могут посмотреть, где в данный момент находится снегоуборочная техника. Мы решили взять эти данные и проверить, сколько единиц уборочной техники в городе, сравнить с тем, что говорят городские власти, посмотреть, где убирают. Мы выбрали такой день, когда весь день по всем районам города валил снег. Ждали этот день – и он наступил.

Стив Каддинс: Да, такой день был только один той зимой, и мы сразу же срочно стали исследовать.

Валентина Соловьева: 25 января – можно сказать, что в этот день уборочная техника, действительно, работала хорошо, потому что если бы она не работала полдня, то тогда вообще был бы коллапс [слайд 16].

Стив Каддинс: Он был, но не фатальный.

Валентина Соловьева: Здесь показана площадь покрытия уборочной техникой: оранжевое – это уборочная техника, которая убирает проезжую часть, зеленое – уборка тротуаров. Можно заметить, что практически во всех районах города уборочная техника побывала, но были отдельные участки, куда она так и не доехала, в том числе туда, где я живу. Я очень ждала, но, к сожалению, ее так и не было. Это график распределения в течение суток [слайд 17] – можно увидеть падения активности в восемь утра и в восемь вечера. Я даже не знаю, что это такое.

Стив Каддинс: Следует задуматься, как работает уборочная техника. Может быть, там были пробки, поэтому было сложно проехать? На самом деле, нет. Мы видим, что пик утром, когда они не ездили, – это 7-8 утра, когда еще нет фатальных пробок, но когда нужно было убирать снег.

Валентина Соловьева: В это время как раз валил снег.

Стив Каддинс: Мы встречали красивые фотографии – можно было взять из Instagram, когда люди ехали на работу и 6-8-полосные улицы были покрыты сплошным утрамбованным снегом, по которому шли машины, автобусы, троллейбусы со скоростью 10 км/ч. Это хороший повод задуматься, почему техника работает так. Почему они хорошо работают в 4-6 утра, а потом у них какая-то пересменка или, не знаю, завтрак?

Валентина Соловьева: Они работают по сменам, независимо от того, когда идет снег и нужно убирать.

Стив Каддинс: Помимо графиков с объективной информацией, была куча субъективных сообщений, в том числе от автомобилистов на «Яндекс-пробках», где отмечают всякие события на дорогах. Они говорили, что едут на работу в восемь утра и по дороге не встретили ни одной машины техники. Эти данные подтвердили наши исследования, хотя в тот момент нужно было чистить дороги перед огромным потоком транспорта.

Валентина Соловьева: Здесь видно, что в пиковые часы работало около 450 единиц техники. Мы сравнили эти данные с тем, что говорили городские власти – по-моему, мы недосчитались 100 машин – то ли кто-то преувеличил, то ли мы просто не получили данные. Возможно, не на всей технике установлено оборудование, хотя должно быть на всей, возможно, где-то не работает. От общественного транспорта, к сожалению, тоже доходят не все данные.

Стив Каддинс: Стоит отметить такой момент. Мы специально до публикации этого исследования помониторили СМИ на предмет выступления чиновников насчет того, сколько у нас уборочной техники, как она хорошо работает. Они называли конкретные цифры. Более того, мы нашли специальное заявление Комитета по благоустройству о том, какой процент всей техники оснащен датчиками. Объективные данные, которые мы получили о том, сколько техники отправило данные о своем местоположении, и та цифра, которую назвали за вычетом машин, которые не оснащены, и дали разницу порядка 100 единиц уборочной техники, которая либо не вышла на улицы, либо вообще не существует. Чиновники рассказывают о том, что у нас тысячи тракторов и снегоуборочных комбайнов.

Валентина Соловьева: Заявлялось, что практически 100% оборудованы.

Стив Каддинс: Нет, там была цифра порядка 80%, если я не ошибаюсь, – мы об этом даже писали. Тем не менее, даже с этой поправкой мы недосчитались техники.

Валентина Соловьева: Что такое «другая уборочная техника»? Честно говоря, я до сих пор так и не разобралась. Есть техника для уборки проезжей части и для уборки тротуаров.

Стив Каддинс: Есть еще мистическая техника, не известно для чего. Нам не сообщили, что это за техника, возможно, это какие-то особые машины. Это информация о том, как в течение времени машины уборочной техника катались по нашему городу [слайд 18]. Видно, что самое время, когда надо было убирать, наверное, все ушли завтракать. Потом в обед катались и вывозили. Вечером, когда опять всем надо убирать, – нет техники. Все постояли в пробках и на ночь еще поубирали.

Мы рассказали об исследованиях, которые делали непосредственно мы. Участники нашего движения и неравнодушные горожане, а также сочувствующие тоже проводят исследования. В зале находится участник нашего движения, который сделал огромное исследование по сети городского wi-fi. Мы знаем, что официально сейчас есть четыре точки wi-fi. Но многие из нас сталкивались тем, что по сути wi-fi есть, а интернета нет. Вам обещали wi-fi – получите. Никто не гарантировал, что через wi-fi можно будет получать доступ в интернет. В частности ни на одной из станций метрополитена, где установлены роутеры wi-fi, доступа в интернет вы не получите, потому что проект запустили, но никто не договорился и не платит. Фактически бесплатный городской wi-fi работает только на Невском проспекте, в некоторых парках в центре города. Эпизодически то отваливается, то работает – несколько провайдеров его поддерживают. Участник нашего движения – Павел, прошу любить и жаловать – провел крутое исследование, как люди пользуются мобильной связью, то есть где концентрируется отправка данных в соцсети, где люди пользуются интернетом в городе, где есть востребованность в общественной сети wi-fi. В современном мире многим горожанам wi-fi не нужен, потому что есть мобильный интернет. В России он один из самых доступных в мире по стоимости. Тем не менее, город у нас туристический, и те миллионы туристов, которые нас посещают, особенно из-за границы, не имеют возможности использовать мобильные интернет в роуминге, чтобы рекламировать наш прекрасный город на весь мир. Как раз для таких туристов и нужны сети общественного wi-fi. Павел анализировал точки привлекательности в центре города, общественные пространства, памятники и сформировал комплексное предложение более чем по 100 адресам. Мы все это отправили в городскую администрацию. Павел сказал, что уже есть инвестор, который заинтересовался реализацией такого проекта. Надеюсь, это будет отличный пример, как общественные исследования, основанные на объективных, открытых данных, привели к практическому результату для города. Думаю, на этой позитивной ноте можно завершить выступление. И мы с удовольствием ответим на ваши вопросы. Спасибо [слайд 19].

[аплодисменты]

Оксана Жиронкина: Стив, а когда вы все это делали, вы чувствовали, что вам чего-то не хватает? Тем, кто сейчас будет участвовать в хакатоне, можете поставить какую-то задачу?

Стив Каддинс: Скорее, не задачу поставить, а рассказать пример. На одном из хакатонов, где мы участвовали, и я тоже о чем-то рассказывал, были ребята, победители хакатона с проектом Smooth. Многие наверняка слышали об этом проекте. Суть его в том, чтобы строить маршруты движения по безбарьерной среде. Сейчас многие наши города, в частности Санкт-Петербург, плохо приспособлены для передвижения маломобильных людей. Ребята сделали приложение, которое анализирует различные открытые данные, в том числе из наших баз обращений, где люди жалуются на плохой асфальт, завышенный поребрик и т.п. Такие обращения ребята накладывали на карту. Исходя из того, где люди сообщают, что есть проблема, они маршрутом обходили эти участки. Это было, действительно, очень круто. Это неожиданное использование данных – данные о том, что что-то нужно починить, ребята использовали, чтобы предотвратить неудобство для маломобильных людей, чтобы они в этих точках не застряли. У нас порядка 150 категорий нарушений на сайте. Я могу посоветовать, использовать данные сообщений о нарушениях для того, чтобы что-то придумать и решить проблемы горожан, о которых они сообщают.

Вячеслав Романов: У меня вопрос немного технического характера. Вы упоминали в выступлении приложение «Красивый мир», насколько я понял. Хотелось бы уточнить, оперирует ли оно существующими дата-сетами, для того чтобы накладывать уже собранную от граждан информацию? Или оно полностью построено не на основе открытых данных?

Стив Каддинс: Приложение «Красивый мир» через ip взаимодействует с движком нашего сайта, то есть на сайте есть база, в которой хранится информация обо всех обращениях. Когда горожанин через приложение отправляет информацию об очередной проблеме, база просто пополняется записью. Ребята из Smooth сами вытягивали данные – это не проблема. Все, что не касается персональной информации о заявителе, – это данные, которые можно свободно вытащить. Кроме того, у нас есть ip, при помощи которого можно делать запросы и получать нужные данные.

Вячеслав Романов: Вы пользовались на регулярной основе существующими региональными данными или оперировали именно вашими данными?

Стив Каддинс: Например, какими данными?

Вячеслав Романов: Например, размещение каких-то остановок – транспортными данными, какими-то инфраструктурными данными, которые размещаются органами власти?

Стив Каддинс: Нет, здесь мы не используем данные органов власти, мы используем просто подводку карты, в частности в приложении на Android – «Яндекс-карты», на iOS – подложка Google. Сейчас мы разрабатываем новую версию сайта, где будет выбор – «Яндекс», Google, кому что больше нравится. Собственно, в подложках достаточно информации, для того чтобы отправить обращение по какой-то конкретной точке. В целом в OSM очень многие локальные места, наподобие дворов, довольно подробно размечены, и там удобно ставить метку, в OSM есть отметки, например, детской площадки. Кроме того, у нас в городе есть такая карта, которая размещается на портале «Наш Санкт-Петербург». У города есть своя карта. Она довольно тяжеловесная, там много слоев, но там очень подробные данные по зеленым насаждениям – каждый зеленый клочок есть на этой карте. Можно ее использовать, но, во-первых, она совершенно закрыта, и не понятно, как с ней работать, а во-вторых, она очень медленно работает, примерно как РГИС. Какие-то специальные данные мы не подгружаем, а карту используем просто как подложку, чтобы человек сориентировался на местности и отправил обращение о той точке, где он увидел проблему.

Оксана Жиронкина: Какое-то заключительное слово хотите сказать?

Стив Каддинс: Пожелаю всем, кто будет участвовать в хакатоне, придумать полезные и крутые новые приложение, в том числе изучить опыт других городов и стран, которые иногда опережают нас, которые иногда мы опережаем. Желаю придумать что-то новое, чтобы опередить другие страны, чтобы с нас брали пример. И действовать: главное – неравнодушие. Главная проблема сейчас – это пассивность людей. Очень многих хватает на комментарий, но встать и начать что-то делать под силу единицам. Это надо менять. То, что активные люди, которые сюда пришли, будут что-то разрабатывать и что-то делать, – это круто. Эту идею надо распространять среди своих знакомых и понять, что если не мы, то больше никто. Это наш город, наша страна – надо действовать. Спасибо.

[аплодисменты]

видеозапись выступлений

тексты выступлений

Аксель Менье: Извините, что не могу выступать по-русски. У меня замысловатое роскошное название – я буду говорить о сайте с онлайн-атласами. Адрес этого сайта: climaps.eu, так что если у вас под рукой компьютер, вы можете зайти, а я буду следить на своем компьютере за страничками, которые будут открывать.

Я – независимый исследователь, когда-то я изучал социологию, в частности социологию науки. Меня интересует, как производятся знания, каковы практики производства знания, меня интересует предвзятость знаний и отношение между знаниями и политикой. Я считаю, что творческие практики – я имею в виду дизайн, искусство и т.п. – могут сыграть свою роль в новых отношениях между знаниями и политикой.

Это план моего доклада – я буду говорить о платформе, которую делал во время проекта «Электронные карты» для общественных исследований. Я буду говорить об этом атласе, отдельных картах и об использовании данных – как это делается. Также я расскажу о визуализации как о процессе, который начинается, собственно, с данных. Это процесс, который основан на сотрудничестве программистов, ученых-социологов, дизайнеров. Надеюсь, вам это будет интересно. Мы делали свой хакатон, не как у вас, но может быть, вас это заинтересует.

Для начала – три пункта, к которым я буду возвращаться, и которые не стоит упускать из вида во время моего доклада. Обычно мы воспринимаем процессы создания данных, их визуализации, анализа и принятие решений как разъединенные. Я бы хотел представить себе это как более последовательный процесс, где принятие решений происходит не на последнем этапе, а на всех этапах, и вес принятия решений распределяется по всему процессу. Мы используем визуализацию как инструмент исследования и вместо слова «визуализация» мы используем слово «карта». Поскольку мы визуализируем какую-то неизвестную, новую для нас территорию, мы не всегда понимаем, что там происходит, и нам важно это понять. Таким образом, мне интересно, как креативные практики могут менять данные, как данные могут выступать акторами в общественных дискуссиях.

Это тот самый сайт – мы работали над ним три года [см. сайт]. Тема: адаптация к изменениям климата. Если мы не оспариваем то, что действительно происходит изменение климата, то надо посмотреть, как оно влияет на все остальное, на другие практики. В проекте принимали участие, как я уже говорил, разные люди – специалисты, работающие с цифровыми данными, социологи, программисты, дизайнеры, а также те, кто занимался адаптацией этих данных: представители НКО, адвокаты, общественные деятели.

На сайте есть серия разных визуализаций – всего их на этой платформе 33. Вместо того чтобы рассказывать, как происходит визуализация, я представлю вам три примера: простой, сложнее и еще более сложный. Начнем с того, что есть карты, а есть объяснения, как с ними работать, как их читать, кто их сделал. Данные и инструменты обычно доступны всем, кто хотел бы ими воспользоваться. Первый пример – из запроса Google об изменении климата и глобальном потеплении – слева первые 16 результатов, которые выдает Google. Мы посмотрели, куда приводят эти запросы и распределили их по типам. Куда приводят эти запросы? О чем идет речь в них? О том, чтобы адаптироваться к глобальному потеплению, о том, чтобы спорить с ним, чтобы вступать в противодействие с ним или как-то избегать его, конфликтовать или выражать скептическое отношение. Я не буду касаться деталей, но если интересно, вы можете задать мне вопрос. Под каждой картой есть объяснение.

Другая пример – это график. По оси Х отложено время. События – это конференции, которые проводит ООН (следующая будет в ноябре в Париже). Мы видим, какие страны принимают более активное и менее активное участие в этих конференциях. Например, США очень активно принимали участие в самом начале этого процесса в 1995 году. Хочу показать вам Боливию – в Боливии все завертелось после 2007 года. Интересно, как мы сделали этот график, на каких данных основывались, что символизирует активность некой страны на конференции. Во время конференции НКО печатают информационные листки. Каждый день в течение этих конференций выходили такие листки. Там написано очень просто: такая-то страна заявила то-то и то-то. Мы рассматривали количество упоминаний и абзацев с упоминанием страны – чем больше в документе присутствует некая страна, тем активнее, с нашей точки зрения, она принимает участие в процессе. Так мы работали с текстами (мы любим работать с текстами) и таким образом мы извлекали информацию из этих текстов.

Последняя карта – тут уже не буквы, а цифры. Это точечная диаграмма, где каждая из точек представляет некую страну, которая получает деньги на адаптацию к изменениям климата. Серьезный вопрос – как эти деньги передаются от развитых стран развивающим на нужды адаптации – на международном уровне это самый важный вопрос, который обсуждается сейчас. Деньги, которые этим странам давали на развитие, теперь могут перенаправить на адаптацию. Вопрос в том, какие страны должны получать на адаптацию больше, а какие меньше? Как распределять эти деньги, принимая во внимание уязвимость стран с точки зрения изменения климата? Это очень болезненный политический процесс с большим количеством переговоров.

Существуют индексы уязвимости – некоторые организации занимаются тем, что ранжируют страны как более или менее подверженные влиянию изменения климата. Мы видим точки, даже не точки, а кляксы – это страны, которые получали деньги от разных фондов. Другая ось – сколько денег они получали. Можно смотреть по всем фондам или по каждому отдельно. По оси Х показана степень уязвимости: зеленый – не очень уязвимые, а красный, оранжевый – очень уязвимые страны. Существуют разные индексы, и можно посмотреть, совпадают ли приоритеты фондов со степенью уязвимости стран. Понятно по карте? Я вижу – кивают. Это не так просто объяснить, потому что такие карты делаются для людей, которые занимаются проблемой адаптации, а не для нас. Фокус этой карты заключается в том, что индексы уязвимости сами по себе не используются для распределения денег – вопреки желанию некоторых организаций пока что это еще не так. Это гипотетический сценарий, спекулятивная практика – а что если бы мы использовали индексы. Такая карта описывает некую реальность и показывает, какой она могла бы быть.

Хочу сказать о процессе создания этих карт – о «простынях» данных. У нас проходят недельные семинары – каждый семинар строится вокруг какой-то темы, но всегда присутствует тема адаптации. Была тема международных отношений, то есть речь шла об адаптации к изменениям климата в контексте международных отношений. Мы связались со специалистами в этой области. Одна дама – адвокат – работает на маленькие островные государства, которые просто затопит, если сильно поднимется уровень воды. Мы приглашали других специалистов, например, этнографов, которые проводили полевые исследования и выявляли влияние изменений климата на людей и практики. Мы приглашали представителей НКО, которые выступают за противодействие изменениям климата, представителей финансовых структур. Мы модерировали общественную дискуссию, поскольку представители разных сфер спорят друг с другом о том, какой должна быть адаптация. Мы подготовили данные, которые называем пунктирными, поскольку они еще не полностью готовы.

Когда с докладами выступали специалисты, был открыт доступ к документу Google, и все участники могли его редактировать, формулируя вопросы, которые они хотели задать, в зависимости от того, что говорили специалисты. Потом мы отобрали вопросы, потому что нужно было сопоставить их с данными и понять, каким образом их сгруппировать. Затем мы создали междисциплинарные группы – один программист, один дизайнер, один социолог. В Google была создана соответствующая папка, чтобы все могли пользоваться документами. Так это и выглядит – ребята сидят за компьютерами целую неделю. В середине и в конце недели были доклады для специалистов, которые принимали в этом участие. Мы не просили специалистов сидеть с нами всю неделю, но приглашали в определенные моменты, чтобы у нас с ними была обратная связь.

Что касается карты уязвимости, никто не хотел, чтобы такая карта была – ни один специалист не сказал, нужна ли такая карта. Для создания карты мы используем, по крайней мере, три ряда вопросов. Организации, которая собирала финансовые данные, было интересно, есть ли связь между финансированием и уязвимостью. Нам было интересно, как индекс уязвимости коррелирует с другими индексами – мы пригласили одного товарища из организации, которая как раз занимается такими индексами уязвимости. Мы хотели узнать, связана ли как-то адаптация к изменениям климата с развитием.

Мы произвели довольно много таких карт по уязвимости. Это лишь одна из них, но она каким-то образом визуализирует те вещи, которые плохо видны и плохо проговариваются. Каждый специалист занимается своим вопросом и так структурирует свою работу, что эту картинку не видит. Приглашенному товарищу очень не понравилось, что его индекс уязвимости плохо коррелирует с другими – они очень много денег дают уязвимым странам. Что мы делали? Мы старались посмотреть на вопросы под другим углом зрения – старались перестроить оптику, использовать уже существующие данные по другому назначению.

Перехожу к заключению. В своем докладе я вообще не использовал термин «открытые данные», хотя я знаю, что это сегодняшняя тема – надо будет об этом подумать. Мы не пользуемся этим термином, потому что нам не так уж нужна сама по себе правительственная информация. Некоторые данные по изменению климата в течение года мы собираем сами. Также мы собираем информационные листки Ассамблеи ООН. Они не находятся в открытом доступе, но данные, которые мы извлекли из этих листков, которые мы произвели, мы сделали доступными. Интересно, что вы думаете об открытых данных в связи с этой историей.

[аплодисменты]

Дмитрий Воронин: Спасибо за доклад. Интереснейшая карта и наблюдения. Как и в чем измерять уязвимость? Понятно, что приглашенный товарищ предоставил какие-то данные, но он же на чем-то основывался…

Аксель Менье: Уязвимость определяется как подверженность воздействию изменениям климата на общественно-экономическую сферу, на регионы страны. Мы использовали три индекса уязвимости, но вообще их больше. Мы также задокументировали их различия – что принимают во внимание одни, а что – другие. Например, принимают ли во внимание индексы политические данные – стабильность политической системы. Некоторые индексы больше ориентируются на физические воздействия, для некоторых важнее общественно-экономические влияния. У нас нет задачи, назвать главным какой-то один индекс и узаконить его. Вы правильно задали вопрос – как формировать индекс? Все не абсолютно, но они определенным образом ранжируют страны.

Александр Кирсанов: Какова достоверность выводов на основании таких карт? Предположим, в следующем году острова утонут, а адвокат не приедет. Соответственно, страна или точка уже не будет представлена – проблема решена. Второе – сколько Google даст аналитики, столько вы и нарисуете данных, то есть это тенденциозные данные. Третье – обратная зависимость – больше всего будут кричать те, кому больше дают денег, у кого есть деньги на конференцию.

Аксель Менье: Третий пункт не очень понял.

Александр Кирсанов: Ладно, русские поняли [смех в зале].

Аксель Менье: Вы хотите, чтобы я вам ответил на него? Могу я как-то прореагировать? Существует предвзятость – конечно. Мы знаем, что Google предвзят, но невозможно получить непредвзятые данные. Эту предвзятость нужно принимать во внимание. У всякого материального воплощения данных всегда есть некие показатели, как эти данные появились. Это экспериментальный проект. На сайте везде стоит предупредительный знак, что это не объективная информация – везде указано, как были получены данные, как были сделаны выводы. Это эксперимент, который мы делаем, чтобы раздвинуть границы.

Из зала: Какие данные отражает ваш свитер? [смех в зале]

Аксель Менье: Надеюсь, вам нравится дизайн. Кстати, дизайнеры в этом проекте были очень приятные ребята из Италии.

[аплодисменты]

Джоэл Гурин: Расскажу немного о себе. Я работаю над этой темой уже какое-то количество лет и два года назад написал книгу Open Data Now [см. презентацию, слайд 2]. К сожалению, русского перевода еще нет. Книга посвящена применению открытых данных, в основном в бизнесе. В последнее время я как раз занимался применением открытых данных в бизнесе во всем мире.

Презентация

Как видно на слайде, это соотношение открытых данных с другими видами данных [слайд 3]. Большие данные и открытые данные связаны между собой, но это не одно и то же. Их отношения описывает схема, которая здесь представлена. Как вы видите, для использования некоторых государственных данных не обязательно, чтобы они были большими данными. Посмотрите в центр этой схемы: это и большие данные, и открытые данные (данные о погоде, GPS и др.). Во многих бизнесах, где используются открытые данные, это, по сути, большие данные.

Здесь представлено то, чем мы занимаемся в нашем Центре открытых данных [слайд 4]. Сначала мы собираем информацию по всему миру, затем связываем агентства, которые собирают данные, с теми, кто использует эти данные, для того чтобы люди, которые собирают данные, могли помочь государственным органам делать это эффективнее. Затем мы ищем решение, чтобы более эффективно использовать открытые данные на благо общества. У нас есть такой проект [слайд 5], где мы собираемся картографировать то, как разные данные используются по всему миру. Посмотрите, пожалуйста, и сообщите нам, о каких еще примерах использования данных вы знаете, чтобы мы могли обновить эту карту.

Здесь представлен круглый стол, который проходил в одном из американских министерств – здесь американские чиновники могут встречаться с людьми, которые используют открытые данные, и обсуждать, как это делать эффективнее [слайд 6].

Теперь я покажу примеры того, как мы используем правительственные данные. Это американская компания Aidin, которая работает в области здравоохранением [слайд 7]. Раньше существовала проблема, которая заключалась в том, что когда люди выписываются из больницы и им требуется дальнейшее лечение, то не понятно, где его лучше продолжить. Раньше было то, что вы видите слева, – это список каких-то адресов и телефонов. Aidin сделали то, что вы видите справа, – некий инструмент поиска лучших организаций, занимающихся здравоохранением, которые подходят конкретным людям.

Эта компания работает в энергетическом секторе и называется First Fuel [слайд 8]. Они используют как правительственные данные, так и данные бизнес-центров. Они консультируют бизнесменов по поводу того, как можно сократить расходы на электроэнергию. Для того чтобы помочь окружающей среде и сократить расходы на энергию, они работают уже в 17 млн зданий.

Очень много данных используется в недвижимости [слайд 9]. Zoopla и многие другие компании собирают разные данные, поэтому сайты по недвижимости в Америке сообщают людям больше, чем просто то, где они могут найти хороший дом. Они сообщают уровень преступности в этом районе, где расположены медицинские учреждения, а также, как прогуляться по кварталу. Эти сайты используют очень много открытых данных, чтобы людям было легче принять решение о том месте, где они хотят или не хотят жить.

Очень большой интерес вызвало применение открытых данных в создании новых рабочих мест [слайд 10]. Я работал над этим со Всемирным банком, и мы нашли новые способы применения открытых данных для создания новых рабочих мест. Я уже привел пример компаний, которые возникают и тем самым создают новые рабочие места. Но и многие уже существующие компании добиваются большей эффективности и прибыли, поскольку они используют открытые данные и могут лучшим образом организовать систему поставок. Также мы заметили, что открытые данные служат росту технического образования, благодаря чему молодые люди могут легче найти работу за счет полученной квалификации. Одна из компаний проводит сейчас образовательную работу по всему миру и использует навыки анализа информации и данных. А здесь приведены примеры крупных компаний, работа которых построена на открытых данных [слайд 11]. Все эти компании имеют капитализацию не меньше $1 млрд. Climate Corporation работает в сельском хозяйстве; в ведении Garmin находятся геокосмические данные; Weather Channel, Zillow и Zoopla используют метеоданные и данные по недвижимости.

Это пример преподавания с использованием открытых данных [слайд 12]. Мы должны обращать внимание не только на крупные компании. Открытые данные могут использоваться в повседневной работе и в маленьких компаниях, а также в другой работе, которую вы выполняете. Важный аспект – обучение молодых людей работе с открытыми данными, чтобы они знали, как их добывать и применять. Я уже говорил об этой компании – это предмет той работы, которую они проводят. Это все для того, чтобы открытые данные стали доступнее и могли использоваться всеми.

Еще одна очень важная тема в дискуссиях об открытых данных – это тема поиска работы [слайд 13]. Не знаю, как в России, но в Америке очень много сайтов, которые занимаются тем, что связывают людей – работников и работодателей. Здесь люди не только выкладывают свои резюме, пишут о том, что они могут делать и какая работа им подходит. Здесь используются государственные данные, чтобы показать, какая область нуждается в специалистах. Недавно d McKinsey проанализировали влияние и эффективность таких платформ для поиска работы. Их анализ показал, что через несколько лет, возможно, полмиллиарда людей получат работу благодаря таким платформам. Так что открытые данные самыми разными способами могут помогать и бизнесу, и созданию рабочих мест.

Я думаю, то, что мы видим в сфере бизнеса, очень похоже на то, что мы видим в сфере гражданского общества. Здравоохранение, энергетика, образование, финансы, транспорт – вот те области, в которых открытые данные очень важны. Это те области, где компании работают с открытыми данными. И это те области, где некоммерческие организации помогают гражданам. Мы видим, что открытые данные совершенно по-разному работают в разных областях и способствуют тому, чтобы улучшить жизнь людей во всем мире.

Еще одна очень важная область – «устойчивое развитие» [слайд 14]. Цель устойчивого развития будет достигаться на всех уровнях экономики, включая какие ключевые сферы как образование, здравоохранение и все, о чем я говорил. Мне была оказана честь – Всемирный банк пригласи меня ведущим экспертом в рабочую группу по отчету «Открытые данные для устойчивого развития». В нем показано, как открытые данные могут помогать людям в различных областях. Этим я завершаю доклад – спасибо большое [слайд 15]. И я с удовольствием отвечу на все вопросы.

Виталий Власов: Спасибо, Джоэл, за интересный доклад. Мы сможем найти больше применения этим данным в бизнес-моделях. И какие-то приложения смогут работать у нас в Smart Hub. Надеюсь, вы будете нашим ментором в следующих проектах. Потом, кто захочет, могу дать полистать книжку Джоэла.

Джоэл Гурин: Я с удовольствием буду ментором и помогу, как смогу.

Виталий Власов: Спасибо. Есть ли вопросы? Нет вопросов. Спасибо за доклад, до скорого.

[аплодисменты]

Евгений Черный: В отличие от всех вас, я не делаю с данными ничего полезного. И меня здесь, наверное, не было бы, если бы я случайно не встретил в лаборатории Университета ИТМО Виталия, который предложил выступить на конференции по открытым данным с докладом о моем опыте работы с искусством, что было релевантно теме конференции.

Так случилось, что этим летом мы вместе с другом подавали заявку на участие в фестивале Ars Electronica, который ежегодно проводится в Австрии. Это один из известных медиафестивалей в мире. Его темой была урбанистика. Нужно было придумать какую-то тему и сделать, к примеру, какую-то инсталяцию по урбанистике. Мы посмотрели, что происходит в урбанистике, какие есть проблемы, и нашли такой интересный момент, что города так быстро развиваются, что очень трудно понять состояние города, потому что завтра оно уже будет, по сути, другим. Поэтому мы решили сделать инсталяцию, которая представляет собой сони-файл города. Была инсталяция, которая работала на 8-канальном звуке в заглушенном помещении, и мы делали сони-файлы трех городов. Там были Москва, Лондон и Нью-Йорк. Мы вычисляли данные и озвучивали.

На этой конференции мы с Виталием решили провести такой эксперимент – Виталий и Ольга Трофимович подготовили данные по российским городам, и мы засунули их в ту программу, которую написали для фестиваля Ars Electronica. Здесь я расскажу вам, как мы это сделали.

Для начала я расскажу о себе [см. презентацию, слайд 2]. Я – аспирант Университета ИТМО и Abo Akademi University (Турку, Финляндия), работаю в Лаборатории ИМИСТ Университета ИТМО – «Интеллектуальные методы обработки информации и семантические технологии». Мой опыт работы с технологическим искусством начался примерно с 2012 года В основном я делал интерактивные танцевальные перформансы и интерактивные инсталяции. В основном я делал для них звук, который реагировал на движение, еще на что-то. Так или иначе звук был живой, менялся в реальном времени, реагировал на импульсы извне. Также я вел блог о программировании звука, но сейчас я его уже забросил.

Презентация

Так выглядели перформансы [слайды 3-5]. Здесь представлен контактный перформанс, где мы анализировали звук и использовали для управления [слайд 3]. Здесь мы делали перформанс без людей, только с компьютерами, которые обменивались сообщениями между собой и генерировали музыку [слайд 4]. Это было в театре – мы надели на человека нейроинтерфес, анализировали данные из него и использовали для управления звуком и картинкой [слайд 5].

Я должен сказать о сонификации [слайд 6]. По сути, это способ представления данных посредством звука, то есть, грубо говоря, это еще один способ для понимания данных. Если мы рассматриваем графики, то сравниваем цвета, формы, пропорции, а звук предоставляет нам дополнительное измерение – темпоральное. Мы можем располагать звук в пространстве, воспринимать и анализировать звук его, у нас есть восприятие громкости и спектра. Это все можно использовать.

Три самый популярных метода сонификации [слайд 6]. Аудификация – это когда мы берем ряды данных и превращаем их в аудиофайл, нормализуя их до определенного диапазона, чтобы он был от минус единицы до единицы, и передаем на выход звуковой карты. В этом методе интересно то, что если в данных есть периодичные колебания, то так или иначе они приведут к тому, что в получившемся нойзе будет тон. Таким образом, можно заметить, что в данных есть повторение. Parameter mapping – это когда у нас есть звукогенерирующие модули, и мы с разными целями используем разные измерения данных (это прямой mapping). Model-based sonification – это когда мы создаем какую то модель, может быть, физическую модель какой-то системы, которая как-то работает и что-то делает сама по себе, но при изменении определенных параметров она меняет свое поведение, в результате чего меняется озвучивание. Еще есть один метод, но я в нем не разбирлася, поэтому ничего о нем не скажу.

Что сделали для конкретной конференциеи? Виталий с Ольгой взяли данных из картотеки по 20 городам. Это была табличка с 20 колонками и 20 строками соответственно [слайд 7]. Какие данные? Количество школ, продуктовая корзина, стоимость жилой площади и т.д. У нас был синтезатор – мы сделали его на языке программирования Csound. Управление синтезатором было сделано в среде программирования Max.

Сейчас мы все это послушаем – можно кликнуть на файл, и он откроется [звучат файлы; см. видеозапись]. Вы не очень понимаете, почему они разные. Мне просто важно было сделать то, чтобы была возможность сравнивать по звуку – отличаются или нет. Хотя получились маленькие различия по данным получились, но даже малейшие изменения ты воспринимаешь на подсознательном уровне, когда слушаешь саундтрек.

Вернемся [слайд 8]. Csound – язык программирования для языковых алгоритмов, то есть на нем можно делать обработку и т.д. Он был создан в конце 1980-х Барри Веркоу, который работал в MIT. Он уходит корнями к семейству языков Music-N, первая версия которого была создана Максом Мэтьюсом в конце 1950-х. Мэтьюс – это человек, с которого начинается история электронной музыки как исследовательской области. Csound позволяет реализовать любой алгоритм синтеза и обработки. У него простой синтаксис, который можно потом встроить куда угодно – от ARM до iOS.

Управление звуком было сделано в программе Max [слайд 9]. Это визуальный язык программирования для создания интерактивных аудиовизуальных приложений, то есть там можно кодить инсталяции, которые работают в реальном времени. Кстати, этот язык тоже назван в честь Макса Мэтьюса. Сам язык создан в центре IRCAM тоже в конце 1980-х. До сих пор еще есть и развивается первая версия.

В Max было реализовано стохастическое управление звуком – я использовал функции генерации на основе диаграммы Вороного, то есть если давать один те же данные, то же самое не будет сгенерировано, что очень важно для сравнения. Для того чтобы управлять этим алгоритмом, я сделал все очень просто – уменьшил объем данных с помощью метода  главных компонент до двух. Так это выглядит [слайд 10]. И, наверное, вы хотели посмотреть «исходник» [см. видео].

Виталий Власов: Какие города мы слушали? Архангельск, Новосибирск?

Евгений Черный: И Петербург.

Виталий Власов: Можно посмотреть: один из параметров – продуктовая корзина, дальше – стоимость квадратного метра, потом – численность населения, площадь города. В том числе использованы данные по транспорту. Можно рядом поставить Новосибирск и Петербург и увидеть отличающиеся параметры. Из этих данных Женя и сделал такие непонятные, странные звуки. Мы сами не понимаем, что это означает. Возможно, в этом тоже есть какой-то смысл. Как минимум, это интересно. Сейчас можно поставить еще какой-нибудь город и пойти на кофе-брейк.

видеозапись презентаций

тексты выступлений

Виталий Власов: Формат выступлений сегодня будет следующим. Каждому проекту дается пять минут и одна-две минуты на один-два вопроса от членов жюри. У нас три основных номинации: лучший бизнес-проект, лучший социально ориентированный проект и лучшее техническое решение. Среди призов, которые мы планируем дать победителям, наиболее важный заключается в том, что наш хакатон является отборочным этапом Всероссийского конкурса открытых данных, и наши финалиста автоматически проходят в полуфинал, для того чтобы потом принять участие в финале и получить финансирование от Фонда Бортника и Фонда Сколково по упрощенной процедуре. Кроме этого, мы отбираем до трех проектов, которые попадут в наш акселератор, то есть в этом пространстве они смогут в течение трех месяцев работать над своими проектами и затем презентовать их общественности, инвесторам и заинтересованным людям. Три лучшие команды поедут на хакатон в Хельсинки. Также есть специальный приз от компании «Тобу»: два лучших бизнес-проекта получат комплект услуг. Мы готовы начать – первый проект Clean Bin.

проект: clean bin

Анастасия Головнева: Добрый день, уважаемые коллеги. Пока открывают нашу презентацию, представимся. Мы – проект Clean Bin, который посвящен картированию степени заполненности мусорных контейнеров в Санкт-Петербурге. Представьте себя жителем Санкт-Петербурга, который живет в многоквартирном доме и очень недоволен работой своей управляющей компании, в частности тем, как часто и качественно вывозят мусор с его территории [см. презентацию, слайд 2]. В этой ситуации вы можете пойти традиционным путем. Вы можете пожаловаться своей управляющей компании, а затем пойти в Комитет по благоустройству с очередной жалобой [слайд 3]. Комитет по благоустройству обязан рассмотреть вашу жалобу. Через некоторое время, например, через двое суток он выйдет на место с инспекцией и по результатам оштрафует или не оштрафует мусоротранспортировочную компанию. В этой ситуации получается, что вы теряете свое время и спокойствие, а компания теряет свои деньги и время.

Презентация

Почему так получается? [слайд 4] По данным социологических интервью выясняется, что большинство мусоротранспортировочных компаний, несмотря на то что есть норматив ежедневного вывоза мусора, делают это немного по-другому. Их практика нацелена на минимизацию ресурса топлива, и они называют свой выезд «выездом по заполненности». Проблема в том, что информации о заполненности контейнера у них нет, как нет и прямой, адекватной связи с местными жителями. И вот мы предлагаем свое решение [слайд 5].

Дарья Чуркина (проект Clean Bin): Наше решение, которое объединяет все заинтересованные стороны, – это мобильное приложение для местных жителей и сайт, где будет отображаться вся информация. Местный житель фотографирует мусорный контейнер, который находится около его дома и оценивает степень заполненности – либо он недавно был  вывезен, либо он заполнен и его пора вывозить. После этого он отправляет данные на наш сайт, где отображается вся информация. Таким образом, к каждому дому прикрепляется информация об управляющей компании, которая ответственна за эту территорию. Мы получаем карту с визуализацией работы мусоротранспортировочной компании. Приложение примерно будет выглядеть так – у нас есть прототип [слайд 6]. Например, мне не нравится это кресло – мы делаем его фотографию, определяем, где мы находимся, ставим оценку – заполнен или не заполнен и нажимаем «отправить».

Мы получаем пользу для местных жителей: чистые дворы, возможность контроля управляющей компании и мусоротранспортировочной компании и открытые данные о вывозе мусора [слайд 7]. Мусоротранспортировочная компания получает прямую связь с местными жителями, возможность избежать штрафа за несвоевременный вывоз мусора, а также инструмент логистики для конструирования маршрутов для вывоза мусорра. ЖКС получает уменьшение количества жалоб на несвоевременный вывоз и открытые данные о работе мусоротранспортировочных компаний.

На данный момент у нас реализовано мобильное приложение, которое отправляет данные на сайт [слайд 8]. На сайте эти данные пока что не отображаются, но все они сохраняются в базе данных. У нас не хватило времени, чтобы закончить. Открытые данные, которые мы используем, взяты с сайта «Реформа ЖКХ». Это информация о том, за какой дом какая управляющая компания отвечает.

Анастасия Головнева: Что мы хотим сделать дальше? [слайд 9] Во-первых, нам нужно установить контакт с управляющими компаниями, для того чтобы они поняли пользу этого сайта и пользовались им. Во-вторых, мы хотели бы создать базу данных, которой на данный момент нет, о том, какие мусоротранспортировочные компании за какие территории отвечают. Это позволило бы самим водителям мусоровозов отмечать сделанную работу и таким образом участвовать в создании интерактивной карты. И для того чтобы этот проект жил и был полезен для жителей Петербурга, его нужно развивать через социальные сети и другие каналы. И от всей нашей команды мы желаем, чтобы ваши контейнеры всегда были чистыми и опрятными. Спасибо за внимание.

Константин Задумкин: Есть какой-то экономический смысл, например, для компаний? За счет чего содержать и развивать этот сайт? Есть какая-то бизнес-модель?

Анастасия Головнева: Это отличный вопрос, потому что за это время мы только успели задаться мыслью о том, как проект  может развиваться. Предполагаем, самим компаниям, транспортирующим мусор, эта информация необходима, по крайней мере, по данным интервью, которые мы брали у них. Например, можно сделать специальную подписку для этого сегмента, за счет чего они получали бы дополнительные данные не только о том, насколько заполнен контейнер, но и, например, как выполнили свою работу дворники, каким видами мусора заполнены контейнеры, есть ли строительный мусор и нужен ли дополнительны контейнер. Вся эта информация поступала бы к ним, а на эти деньги содержали бы сайт.

Виталий Власов: Спасибо, поблагодарим проект.

[аплодисменты]

Дмитрий Петровский (проект «Дача 2.0): Расскажу, как я пришел к этой идее. С этой весны я живу на даче и сталкиваюсь с проблемой организации. Закончилось все тем, что летом я сходил на общее собрание и понял, что это, можно сказать, балаган. За пять минут был зачитан отчет по финансовой деятельности кооператива, а споры и вопросы при обсуждении, на мой взгляд, были неконструктивными. И я думал, как это все можно «причесать». В чем, собственно, проблема, которую я вижу? [см. презентацию, слайд 2] Очень сложно собрать общий сбор из 200-300 поселков, нет никакого отчета, который видят все и могут контролировать, обсуждение происходит на общем собрании, что не является конструктивным. Что я предлагаю? Предлагаю сделать мобильное приложение и сайт, на котором все жители смогут выдвигать инициативы, обсуждать вопросы и голосовать по той или иной тематике.

Презентация

Есть два этапа изменений [слайд 3]. Первый – это техническое изменение, то есть мы даем жителям инструмент для предварительного обсуждения вопросов и голосования на эту тематику. Экономится время управляющей инициативной группы на отчетность и организацию жизнедеятельности поселка. Также есть возможность оплатить все прямо из приложения, что упрощает сбор средств. Второй – социальный эффект проекта. Люди становятся более ответственными – они видят, что если кто-то выбросил мусор за участок, то сосед сфотографировал это, все увидели, оштрафовали. Люди становятся более открытыми и инициативными, что приводит к улучшению общения внутри коллектива, а среда проживания становится более приспособленной для человека. 

Как это работает? [слайд 4] Вы получаете сообщение на телефон, что появилось новое обсуждение «Шлагбаум». Михаил предлагает поставить шлагбаум и варианты: простой вариант и хороший, который немного дороже [слайд 5]. Тут же можно прокомментировать, оставить свои пожелания или предложения [слайд 6]. Мы выбираем «хороший» вариант. Через некоторое время либо через какой-то срок, на который рассчитано голосование, либо по факту набора кворума мы получаем информацию о том, что голосование окончено, и можем посмотреть результаты [слайд 7]. Мы поняли, что все-таки все выбрали «хороший». Прямо тут же можно оплатить [слайд 8].

По открытым данным, которые используются в проекте: прежде всего, предполагается взаимодействие с муниципальными органами – контакты, шаблоны обращений в соответствующие органы. Также есть данные, которые не очень просто получить, обычно они не представлены, но иногда они нужны и простым жителям [слайд 9] – здесь будет об этом информация, которая упростит управление.

Кого я вижу целевой аудиторией этого проекта? [слайд 10] Это не дедушки и бабушки, а средний класс с хорошими домами, который активно пользуется мобильными приложениями. Те, с кем я общался, готовы платить порядка 300-400 рублей в год за подобную услугу.

Отсюда бизнес-модель организации – это общение с инициативной группой и выход через инициативные группы на поселки, бесплатная клиентская часть и оплата от управляющей инициативной группы в зависимости от количества пользователей [слайд 11]. Второй этап – нужно прийти с серьезным готовым продуктом в управляющую компанию (при этом могут быть дополнительные индивидуальные наработки по конкретной компании) [слайд 12].

[аплодисменты]

Виталий Власов: Вопросы у жюри? У меня просьба к проектам обращать внимание на два момента: рассказывать, что было сделано на самом мероприятии, и по возможности показывать то, что было сделано, а не только останавливаться на презентации. 

Дмитрий Петровский: К сожалению, в ходе проекта я потерял своего разработчика, поэтому я только донес идею.

Константин Задумкин: А перед существующими сервисами – чаты, группы «В контакте» – какое конкурентное преимущество?

Дмитрий Петровский: Тут была показана упрощенная версия голосования. Предполагается, что будут более формальные вещи, то есть будет электронная форма подписи, чтобы можно было подписать жалобу, поставить при голосвании, чтобы было видно, что человек проголосовал за тот или иной вариант. Будет формальный документ по итогам голосования, то есть некий изначальный шаблон, предложение, у которого в процессе обсуждения выявляются какие-то недостатки, администратор формирует в некий итоговый документ, по которому работают. Например, уборка снега – сформулировали ТЗ, дальше идет исполнение.

Василий Пушкин: Для управляющий компаний электронное голосование у нас не реализовано и не может быть реализовано. Нужны реальные подписи.

Дмитрий Петровский: Есть такое. Есть формальные вещи, которые не могут быть изменены, но это все равно отличный инструмент для понимания, нужно ли вообще такой вопрос выдвигать на голосование. Возможно, нет необходимости собирать общее собрание – люди могут в удобное время подъехать в управляющую компанию или инициативную группу и расписаться по факту для юридической обоснованности того или иного решения.

[аплодисменты]

проект: epihelp

Дмитрий Оторов: Сегодня мы представляем проект по борьбе с эпилепсией, поскольку в момент эпилептического припадка люди очень часто страдают от того, что никто не может оказать помощь Основная задача нашего проекта – помощь людям с эпилепсией [см. презентацию, слайд 2].

Презентация

Как это работает? Приложение работает синхронно с датчиком все время в режиме онлайн [слайд 3]. Пациенту достаточно один раз зайти в приложение, как оно сразу начинает функционировать. Если начинается приступ эпилепсии, датчик мгновенно передает сигнал на телефон и по истечении десяти секунд рассылает сигнал о помощи в близлежащие больницы, а также родственникам (в случае, если есть привязка пациента к определенной больнице, сигнал поступит и туда) [слайд 4].

Кому это будет интересно? [слайд 5] Этот проект будет интересен, в первую очередь, людям, страдающими эпилепсией, а также больницам и частным клиникам. 75 млн человек, страдающих эпилепсией, нуждаются в нашей помощи.

Из зала: В мире?

Дмитрий Оторов: Да, в мире. Характеристики устройства [слайд 6]. За основу был взят Arduino Uno на Bitronics c действующим алгоритмом, который был написан нашей командой для исключения ложных срабатываний в повседневной жизни. Весь использованный soft был написан нашей командой.

Сбор статистики [слайд 7]. Также мы ввели функцию сбора статистики активности мышц, которая в дальнейшем будет сохраняться в облачном сервисе для отправки этих данных в медицинские учреждения.

Наш источник – откуда мы все это берем? [слайд 8] Благодаря информации, предоставленной на сайте Администрации Санкт-Петербурга, мы получили доступ ко всем государственным частным клиникам и больницам с их данными, и нам удалось добиться максимальной точности во благо нашим клиентам, так как точность – это основной критерий в нашем проекте.

Теперь перейдем к показу [см. видео]. Все это было собрано буквально за сутки, то есть это свежий проект, хотя есть над чем работать.

Сергей Житинский: Это у вас все датчики?

Дмитрий Оторов: Здесь датчик, который срабатывает после того, как происходит сокращение мышц. В случае эпилепсии происходит сильное сокращение мышц, и датчик сразу передает сигнал определенному устройству. Вот приложение, с которым датчик будет контактировать. Здесь у нас 170 больниц.

Сергей Житинский: А как молодой человек будет симулировать?

Дмитрий Оторов: Это просто сокращение мышц – при эпилепсии тоже происходит сокращение мышц, а датчик все это фиксирует. Мы можем показать спокойный график, при сокращении мышц происходит резкое возрастание, когда мышцы расслабляются, график успокаивается и идет ровно. Также в телефоне добавлено приложение «Контакты», с которым человеку будет удобно. Можно будет также изменить цветовой стиль и язык. Спасибо. Какие вопросы?

[аплодисменты]

Сергей Житинский: А датчик у вас уже был разработан?

Дмитрий Оторов: Да. Повернись, покажи.

Сергей Житинский: Его надо оптимизировать – он слишком большой.

Дмитрий Оторов: Да, в дальнейшем это будет просто браслет на человеке, который будет прикрепляться к руке. И он будет очень быстро отправлять сигнал на телефон, а дальше – передаваться во все больницы.

Из зала: Есть ли конкуренты у вашего решения?

Дмитрий Оторов: Конкуренты есть, но как все построено? Конкуренты есть в том случае, если, например, пациент лежит ночью – получается, датчик срабатывает только ночью, при условии что пациент начинает поворачиваться. Такого, как у нас, нет – это новое (новый датчик и т.д.).

Виталий Власов: Есть еще вопросы у членов жюри?

Валентин Макаров: Вы не смотрели, какие еще датчики могут быть полезными?

Константин Ким (проект Epihelp): В этот датчик также можно встроить пульсометр и ЭКГ. Он считывает эти данные, но мы не успели сделать, чтобы он собирал данные на телефон, не успели оптимизировать, было мало времени. Мы прикинули идею вчера, и сейчас эти данные собираются на компьютере, то есть мы можем продемонстрировать вам на компьютере, как он собирает и сохраняет эти данные.

Виталий Власов: Спасибо, еще вопросы? Если вопросов нет, тогда переходим к следующему проекту.

[аплодисменты]

проект: биржа овощей

Владимир Калугин: Биржа овощей – это торговая площадка для продажи сельхозпродукции фермерами напрямую магазинам и крупным торговым сетям [см. презентацию, слайд 2]. «Биржа» состоит из нескольких модулей: статистический, биржевой и консалтинговая служба.

Презентация

Решаемые проблемы – начнем с проблем [слайд 3]. В сельском хозяйстве есть такая проблема: фермер не может продать свою продукцию, и она гниет – тысячи тонн помидоров сгнивает. Почему? Фермеры живут в информационном вакууме. Даже если есть какие-то платформы, они не могут ими воспользоваться. В нашей «Бирже» заложена консалтинговая служба, которая им помогает [слайд 4]. Допустим, у человека есть 20 т яблок, которые он хочет продавать по определенной цене – мы выводим на нашу биржу товар, делаем за него все документы, присылаем к нему машину, и он напрямую получает деньги [слайд 5].

Что мы делали на хакатоне? В «Бирже» есть статистический модуль [слайд 6]. Он позволяет прогнозировать развитие бизнеса. Нам подали хорошую идею, что можно использовать уже готовые данные – Росстат и «Ценомер» [слайд 7]. Можно использовать готовые данные и сделать статистику по сельхозпродукции. Зачем? Мы можем установить дельту по ценам, например: желтое – это данные о ценах, по которым фермеры напрямую продают свой товар, а синее – это данные о ценах, по которым покупатели приобретают [слайд 8]. Разница – это дельта по цене. Разница между двумя графиками – это те люди, которые зарабатывают на перекупках. Перекупка – это зло биржи сельхозпродукции, потому что перекупщики накручивают цену. Пока они ее накручивают, товар портиться и покупатели приобретают некачественный и переоцененный товар. Если фермеры смогут продавать напрямую, то это исчезнет.

Что еще дает статистический модуль? [слайд 9] Для того чтобы открыть свой бизнес, нужно сделать бизнес-план. А как это сделать, если нет никаких данных? Как можно установить, сколько нужно морковки и нужна ли она рынку вообще? Сейчас нигде этих данных нет. На «Бирже» мы можем промониторить наши сделки и на основе этих данных получить ответ на вопрос о том, сколько заказали морковки, сколько продали, сколько не хватило, чтобы покрыть заказ. Также мы можем получить средние данные по регионам – где выгоднее продавать огурцы – в Ленинградской и Московской областях [слайд 10]. В Дагестане есть дядя Ашот, который продает тем, кто приедет к нему на камазе. Если бы он знал, что в Москву он может продать их, допустим, по 90 руб. за кг, он бы заказал у нас обработку сделок, мы бы ему послали машину, и он бы заработал намного больше. Также есть статистика динамики цен между разными товарами [слайд 11]. Для разных товаров есть разные периоды, когда они наиболее востребованы. Сейчас фермеры знают приблизительно, что цены на продукцию подскакивают к Новому году и в марте. Почему? У всех на складах заканчивается продукция, и цена, соответственно, растет. Если бы они знали точные данные по каждому товару, когда плавает цена – поднимается и уменьшается, – они бы знали, что могут на содержание передать в склад, а потом сбросить товар в марте, то заработали бы в десять раз больше, чем когда сбрасывали осенью, когда цена на всю продукцию очень низкая.

Это большая идея – мы презентовали ее еще в «Сколково» [слайд 12]. У нас есть все скриншоты «Биржи»: подаете продукцию, следите, как цена растет на ваш лот [слайд 13]. Потом, когда оформили сделку, следите за товаром – пришла машина и он уже едет на склад [слайд 14]. Когда все сделки закончились, выставляете рейтинг. Допустим, покупатель не кинул вас – нормальный покупатель, ему можно доверять [слайд 15]. А покупатели выставляют оценки фермерам – говорят, что у них качественная продукция, их заявления о том, что картошка такого сорта и класса правильные [слайд 16].

Для того чтобы оценить идею, мы сделали маленький сайт, на котором размещены характеристики «Биржи» и спрашивается ваше мнение – интересно или не интересно [слайд 17].

Виталий Власов: Спасибо, что успели сделать за этот хакатон?

Владимир Калугин: Мы пришли сюда, чтобы поговорить с менторами и получить обратный отклик. Кроме этого маленького сайта и опроса, мы ничего не делали. Мы искали больше связи, потому что проект был нацелен на развитие фермерства, а реализация проекта – семь месяцев.

Виталий Власов: Спасибо, вопросы у членов жюри?

Из зала: Данные по ценам, которые были представлены, откуда будут собирать и кто это будет делать?

Владимир Калугин: По ценам на что?

Из зала: На огурцы, помидоры – десятки и сотни позиций по каждому региону, каждому магазину – это колоссальный объем данных.

Владимир Калугин: Красота информационных технологий в том, что мы не будем это делать. Это будут делать наши боты-скрипты на серверах. Мы будем «грабить» Росстат, «Курс цен», «Ценомер» и другие сайты, на которых мы потенциально можем вычислить важную информацию. Потом мы ее обрабатываем и приводим в удобный для человека вид. Это первое. А второе – мы сами будем открытыми данными, то есть по всем сделкам, которые происходят на «Бирже», будут мониториться цены. Выставили 40 т огурцов, купили по такой-то цене – мы ловим все данные и выставляем собственную статистику. Пока у нас ее нет, будем искать сторонние данные. Когда «Биржа» разрастется, мы будем жить только на собственных данных и бесплатно предоставлять всем эту информацию.

Валентин Макаров: А кто такие «вы»?

Владимир Калугин: Команда из разных городов: Илья Демин – наш генеральный директор, я занимаюсь веб-частью, у нас есть инженер, который делает контроллеры для автоматизации теплиц, есть архитектор, есть агроном…

Из зала: Как вы пришли к этой проблеме?

Владимир Калугин: Эта проблема лежит на поверхности в сельском хозяйстве. Этим летом я общался с людьми и рассказывал идею. Подходит один дяденька и говорит: «Да, все верно – выращиваю яблоки...» Расскажу реальный случай – вы поймете, как все происходит на самом деле. Есть такой договор контрактации – когда у тебя заказывают вырастить продукцию под кого-то. У тебя магазин и тебе нужно 40 т томатов – ты заключаешь договор контрактации и фермер специально для тебя выращивает 40 т к такому-то числу. С фермером заключили такой договор, а потом кинули его. У фермера куча долгов – он должен был купить семена, обработать землю, нанять работников, чтобы засеять и собрать урожай. Когда он оказался в ситуации, что он сидит на ящиках с помидорами, потому что у него нет покупателя, он не знает, кому сказать, потому что заказчик смылся. Он написал в записке: «Я не могу отдать 2 млн долгов», – и застрелился. Это не единичный случай. Сельское хозяйство сейчас в трудной ситуации.

проект: монетизация открытых данных

Елена Ахматова: Моя презентация больше теоретическая, нежели какой-то конкретный проект. Как человек, который занимается данными в общем и уже несколько лет консультирует различные рекламные компании о том, как анализировать данные, что можно узнать о данных, которые эти рекламные компании собирают, меня заинтересовало, какие открытые данные есть у нас, особенно в России, на которые не было возможности обратить внимание.

Я решила провести исследование географической составляющей открытых данных с целью определения, что это такое, какова потенциально возможная монетизация, что можно посоветовать использовать из этих данных, например, рекламным компаниям, потому что сколько мы существуем все рекламные компании в мире изучают историю посещений пользователями разных url, геоданные. Я решила посмотреть, что есть в открытых данных в России.

Почему заинтересовала географическая составляющая? Сейчас очень сильно развивается онлайн-реклама на различных гаджетах, таких как смартфон и планшет, поэтому в основном рекламные компании получают через смартфоны и планшеты информацию о людях, которые открывают какой-то сайт, их геоданные. Эти данные могут использоваться и для каких-то социальных проектов, например, для социальной рекламы, но не только для них, и меня интересовали не социальные проекты.

Конечно, я посмотрела на все датасеты. Если просто пробежаться по поверхности, то очень много датасетов, которые содержат геоинформацию или адрес чего-либо, и мы можем узнать, где размещается парки, музеи, парковки, спортивные объекты, медицинские учреждения. Это необычный датасет тем, что он связан с рекламой – это датасет по рекламным щитам, очень чистый. Я посмотрела на него – он содержит и геоинформацию, и адреса, где эти щиты установлены, а также территориальные описания этих географических мест.

Я делала анализ данных в приложении к рекламным компаниям. Что делают рекламные компании? У них есть какие-то геоданные, и они пытаются разделить всех людей, которые открывают сайты, которые что-то «браузят», на какие-то осмысленные группы. Нам нужно узнать, кто эти люди. Ага, у нас есть любители ходить на спортивные мероприятия. Допустим, мы вычислили по географическим координатам, что эти люди часто бывают в Мариинском театре. Мы знаем координаты театра, знаем, что эти люди там были, что-то смотрели на своем телефоне. Мы можем рекламировать билеты в театры или что-то культурное, что-то хорошенькое. По рекламным щитам – есть люди, которые живут рядом со строящимся бассейном, и им можно рекламировать какие-то вещи, которые можно купить для того, чтобы ходить в бассейн.

Что я сделала? За хакатон я успела взять данные по рекламным щитам – получились очень чистые, хорошие данные (успела посмотреть, что действительно данные устойчивые, их можно использовать). Идея понятна – использовать на предмет рекламы географические данные для таргетирования и проведения рекламных кампаний. Можно перевести на браузер – здесь можно все подвигать, плюс, минус – это то, что я успела сделать а эти выходные. Развернуть кластеры – они работают. На практике все очень хорошо показывает. Я проверяла адреса – действительно, все соответствует. Карты – можно посмотреть, на каких щитах распространяется реклама, какого размера. Я узнала, что географические данные среди открытых данных есть и есть, на что посмотреть. Первая моя задача как аналитика, которую решают все аналитики, была в том, чтобы посмотреть, насколько данные чистые, хорошие, что из них с технической точки зрения можно что-то вытащить.

В будущем, если понадобится, придется автоматически вытащить все датасеты, в которых есть географические данные, и смотреть, что из них можно вытащить.

Виталий Власов: Спасибо, один вопрос уже есть.

Константин Задумкин: Эта база по щитам уже была или вы их как-то вытащили?

Елена Ахматова: Это открытые данные, которые лежат на сайте открытых данных РФ. Конкретный этот датасет представляет собой щит, тип конструкции, размер и еще некоторое описание.

Константин Задумкин: Администрация же выложила сама.

Елена Ахматова: Сама. Все открытые данные какая-то администрация выложила сама. Не помню, какая администрация, но это государственная организация.

Сергей Житинский: Вы взяли открытые данные и сохранили hadoop зачем? В расчете на то, что потом их будет очень-очень много?

Елена Ахматова: Их уже очень-очень много на сайте открытых данных.

Сергей Житинский: А почему здесь не больше ста?

Елена Ахматова: Потому что только по сто можно выгружать. Всего их 18657. Если положить все 18 тыс, то будет большая синяя точка. А почему hadoop – потому что я много занимаюсь hadoop, очень много использую для разработки, в общем, очень люблю. Hue – тоже очень хорошее приложение, чтобы быстро что-то посмотреть.

[аплодисменты]

проекты: ретроспектива застройки / карта участковых / аналитика жкх

Павел Суворов: Здесь дана визуализация домов по годам, периодам и архитектурным стилям [см. презентацию, слайд 2]. В основе – база данных региональной программы по капитальному ремонту, контуры импортированы из Open Street Map. Часть была геокодирована, а часть – заполнена вручную. Каждое здание – это объект, и у него есть свойства.

Презентация

2050 зданий ранжированы по историческим периодам [слайд 3]: можно увидеть дореволюционный, советский и современный [слайд 4]. Большая дореволюционная застройка, советская застройка – это кварталы, современная – точечная застройка. По архитектурным стилям – около 15 стилей [слайд 5]. Дальше застройка была в 1970-е годы – здесь в основном эклектика, а на периферии – заводы. Есть версия на английском языке [слайд 6].

Одна из маленьких визуализаций, как застраивалась Петроградская сторона – можно увидеть рост строительства в дореволюционное время, потом резкий спад во время революции, спад во время блокады и снова подъем в 1960-е годы. Проект может быть использован в сфере урбанистики [слайд 7].

Дальше – «Карта участковых полиции» [слайд 9]. Данный проект рассказывает о функциях участковых, показывает зоны их ответственности. Основная проблема – это плохая осведомленность горожан о работе участковых. Участковый – это представитель полиции «в поле», он работает с гражданами, но при этом большинство граждан не знает о функциях участковых. Из-за этого не происходит взаимодействия, и участковый не может выполнять свои обязанности.

Решение – это подача информации в удобном формате: карты, инфографика, рассказ об участковых и запрос недостающей информации [слайд 10]. Здесь более подробно о функциях [слайд 11: например, если теряют ключи от двери и вам нужно ее взламывать, или проблемы с парковкой, или какой-то бытовой конфликт с соседями [слайд 12].

Карта участковых [слайд 13] – здесь есть данные: можно кликнуть на дом и увидеть, какой участковый за него ответственен, узнать его телефон, адрес. То же самое, только для отделов полиции [слайд 14].

Решение – приложение, которое считывает координаты, где находится человек, и позволяет позвонить в дежурную часть с помощью одной кнопки [слайд 15]. Подобный проект делали, но в нем было использовано только декодирование. В данном случае карта заполнена полностью. Карту участковых полиции делали еще до революции – это карта 1870 года. Недавно появилась новость, что проводился конкурс на лучших участковых и второе место занял участковый Петроградского района. Можно сразу посмотреть – он в двух кварталах от нас.

Проект «Аналитика управляющих организаций». Проблема – низкая эффективность управляющих компаний, плохая осведомленность граждан о работе и низкая открытость информации [слайд 17]. Я знаю людей, от которых поступило почти 13 тыс звонков с жалобами на проблемы ЖКХ. Часто встречаются новости о скандалах в этой сфере. Это происходит, отчасти, из-за закрытости информации.

Это карта управляющих организаций – жилкомсервисы, управляющие компании и ЖСК [слайд 18]. Есть стандарты раскрытия информации, а черным отмечены дома, где нет данных, которые по стандарту обязательны к публикации [слайд 19]. По сути, это административное правонарушение. Здесь можно узнать о масштабе деятельности, финансовой устойчивости, репутации компании и общем рейтинге [слайды 20-25].

В итоге существует хороший стандарт раскрытия информации, но управляющие компании не публикуют данные, потому что нет какого-то спроса [слайд 26]. Спасибо.

[аплодисменты]

Виталий Власов: Спасибо, вопросы?

Из зала: По поводу раскрытия данных участковых – каким образом вы контактировали с Управлением внутренних дел?

Павел Суворов: Я использовал данные сайта МВД и уточнял информацию в отделе полиции. 

Василий Пушкин: Примерно такой же вопрос по управляющим компаниям: какие данные использовались?

Павел Суворов: Использовались данные с сайта «Реформа ЖКХ».

Василий Пушкин: «Реформа ЖКХ» – это требования, а с точки зрения самих управляющих компаний?

Павел Суворов: Они обязаны публиковать их на сайте «Реформа ЖКХ».

Юрий Гатчин: Все управляющие компании обязаны раскрывать информацию полностью, иначе они не получат лицензию.

Павел Суворов: Стыдно, что они это не делают – видите, сколько нулей или черных домов. За это довольно серьезное наказание.

Юрий Гатчин: Я разберусь с Петроградской стороной [смех в зале, аплодисменты].

Алексей Сидоренко: Павел, скажите, я правильно понимаю, что подложка из этих домов – это не встроенная подложка?

Павел Суворов: Это данные Open Street Map. Движок можно использовать для других проектов.

Алексей Сидоренко: То есть, вы взяли из Open Street Map и вставили в карту?

Павел Суворов: Да.

Виталий Власов: Спасибо, на этом закончим.

[аплодисменты]

проект: aurorabot

Владимир Смирнов: Наш проект осуществляет раннее оповещение о предстоящем северном сиянии. Оказывается, в Санкт-Петербурге они иногда происходят. На этой фотографии, которая сделана моим приятелем, Токсово 9 октября [см. презентацию, слайд 2]. Он знал заранее и специально выехал туда – посмотрите, какие красивые кадры при малой освещенности неба. Я им сильно позавидовал, поскольку я об этом заранее не знал. У нас появилась идея автоматизировать оповещения.

Презентация

У NASA есть спутник – он находится в точке Лагранжа 1 и регулярно следит за вспышками на Солнце и скоростью солнечного ветра, что позволяет за три дня узнать о том, что будет магнитная буря, которая сопутствует и создает потенциальную возможность для северных сияний [слайд 3]. По скорости солнечного ветра можно примерно за 30-40 мин узнать, где именно и с какой интенсивностью его будет видно. Возможность узнать это с такой точностью появилась не так давно – с 2013 года Национальное управление океанических и атмосферных исследований США предоставляет открытый доступ к расчетным данным модели, которая предсказывает, где и когда будет видно сияние в ближайшее время. Эта модель выглядит примерно так [слайд 4] – красный цвет означает наибольшую вероятность видимости, зеленый цвет – более низкую. Во время вспышек зеленая область часто расширяется и достигает Петербурга и более южных широт. В нашем городе сияние происходило несколько раз за зиму, но об этом никто не знает, потому что это происходит чаще всего за облаками.

Мы сделали оповещение в форме бота Telegram Messenger – можно подписаться, указать определенный город, и вы будете получать сообщения, как только сияние станет достаточно вероятным. Код выложен на GitHub – с ним можно ознакомиться. Вы можете подписаться – он работает.

У меня остается свободное время – я могу вам продемонстрировать. По-видимому, на экране не удастся, но я смогу сделать это с собственного ноутбука [см. видео]. Достаточно просто ввести команду, например, Мурманск. Вы видите, что на экране появилось определенное место на карте. Сейчас придет сообщение с указанием вероятности увидеть в ближайшее время сияние. В данный момент около 13% вероятность сияния в ближайшие полчаса. На этом все [слайд 5]. Желаю вам приятного наблюдения, если вам это интересно.

Валентин Макаров: Скажите, пожалуйста, солнечные вспышки вызывают ведь не только сияние – они вызывают магнитные бури, влияют на здоровье человека. Вопрос сияния, конечно, это фан, но наверняка есть другие факторы, которые можно использовать и монетизировать, привлекая информацию о вспышках на Солнце?

Владимир Смирнов: Как видите, целью нашего проекта не была монетизация, а решение задачи, которую мы посчитали интересной. Данные с этого спутника существуют как по вспышкам и интенсивности, так и по сиянию. По сияниям данные появились не так давно, потому что нет практической отдачи. Общая интенсивность электромагнитных излучений – более открытая информация и не требует такого изощренного доступа к ней.

Василий Пушкин: Аналоги есть?

Владимир Смирнов: Два года назад появились открытые данные и, по крайней мере, два человека воспользовались ими – они предоставляют платную смс-подписку около €5 в месяц. Наше решение бесплатное и к тому же с открытым исходным кодом.

Виталий Власов: Вы воспользовались сервисом?

Владимир Смирнов: Мы воспользовались открытыми данными – кажется, я сказал достаточно четко.

Виталий Власов: Все? Если вопросов нет, тогда спасибо.

[аплодисменты]

проект: каталог открытых данных

Александр Кирсанов: Я начал не с нуля – у меня был сервис, который анализировал данные (каталог, в котором данные хранились в файлах Excel). И через это веб-интерфейс с ними можно было работать. Данные были коммерческими – в основном прайсы.

Что мы сделали за хакатон? Добавили возможность распарсить из каталога на файл Excel базу с отдельным веб-интерфейсом для того, чтобы разрозненные данные из отдельных файлов можно было искать в реестре.

Сейчас, наверное, к вечеру попытаемся сделать мобильный вариант – десктоп-исполнение превратим в некий лист, в котором можно работать с данными. Что сделаем, если это будет нужно? У каждого портала открытых данных есть некий ip, в принципе никакой проблемы забирать данные на наш сервис из множества, более ста порталов нет. Сначала берется реестр данных, потом скачивается какое-то отдельное приложение.

Я не собираюсь конкурировать с имеющимися порталами, но есть определенная проблема. Когда я увидел данные на порталах, то мне как не специалисту работать с ними было очень неудобно. Нужно хотя бы оценить, какие данные есть. Везде разные интерфейсы. Как работать с crv, иногда не понятно.

Обозначилась проблема для исследования – почему-то ко мне подходили в основном социологи. У них множество открытых данных – они тоже хотят их где-то брать и где-то хранить. На обычном портале это делать неудобно. Бизнес-структуры тоже, наверное, хотели бы публиковать открытые данные, но, к сожалению, порталы в основном государственные. Поговорили с профессионалами – тоже есть проблемы. Множество порталов- данные находятся разрозненно. Иногда хочется собрать какие-то данные и технологии в одном месте, иметь запасной вариант хранения, потому что данные пропадают, иметь дополнительный механизм работы с данными. Нужно из нескольких пакетов данных делать производные данные. нужно консолидировать данные где-то в одном месте. Цели были достигнуты, пицца была вкусная, люди были интересные, лекции – занимательные, я проявил гражданскую инициативу и заявил о себе.

Я не сказал ни слова о монетизации. По всей видимости, деньги за это брать пока не нужно. Это должен быть открытый код – я готов его открыть. Капитализация должна идти в технологии. Жаль, что не удалось показать, как это работает, – кому интересно, потом покажу.

Виталий Власов: У вас есть одна минута – можете сейчас попробовать показать.

Александр Кирсанов: Если можно. Проблема работы с данными не заключается только в работе с открытыми данными. Данных много. И сейчас надо двигаться в сторону решения двух проблем. Первая – у нас плохая инфраструктура для работы с электронными подписями, совершенно не работает ни один сервис с атрибутивными сертификатами. Решение проблемы доверия данным – это вопрос криптографии. Вторая – мы все работаем с данными архаическим способом. У нас есть способ пересылки, есть способ работы с данными на стороне поставщика услуги. Все вопросы решаются одним способом – переходом к оперативному владению информацией.

Виталий Власов: У вас есть 25 сек, чтобы показать.

Александр Кирсанов: Каталог нам нужен для того, чтобы выбрать и поискать данные, например, субсидии. Поверьте на слово, это работает. Есть конкретный набор данных и с ним нужно работать, как только он опубликован. Ну, мы все зависим от связи…

Виталий Власов: Возобновилась связь. Ну ладно, давайте теперь вопросы членов жюри. Вопросы есть? Вопросов нет. Тогда поблагодарим проект.

[аплодисменты]

проект: культспонсор

Александр Дауркин: Будет онлайн-презентация – надеюсь, интернет нас не подведет. Проект решает проблему, я бы даже сказал, множество проблем, в первую очередь, в сфере культуры. Сфера культуры практически полностью финансируется государством – внебюджетных средств там практически нет. Мы все знаем крупные истории, но массовости в этом нет.

В сфере культуры не умеют работать с бизнесом, потому что они привыкли жить на государственные деньги. А бизнес не имеет удобного для него инструмента работы со сферой культуры, хотя им, на наш взгляд, это интересно. И кейсы это подтверждают – все эти случаи очень трудозатратные для бизнеса.На экране есть ссылка – если кто-то хочет, может сразу попробовать.

О проблеме я рассказал, теперь – решение. Мы предлагаем биржу спонсорских пакетов культурных мероприятий, которая позволит в простом виде соединить в одном месте учреждения культуры и бизнесы, которые заинтересованы в развитии своего проекта, контакте с аудиторией учреждений культуры.

Также в этом проекте мы видим и социальную компоненту, но в первую очередь, это коммерческий проект. Нам известен один конкурент – это стартап, у них всего 25 мероприятий. Они позиционируются как эксперты в этой области – мы видим, что есть упор на консалтинг и достаточно высокая комиссия. Наш сервис более массовый, и он доступен мелкому бизнесу.

В чем нам видится плюс данного сервиса? Он позволяет заниматься спонсированием учреждений культуры не каким-то гигантским федеральным структурам, а локальным бизнесам. Они могут спонсировать локальные учреждения культуры и контактировать со своей целевой аудиторией, которая живет вокруг них и может постоянно пользоваться их услугами.

Затрону монетизацию. Основной планируемый способ монетизации – это комиссия со спонсорских пакетов. В данном случае это просто бесплатный информационный ресурс, но с возможностью развития этого направления.

Используются открытые данные Министерства культуры РФ. Они доступны по указанным ссылкам – удобная IPI, большое спасибо Министерству культуры. Есть некоторые цифры о количестве мероприятий и учреждений, уже имеющиеся в этой базе. Эта база постоянно наращивается. Министерство ведет большую работу, поэтому сфера культуры будет практически полностью представлена в этой базе.

Немного скажу о развитии проекта. Сейчас он позволяет собирать данные, но мы планируем с этими данными и уже выбранными нами потенциальными партнерами работать в ручном режиме, предоставлять сервис, для того чтобы сделать его удобным и потом автоматизировать для массового потребителя. И у нас есть демонстрация, если время позволяет.

Так как Hack for Piter, то и фильтр настроен на Санкт-Петербург. Допустим, нам интересны мероприятия, проходящие в музеях. В базе Санкт-Петербурга нашлось восемь мероприятий со строкой «Музей». Это предстоящие мероприятия. Мы можем посмотреть их на карте. Это более важно локальным бизнесам, которые не хотят спонсировать на другом краю города – они хотят спонсировать и продвигаться именно в своем районе. Мы можем посмотреть достаточно подробную информацию о каждом мероприятии, там есть история предыдущих мероприятий, чтобы было понятно, что это. Если бизнесу нравится это мероприятие и он хочет его проспонсировать…

Виталий Власов: Ваше время уже вышло…

Александр Дауркин: На данный момент есть возможность обратиться к учреждениям культуры и запросить спонсорский пакет, как чаще всего и происходит. В открытом доступе спонсорских пакетов, как правило, нет. Мы планируем наполнить базу, а пока это канал, чтобы добраться до учреждения культуры и запросить эту информацию. Также у нас есть маленькая демонстрация, но мы уже не успеем. Скажу о том, что мы называем киберфичей. Учреждения культуры, как правило, не умеют работать с бизнесом и сформулировать нормальное грамотное предложение. Одна из задач нашего сервиса – дать им простой инструмент, ответы на вопросы, на которые они могут ответить. И они создадут предложение интересное и понятное бизнесу. Не доклад на тему культуры, а коммерческое предложение: размер и половозрастные характеристики аудитории и т.д. – так, чтобы все было просто и понятно.

Виталий Власов: Спасибо, что успели сделать за хакатон?

Александр Дауркин: Все, что вы видите.

Из зала: Когда вы начали проект?

Александр Дауркин: Я его начал две недели назад в Москве на хакатоне открытых данных. На том хакатоне я не написал ни строчки кода – я работал только с менторами с целью проработки идеи.

Зинаида Васильева: У меня вопрос о социальной значимости. Если я правильно вас поняла, вы берете всю первичную информацию с сайта Министерства культуры и таким образом вы автоматически исключаете все инициативы, которые не финансируются со стороны государства. С одной стороны, это очень похвально, потому что им тоже нужно учиться разговаривать с бизнесом. С другой стороны, вы ориентируетесь на аудиторию, которая получает хоть какое-то финансирование. Все культурные инициативы, которые находятся за ее пределами, как не имели источников финансирования, так и не имеют. Более того, внимание бизнеса будет перефокусировано. Я просто советую подумать об этом.

Александр Дауркин: У меня есть ответ. Эти данные из базы данных Министерства культуры, но они не ограничиваются только бюджетными учреждениями. Даже не бюджетное, а коммерческое учреждение может зарегистрироваться и вносить свои мероприятия, и оно попадет не только туда. Если вы представитель именно такой структуры, то, думаю, вам будет полезно зарегистрироваться в этой базе. Тем самым не ограничиваемся только бюджетными учреждениями. В принципе я думаю, что бюджетным нужно учиться работать с бизнесом, а вы, наверное, уже умеете, но вам там тоже рады.

Валентин Макаров: Скажите, а можно заказать билет на мероприятие не в качестве спонсора, а просто посетить?

Александр Дауркин: Сервис не рассчитан на это, но билеты могут быть включены в спонсорский пакет, хотя это совершенно другое. Этот сервис не для посетителей культурных мероприятий – это для бизнеса, который хочет спонсировать и поддерживать культуру.

Валентин Макаров: Почему не использовать это?

Александр Дауркин: Продажу билетов? Мы считаем, что сервисов продажи билетов уже достаточно много. И это не наша компетенция. Мы можем сделать какой-нибудь виджет продажи билетов, но аудитория немного не та, я бы сказал.

Виталий Власов: Спасибо, поблагодарим проект.

[аплодисменты]

проект: уникальный петербург 

Татьяна Лялина: Мы последние и надолго вас не задержим. Наш проект носит социальный, а не коммерческий характер. С уникальностью нашего города никто спорить не будет. Мы решили посмотреть на Петербург под другим углом – с реставрационной точки зрения.

В процессе нашей профессиональной деятельности мы столкнулись с проблемой отсутствия информации о сохранении памятников культурного наследия и реставрационных процессах у жителей нашего города [см. презентацию, слайд 2]. Вторая проблема, которую решает наш проект, – это возможность самореализации активных граждан в городском проекте.

Презентация

Цель проекта заключается в создании площадки для размещения информации, обсуждения проблем, мероприятий, инициатив, творчества в области охраны памятников культуры; организация общественного мониторинга состояния охраняемых объектов; организация мониторинга целевого использования средств, выделенных на содержание тех объектов культурного наследия, которые есть у нас в городе; и наверное, формирование некоей гражданской ответственности населения за сохранение уникальной городской среды [слайд 3].

Инструменты, которые мы планируем применять [слайд 4]: тематический сайт с интерактивной картой; тематические группы в соцсетях; создание образовательных (просветительских) продуктов (открытые лекции, экскурсии, игры, конкурсы, теле- и радиопрограммы – в ограниченных рамках эта деятельность уже ведется); также проведение тематических акций (это квесты, городское ориентирование, флешмобы, уборка территорий памятников, уникальные экскурсии, конкурсы – все, куда можно привлечь наших горожан); привлечение корпуса волонтеров (создание программы обучения волонтеров и мероприятия поощрения для активных участников этого движения); создание приложения для смартфона «Мой маршрут по Петербургу» (это некая прогулка по возрожденному Петербургу на основе восстановленных и уже отреставрированных памятников культуры).

Аудитория проекта [слайд 5]: самая комфортная аудитория, конечно, – это та, которая имеет профессиональный интерес, активно работающая или учащаяся часть горожан, а самая некомфортная – это не умеющая читать (и иностранцы).

Как мы собираемся оценивать результаты проекта? Количественную оценку, наверное, сделать проще – это количество вовлеченных в мероприятия горожан и инициативных предложений. Качественную оценку, наверное, можно оценить только посредством изменения взглядов, поведения по отношению к нашим памятникам, а также управленческие и законодательные изменения, которые происходят в городе.

Следующее – мы бы хотели представить прототип сайт – это сделает его создатель Ася.

Анастасия Ли: Прототипом его особо не назовешь – это просто примерно, что будет изображено на сайте, какие функции он будет выполнять [слайд 6]. Будет предоставлена общая информация о культурном наследии, реставрации, истории, людях. Также будут представлены мероприятия, которые проводятся; организация волонтерского движения, форум, на который можно будет обращаться, если вы обнаружите проблему, где можно будет обсуждать и решать проблемы; новостная строка; кнопка SOS, которая позволит быстро оповещать о том, что произошли нарушения в содержании и конструкции какого-либо архитектурного памятника.

Татьяна Лялина: Мы планируем привлекать источники финансирования под конкретные программы [слайд 7]. Такими источниками могут быть Министерство культуры и КГИОП (это что касается QR-кодирования объектов); Комитет образования (по образовательной программе для школ); общественные организации в части организации профессиональных конкурсов; коммерческие организации (для создания сайта и приложения); возможно, туристские агентства, заинтересованные в уникальных экскурсионных программах; благотворители, фонды.

Польза от нашего проекта – это сохранение культурно-исторической городской среды с помощью активных граждан. Проект является инструментом влияния на управленческие и законодательные решения в области сохранения культурного наследия [слайд 8].

В завершение презентации хотела бы сказать, что все, что вы здесь видели, создано за 24 часа. Вчера мы пришли, имея только некую идею проекта и опыт проведения отдельных мероприятий – все это было осмыслено, придумано название, сайт и все, что мы вам представили. Спасибо за внимание.

[аплодисменты]

Сергей Орлов: Скажите, какие открытые данные используются в вашем проекте?

Татьяна Лялина: Открытые данные КГИОП – это список охраняемых объектов Санкт-Петербурга, а также списки отреставрированных объектов на ближайшие три года.

Сергей Орлов: Списком?

Татьяна Лялина: Это списком.

Святослав Гайкович: Очень интересно вы подошли вплотную к очень важной проблеме – я поставил вам высший балл за социальную значимость. Но тут же вы разыскали так называемую некомфортную аудиторию – где вы ее нашли среди граждан, которые не умеют читать? Тем более заставили вспомнить о том, что в русском языке есть слово «немцы», и это люди, которые не умеют, якобы, говорить. Я понимаю, что есть интернациональный язык и случилось ему быть английским, поэтому не надо говорить о некомфортности аудитории. Лучше приспосабливаться к аудитории. Спасибо.

Татьяна Лялина: Будем стараться.

Виталий Власов: Спасибо, поблагодарим проект.

[аплодисменты]

 

партнеры

Аналитический центр при Правительстве РФВсероссийский конкурс «Открытые данные»Комитет по информатизации и связи Правительства Санкт-ПетербургаОбщероссийский гражданский форумПортал «Открытое правительство»РВКТеплица социальных технологийУниверситет ИТМО и QDФонд развития интернет-инициатив

Научный партнерЦентр исследований науки и технологий Европейского университета в Санкт-Петербурге

PR-партнер«Ньюсмейкер»

Информационные партнеры: Apptractor; Best TodayHack Day; iDeal MachineWorld Rating of Programmers«Ингрия»; «Инфометр»; «Красивый Петербург»«Открытые данные»; «Руссофт»«Среда»; Студия Кечинова; «Филантроп»

Услуги хостинга и дата-центра для хранения контента предоставляет компания Oyster Telecom; сервис-партнеры: Euromed Group; Git in Sky; Shishki Design, Бухгалтерский дом ТОБУ. Видеосъемка – Андрей Власов и Алексей Гантимуров, монтаж и фото – Алексей Гантимуров.

похожие мероприятия

<< К списку всех мероприятий

© ZERO B2B Communication © 2008-09
© Смольный институт © 2008-09