В то время как дизайнеры совершенствуют интерфейсы, программисты оттачивают сервисы и инфраструктуру, а профессиональные и непрофессиональные авторы заполняют своим контентом СМИ, блоги, социальные сети и конференции, груз предыдущих нерешенных проблем продолжает накапливаться.
Много писалось по поводу того, что Web 2.0 не оправдал возложенных на него надежд и не привнес ничего нового, лишь подняв старые потрепанные идеи на новый технологический уровень. Но почему-то никто не говорит о том, каким должен быть настоящий, исконный Web 2.0. Это при том, что, в принципе, начала ему были положены еще пять лет назад, но по каким-то обстоятельствам индустрия решила пойти очевидно более простым путем. Рискну изложить свою точку зрения, отделив интеллектуальные зерна от технологических плевел.
В то время как дизайнеры совершенствуют интерфейсы, программисты оттачивают сервисы и инфраструктуру, а профессиональные и непрофессиональные авторы заполняют своим контентом СМИ, блоги, социальные сети и конференции, груз предыдущих нерешенных проблем продолжает накапливаться. И главной проблемой, конечно же, является систематизация всей той информации, объемы которой с каждым днем становятся больше. Как из бесчисленного множества разрозненной информации разного качества создать то, что будет действительно полезно и интересно пользователю с его индивидуальными особенностями, как то уровень интеллектуального развития, интересы, географическое положение, материальные возможности, и т.д.?
В свое время Тим Бернерс Ли сокрушался по поводу отсутствия нормальных механизмов взаимодействия поставщиков информации, приводя следующий пример: предположим, вы зашли на страницу с описанием важной для вас встречи. Страница содержит дату, время, место встречи и ссылки на сопутствующие документы, включая домашние страницы ее участников. Вы решаете принять участие, и жмете кнопку «Зарегистрироваться». В этот момент вы хотели бы, чтобы в вашем календаре автоматически появилась соответствующая запись со ссылкой на страницу с деталями встречи, а ваш мобильный телефон загрузил информацию о месте ее проведения, и как туда легче добраться. Вы так же хотите, чтобы в вашей адресной книге, по крайней мере, до тех пор, пока встреча не закончится, хранились контактные данные всех ее участников. И последнее: все это должно произойти с помощью всего одного клика мыши.
Несмотря на то, что это было произнесено почти 3 года назад, Web с тех пор почти никак не продвинулся в этом направлении. Даже имея всю нынешнюю россыпь красивых, функциональных, многообещающих интернет-приложений, вы все равно будете вынуждены затратить множество усилий, копируя, вставляя, отыскивая, опять копируя и вставляя всю информацию собственноручно.
Те самые пять лет назад WWW-консорциум выдвинул новую инициативу под названием Semantic Web, которая и была призвана решить эти проблемы. Для тех кто в танке, вкратце упомяну, что там предлагается создавать и использовать так называемые XML-схемы, стандартизирующие названия полей таблиц баз данных (и других систем хранения информации) для совместного экспорта/импорта данных разными (чаще, конечно, смежными) поставщиками товаров, услуг, автономных приложений и сервисов.
Единственное, что из вышесказанного воплотилось в нынешней инкарнации Web 2.0, это… экспорт новостной информации. Онлайновые и оффлайновые RSS-аггрегаторы — вот, по большому счету, все, чем пока ограничилось вхождение идей семантического веба в широкие массы. Плачевно.
Идем дальше. W3C не остановился на достигнутом и развил эту идею в нечто очень плотно приближающееся к теме искусственного интеллекта. Тут я постараюсь объяснить на понятном языке, как это выглядит в теории. Человеческий интеллект зиждется на ассоциативных связях. То есть, если вы, например, слышите слово «озеро», то у вас в голове (хотя вы этого можете не осознавать) возникают следующие ассоциации: водоем, закрытый, ограниченный со всех сторон. Далее, уже эти ассоциации по цепочке рождают ассоциации с водой и резервуаром в земной поверхности. Далее — жидкость, прозрачного цвета, глубина, объем [резервуара]. Вот так, по цепочке возникает понимание сути термина «озеро»: если бы вы не знали одну из фундаментальных его основ, например, что такое «вода», или, например, «ограниченный», у вас бы возникли известные трудности в его понимании. И глубина понимания вами того или иного термина напрямую зависит от количества известных вам составляющих его ассоциативной цепочки.
Проблема машинного интеллекта в этом месте уже должна быть вам очевидна: все те колоссальные объемы информации, которые способна предоставить нам Всемирная Сеть, никак не ассоциированы. Чтобы машины научились вникать в суть этой информации, ее, надо как-то связать. И W3C дал нам совершеннейший, на мой взгляд, инструмент: язык онтологий, или OWL Web Ontology Language, в основе которого лежит тот же самый XML. Вот упрощенный пример его использования (семантика и теги урезаны для наглядности иллюстраций, кто заинтересуется, отсылаю к оригиналу.
О, да, машина углубилась в своем понимании того, что есть озеро. Разве это не гениально? Ведь, имея широкую ассоциативную базу, компьютер пусть и не начнет мыслить самостоятельно, как нам демонстрируют фантасты и голливудские режиссеры, но хотя бы начнет понимать суть того, что мы ему ежесекундно скармливаем. И начать воплощать эти идеи, на мой взгляд, должны поисковики. Удобства переоценить будет практически невозможно — проиллюстрирую опять на примере с нашим озером. Создадим, выражаясь на языке объектно-ориентированного программирования (язык веб-онтологий тоже использует такую модель), экземпляр класса «озеро»:
Имея это в своей базе, наделенный интеллектом поисковик сможет самостоятельно, не отсылая пользователя к разрозненному набору документов, отвечать на вопросы, сформулированные обычным человеческим языком. Например: What is the depth of Titicaca? Или: List of all lakes in Peru. Или: Summarize areas of all lakes in Peru.
Это лишь один из множества примеров применения технологий интеллектуального интернета, которые были предложены его основателями еще пять лет назад. Почему до сих пор мы видим лишь мизерную часть всего этого богатства? Лень разработчиков? Скорее неосведомленность идеологов проектов. Хороших, компетентных идеологов от высоких технологий определенно мало, чего тут говорить, когда на пьедестал возводят таких, как владелец amilliondollarhomepage. Нет, паренек конечно молодец, но, на мой взгляд, тот, кто поведет интернет к разуму и разумным приложениям, заработает несоизмеримо больше. А что до того, что мы в данное время понимаем под «Web 2.0»… Да ради бога — оно никому не мешает, более того, он провозглашает много идей, достойных внимания и уважения. В конце концов, цифр для номеров следующих версий хватит наверняка.