О сервисе WebGround

Ваша тема


Новости сайта

Литература

обложка книгиИнтернетика. Навигация в сложных сетях: модели и алгоритмы
Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистикаАвтоматическая обработка текстов на естественном языке и компьютерная лингвистика (pdf)
Ягунова Е.В., Макарова О.Е., Антонова А.Ю., Соловьев А.Н. Разные методы компрессии в исследовании понимания новостного текстаРазные методы компрессии в исследовании понимания новостного текста (pdf)
Крылова И.В, Пивоварова Л.М., Савина А.В., Ягунова Е.В. Исследование новостных сегментов российской «снежной революции»: вычислительный эксперимент и интуиция лингвистовИсследование новостных сегментов российской «снежной революции»: вычислительный эксперимент и интуиция лингвистов (pdf)
Ягунова Е.В. Исследование перцептивной устойчивости фонем как элементов речевой цепиИсследование перцептивной устойчивости фонем как элементов речевой цепи (pdf)
Ягунова Е.В. Вариативность структуры нарратива и разнообразие стратегий пониманияВариативность структуры нарратива и разнообразие стратегий понимания (pdf)
Ягунова Е.В., Пивоварова Л.М. Экспериментально-вычислительные исследования художественной прозы Н.В. ГоголяЭкспериментально-вычислительные исследования художественной прозы Н.В. Гоголя (pdf)
Ягунова Е.В. Вариативность стратегий восприятия звучащего текстаВариативность стратегий восприятия звучащего текста (pdf)
Ягунова Е.В. Спонтанный нарратив у детей и у взрослыхСпонтанный нарратив у детей и у взрослых (pdf)
Ягунова Е.В. Исследование избыточности русского звучащего текстаИсследование избыточности русского звучащего текста (pdf)
Ягунова Е.В. Фонетические признаки опорных сегментов и восприятие русского текстаФонетические признаки опорных сегментов и восприятие русского текста (pdf)
Ягунова Е.В. Коммуникативная и смысловая структура текста и его восприятиеКоммуникативная и смысловая структура текста и его восприятие (pdf)
Ягунова Е.В. Где скрывается смысл бессмысленного текста?Где скрывается смысл бессмысленного текста? (pdf)
Ягунова Е.В. Эксперимент в психолингвистике: Конспекты лекций и методические рекомендацииЭксперимент в психолингвистике: Конспекты лекций и методические рекомендации (pdf)
Ягунова Е.В. Теория речевой коммуникацииТеория речевой коммуникации (pdf)
Антонова А.Ю., Клышинский Э.С., Ягунова Е.В. Определение стилевых и жанровых характеристик коллекций текстов на основе частеречной сочетаемостиОпределение стилевых и жанровых характеристик коллекций текстов на основе частеречной сочетаемости (pdf)
Ягунова Е.В. Эксперимент и вычисления в анализе ключевых слов художественного текстаЭксперимент и вычисления в анализе ключевых слов художественного текста (pdf)
Ягунова Е.В. Ключевые слова в исследовании текстов Н.В. ГоголяКлючевые слова в исследовании текстов Н.В. Гоголя (pdf)
Пивоварова Л.М., Ягунова Е.В. Информационная структура научного текста. Текст в контексте коллекцииИнформационная структура научного текста. Текст в контексте коллекции (pdf)
Савина А.Н., Ягунова Е.В. Исследование коллокаций с помощью экспериментов с информантамиИсследование коллокаций с помощью экспериментов с информантами (pdf)
Ягунова Е.В., Пивоварова Л.М. От коллокаций к конструкциямОт коллокаций к конструкциям (pdf)
Пивоварова Л.М., Ягунова Е.В. Извлечение и классификация терминологических коллокаций на материале лингвистических научных текстовИзвлечение и классификация терминологических коллокаций на материале лингвистических научных текстов (pdf)
Julia Kiseleva. Grouping Web Users based on Query LogGrouping Web Users based on Query Log (pdf)
Julia_Kiseleva_Unsupervised_Query_Segmentation_Using_Click_Data_and_Dictionaries_Information.pdfUnsupervised Query Segmentation Using Click Data and Dictionaries Information (pdf)
Четыре лекции о методе
Начала предметного анализа методов (на примере метода Ф.Бэкона)
Вариативность стратегий восприятия звучащего текста
Извлечение и классификация коллокаций на материале научных текстов. Предварительные наблюдения
Природа коллокаций в русском языке. Опыт автоматического извлечения и классификации на материале новостных текстов
Войтишек А. Повторы. Лирические рефреныПовторы. Лирические рефрены (pdf)
Войтишек А. Новое. Лирические рефреныНовое. Лирические рефрены (pdf)
Войтишек А. Всё об одном и том жеВсё об одном и том же. 500 лирических рефренов к 50-летию (pdf)
Войтишек А. Тысяча-часть-1Тысяча-часть-1 (pdf)
Войтишек А. Тысяча-часть-2Тысяча-часть-2 (pdf)
Войтишек А. АлфавитАлфавит (pdf)

Заключение

 

Сегодня развитие сетевых информационных ресурсов соответствует закономерности Мура, которая в начале была сформулирована  как прогноз развития технологии микросхем, но сегодня все шире вторгается во все сферы жизни. В 1965 году Гордон Мур дал прогноз, что плотность транзисторов в интегральных схемах и, соответственно, производительность микропроцессоров будут удваиваться каждый год. На протяжении трех последних десятилетий этот прогноз, названный «законом Мура», более или менее выполнялся, хотя довольно быстро был скорректирован - удвоение должно происходить каждые два года [26].

        

Гордон Мур

 

В настоящее время прогноз Мура распространяется на все большее количество областей. Сегодняшнее расширение Интернет, стремительный рост объемов данных в Сети, развитие электронной коммерции и беспроволочной связи, а также внедрение цифровых технологий в бытовую технику, можно рассматривать как следствия этого закона. Было замечено, что рост документальной информации, целиком подчиняясь закону Мура, также носит экспоненциальный характер (рис. 82), а именно кривая роста числа документов может быть описана уравнениям вида  где  количество документов,  время,  количество документов в момент начала отсчета,  коэффициент.

Развитие коммуникационных возможностей приводит к росту количества доступной информации, в частности, в Интернет. С другой стороны, увеличение объемов доступного контента способствует росту инновационной деятельности. Все больше знаний, необходимых для исследовательских работ, публикуется в Сети, тем самым способствуя технологическому прогрессу, на котором основывается прогноз Мура.

Предполагается, что новый уровень развития сетевого информационного пространства будет определяться технологиями работы с огромным объемом информации, накопившимся в Интернет.

Рис. 82.  Динамика роста количества веб-серверов Сети

 (по данным службы Netcraft за апрель 2008 года)

                    

Информация, размещенная в компьютерных сетях, образует крупнейший распределенный информационный ресурс благодаря нескольким изначльно заложенным принципам, к которым, в частности, относится реализация гипертекста, позволяющего интегрировать неоднородные информационные ресурсы, естественную, адаптированную к человеческой логике  систему навигации.

Вместе с тем возможности доступа к информации в WWW всегда ограничивались статичностью языка HTML, что обуславливало преимущественно навигационный доступ к документам, практическое отсутствие поддержки метаинформации, несовершенство идентификации информационных ресурсов, и, самое главное, тот факт, что разметка HTML относилась только к внешнему представлению документов, не касаясь их семантики.

По мере развития WWW его возможности расширялись, эволюционно были добавлены динамические компоненты, возможность управлять стилевыми решениями, были разработаны и некоторые принципы представления контента, зафиксированные как стандарты.

Наряду с этим традиционному WWW все же присущи такие недостатки, как высокий уровень информационного шума, невозможность гарантирования целостности документов, отсутствие возможности смыслового поиска, ограниченность доступа к «скрытому» веб. Над решением названных проблем работают многочисленные коллективы во всем мире, в частности, консорциум W3C, где под руководством основателя WWW Тима Бернерса-Ли разрабатывается концепция Семантического веб [74]. Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и эффективная автоматическая обработка программами разных производителей. Путем таких радикальных преобразований  предполагается превращение WWW в систему семантического уровня. По замыслу создателей Семантический веб должен обеспечить "понимание" информации компьютерами, выделение ими наиболее подходящих по тем или иным критериям данных, и уже после этого - предоставление информации пользователям [114].

Семантический веб будет представлять собой расширение существующей сети WWW, в котором информация будет представляться в соответствии со смысловым значением, что повысит уровень согласованности при взаимодействии людей и компьютерной сети. Это будет достигаться за счет объединения разнообразных видов информации в единую структуру, где каждому смысловому элементу данных будет соответствовать специальный синтаксический блок (тег). Теги будут образовывать единую иерархическую структуру.

Berners-Lee1

Тим Бернерс-Ли

 

В рамках  Семантического веб разрабатываются языки для выражения информации в форме, доступной для машинной обработки, на которых можно будет описывать как данные, так и принципы трактования этих данных. Предполагается, что правила выводов, существующие в какой-либо одной системе представления знаний, будут доступны другим  системам.

Сегодня  очевидно, что центральную роль в представлении и обмене данными в Семантическом веб будет играть Расширяемый Язык Разметки (XML). Предполагается также использование нового принципа идентификации информационных ресурсов, формирование новой архитектуры веб-пространства на основе многоуровневого представления информационных ресурсов и стандартизированных веб-сервисов. 

В процессе развития концепции Семантического веб получили широкое развитие  синтаксические методы представления информации языковыми средствами XML и его дополнений, предназначенных для описания типичных свойств элементов XML-документов, их структуры и семантики: рекомендации W3C,  регламентирующие  DTD, XML Schema, XQuery (язык запросов к базам XML-данных) и т.д. К языкам представления данных относятся также средства описания ресурсов RDF.

  Отдельная область Семантического веб названа онтологическим подходом. Этот подход включает средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - веб-сервисы и агенты при обработке сложных запросов пользователей. Модели предметных областей в терминологии Семантического веб называются онтологиями. В 2004 г. консорциумом  W3C была  утверждена и опубликована спецификация  языка сетевых онтологий OWL (Web Ontology Language). Язык онтологий OWL выступает решающим компонентом интеллектуализации, базой для построения семантических сетей. При этом сами онтологии образуют систему, состоящую из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология определяет семантику конкретной предметной области и способствует установлению связей между значениями ее элементов.

         Итак, в Семантическом вебе используются три ключевых языка:

-         XML,  позволяющий определить синтаксис и структуру документов;

-         механизм описания ресурсов RDF, обеспечивающий модель кодирования для значений понятий;

-         язык онтологий OWL, позволяющий определять понятия и отношения между ними.

  Если говорить о логических уровнях, на которых базируется технология Семантического веб (рис. 81), то самый нижний уровень - это Universal Resource Identifier (URI), унифицированный идентификатор, определяющий способ записи адреса произвольного ресурса.

Семантический веб, именуя всякое понятие просто с помощью URI-идентификатора, дает возможность каждому выражать те понятия, которыми он пользуется. Типичными примерами URI-идентификаторов являются URL-адреса, однако URI-идентификатор задавая или ссылаясь на некоторый ресурс, не обязательно при этом указывает на его местонахождение в Интернет.

В рамках Семантического веб особая роль отводится электронным агентам – программам, которые для достижения поставленных перед ними целей работают без непосредственного управления со стороны человека. Предполагается, что эффективность программных агентов в Семантическом веб будет расти по мере увеличения количества доступного им веб-контента и автоматизированных сервисов.

 

Рис. 81.  Архитектура Семантического веб

 

Перспективы эффективного охвата информационного пространства будут зависеть как от создания и развития эффективной сетевой инфраструктуры, так и  развития теоретических основ информатики. В этой связи одной из актуальнейших задач, стоящих перед исследователями различных специальностей, является построение адекватных моделей сетевого информационного пространства и информационного поиска,  которые базируются  на достижениях в областях лингвистики и информатики, строгом математическом инструментарии.

Успешное продвижение в изучении современного информационного пространства невозможно без общих представлений о структуре и свойствах динамики сетевых информационных процессов, что в свою очередь требует выявления и учета их устойчивых закономерностей в рамках нового научного направления – «Интернетики».