О сервисе WebGround
Новости сайта
ЛАНДЭ Дмитрий Владимирович,
СНАРСКИЙ Андрей Александрович,
БЕЗСУДНОВ Игорь Васильевич
ИНТЕРНЕТИКА
Навигация в сложных сетях: модели и алгоритмы
Москва-2009
купить книгу
СОДЕРЖАНИЕ
ПРЕДИСЛОВИЕ.. 7
ВВЕДЕНИЕ.. 10
1. СОВРЕМЕННЫЕ ИНФОРМАЦИОННыЕ сети.. 13
1.1. Интернет – история и протоколы.. 13
1.2. Всемирная паутина - World Wide Web. 16
1.3. Пиринговые сети. 22
1.4. Проблемы развития интернет-контента. 28
2. ИНФОРМАЦИОННый ПОИСК.. 29
2.1. Булева модель поиска. 32
2.1.1. Классическая булева модель. 32
2.1.2. Расширенная булева модель. 35
2.1.3. Модель нечеткого поиска. 38
2.2. Векторно-пространственная модель поиска. 41
2.3. Вероятностная модель поиска. 44
2.4. Алгоритмы поиска в пиринговых сетях. 50
2.4.1. Алгоритм поиска ресурсов по ключам.. 50
2.4.2. Метод широкого первичного поиска. 51
2.4.3. Метод случайного широкого первичного поиска. 52
2.4.4. Интеллектуальный поисковый механизм.. 53
2.4.5. Методы «большинства результатов по прошлой эвристике». 55
2.4.6. Метод «случайных блужданий». 56
2.5. Информационно-поисковые языки. 57
2.6. Характеристики информационного поиска. 59
3. Концепция Text Mining.. 64
3.1. Контент-анализ. 65
3.2. Элементы Text Mining. 66
3.2.1. Извлечение понятий. 67
3.2.2. Определение взаимосвязей понятий. 69
3.2.3. Автоматическое реферирование. 72
3.2.4. Поисковые образы документов. 75
3.2.5. Выявление дублирования информации. 76
3.2.6. Выявление новых событий. 80
3.3. Реализации систем с элементами Text Mining. 83
4. МЕТОДЫ КЛАССИФИКАЦИИ ИНФОРМАЦИИ.. 85
4.1. Задача классификации. 85
4.1.1. Формальное описание задачи классификации. 86
4.1.2. Ранжирование и четкая классификация. 87
4.1.3. Линейная классификация. 88
4.2. Метод Rocchio. 88
4.3. Метод регрессии. 89
4.4. ДНФ-классификатор. 90
4.5. Классификация на основе искусственных нейронных сетей. 91
4.5.1. Формальный нейрон. 92
4.5.2. Искусственная нейронная сеть. 93
4.5.3. Правила обучения перцептрона. 96
4.5.4. Нейронная сеть как классификатор. 96
4.6. Байесовский классификатор. 97
4.6.1. Байесовская логистическая регрессия. 97
4.6.2. Наивная байесовская модель. 97
4.6.3. Байесовский подход к решению проблемы спама. 99
4.6.4. Определение тональности сообщений. 100
4.7. Метод опорных векторов. 103
4.8. Оценка качества классификации. 110
5. ЭЛЕМЕНТЫ КЛАСТЕРНОГО АНАЛИЗА.. 112
5.1. Латентно-семантический анализ. 114
5.1.1. Матричный латентно-семантический анализ. 114
5.1.2. Вероятностный латентно-семантический анализ. 117
5.2. Метод k-means. 119
5.3. Иерархическое группирование-объединение. 121
5.4. Метод суффиксных деревьев. 121
5.5. Гибридные методы.. 125
5.6. Ранжирование результатов поиска. 128
5.6.1. Алгоритм HITS. 129
5.6.2. Алгоритм PageRank. 132
5.6.3. Алгоритм Salsa. 134
5.6.4. Ранжирование «по Хиршу». 137
6. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ И МАТЕМАТИЧЕСКИЙ ФОРМАЛИЗМ... 138
6.1. Эмпирические закономерности. 138
6.1.1. Распределение Парето. 138
6.1.2. Законы Ципфа. 141
6.1.3. Закономерность Бредфорда. 145
6.1.4. Закон Хипса. 145
6.2. Степенные распределения случайных величин. 146
6.3. Однородные функции и скейлинг. 149
6.4. Параметр порядка и фазовые переходы. 152
7. ЭНТРОПИЯ И КОЛИЧЕСТВО ИНФОРМАЦИИ.. 157
7.1. Энтропия Шеннона. 160
7.2. Свойства энтропии. 163
7.3. Условная энтропия. 164
7.4. Энтропия непрерывного источника информации. 166
7.5. Количество информации. 168
7.6. Взаимная информация. 169
8. ОСНОВЫ ТЕОРИИ СЛОЖНЫХ СЕТЕЙ.. 171
8.1. Параметры сложных сетей. 172
8.1.1. Параметры узлов сети. 172
8.1.2. Общие параметры сети. 172
8.1.3. Распределение степеней узлов. 173
8.1.4. Путь между узлами. 173
8.1.5. Коэффициент кластерности. 175
8.1.6. Посредничество. 176
8.1.7. Эластичность сети. 177
8.1.8. Структура сообщества. 177
8.2. Модель слабых связей. 178
8.3. Модель малых миров. 179
8.4. WWW как сложная сеть. 182
8.4.1. Топология WWW... 182
8.4.2. Сетевая структура новостного веб. 185
8.5. Визуализация сложных сетей. 189
9. Элементы теории перколяции.. 191
9.1. Задача теории перколяции. 191
9.2. Характеристики перколяционных сетей. 193
9.3. Сеть с экспоненциально широким распределением.. 198
9.4. Диодные перколяционные сети. 200
9.5. Перколяция на случайных сетях. 203
9.6. Теория перколяции и моделирование атак на сети. 206
10. МОДЕЛИ ИНФОРМАЦИОННЫХ ПОТОКОВ.. 208
10.1. Линейная модель. 208
10.2. Экспоненциальная модель. 209
10.3. Логистическая модель. 210
10.4. Модель диффузии информации. 217
10.5. Модель самоорганизованной критичности. 226
11. Элементы фрактального анализа.. 235
11.1. Фракталы и фрактальная размерность. 235
11.2. Абстрактные фракталы.. 238
11.3. Информационное пространство и фракталы.. 243
11.4. Фракталы и временные ряды.. 247
11.4.1. Метод DFA.. 248
11.4.2. Корреляциионный анализ. 249
11.4.3. Фактор Фано. 254
11.4.4. Показатель Херста. 255
11.5. Мультифрактальный анализ рядов измерений. 257
Заключение.. 268
Список сокращений.. 274
Глоссарий.. 277
Литература.. 288