Ландэ Дмитрий Владимирович,
Снарский Андрей Александрович,
Безсуднов Игорь Васильевич
ИНТЕРНЕТИКА
Навигация в сложных
сетях: модели и алгоритмы
Москва-2009

купить книгу
СОДЕРЖАНИЕ
ПРЕДИСЛОВИЕ 7
ВВЕДЕНИЕ 10
1. СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ СЕТИ 13
1.1. Интернет – история и протоколы 13
1.2. Всемирная паутина - World Wide Web 16
1.3. Пиринговые сети 22
1.4. Проблемы развития интернет-контента 28
2. ИНФОРМАЦИОННЫЙ ПОИСК 29
2.1. Булева модель поиска 32
2.1.1. Классическая булева модель 32
2.1.2. Расширенная булева модель 35
2.1.3. Модель нечеткого поиска 38
2.2. Векторно-пространственная модель поиска 41
2.3. Вероятностная модель поиска 44
2.4. Алгоритмы поиска в пиринговых сетях 50
2.4.1. Алгоритм поиска ресурсов по ключам 50
2.4.2. Метод широкого первичного поиска 51
2.4.3. Метод случайного широкого первичного поиска 52
2.4.4. Интеллектуальный поисковый механизм 53
2.4.5. Методы «большинства результатов по прошлой эвристике» 55
2.4.6. Метод «случайных блужданий» 56
2.5. Информационно-поисковые языки 57
2.6. Характеристики информационного поиска 59
3. КОНЦЕПЦИЯ TEXT MINING 64
3.1. Контент-анализ 65
3.2. Элементы Text Mining 66
3.2.1. Извлечение понятий 67
3.2.2. Определение взаимосвязей понятий 69
3.2.3. Автоматическое реферирование 72
3.2.4. Поисковые образы документов 75
3.2.5. Выявление дублирования информации 76
3.2.6. Выявление новых событий 80
3.3. Реализации систем с элементами Text Mining 83
4. МЕТОДЫ КЛАССИФИКАЦИИ ИНФОРМАЦИИ 85
4.1. Задача классификации 85
4.1.1. Формальное описание задачи классификации 86
4.1.2. Ранжирование и четкая классификация 87
4.1.3. Линейная классификация 88
4.2. Метод Rocchio 88
4.3. Метод регрессии 89
4.4. ДНФ-классификатор 90
4.5. Классификация на основе искусственных нейронных сетей 91
4.5.1. Формальный нейрон 92
4.5.2. Искусственная нейронная сеть 93
4.5.3. Правила обучения перцептрона 96
4.5.4. Нейронная сеть как классификатор 96
4.6. Байесовский классификатор 97
4.6.1. Байесовская логистическая регрессия 97
4.6.2. Наивная байесовская модель 97
4.6.3. Байесовский подход к решению проблемы спама 99
4.6.4. Определение тональности сообщений 100
4.7. Метод опорных векторов 103
4.8. Оценка качества классификации 110
5. ЭЛЕМЕНТЫ КЛАСТЕРНОГО АНАЛИЗА 112
5.1. Латентно-семантический анализ 114
5.1.1. Матричный латентно-семантический анализ 114
5.1.2. Вероятностный латентно-семантический анализ 117
5.2. Метод k-means 119
5.3. Иерархическое группирование-объединение 121
5.4. Метод суффиксных деревьев 121
5.5. Гибридные методы 125
5.6. Ранжирование результатов поиска 128
5.6.1. Алгоритм HITS 129
5.6.2. Алгоритм PageRank 132
5.6.3. Алгоритм Salsa 134
5.6.4. Ранжирование «по Хиршу» 137
6. ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ И МАТЕМАТИЧЕСКИЙ ФОРМАЛИЗМ 138
6.1. Эмпирические закономерности 138
6.1.1. Распределение Парето 138
6.1.2. Законы Ципфа 141
6.1.3. Закономерность Бредфорда 145
6.1.4. Закон Хипса 145
6.2. Степенные распределения случайных величин 146
6.3. Однородные функции и скейлинг 149
7. ЭНТРОПИЯ И КОЛИЧЕСТВО ИНФОРМАЦИИ 157
7.1. Энтропия Шеннона 160
7.2. Свойства энтропии 163
7.3. Условная энтропия 164
7.4. Энтропия непрерывного источника информации 166
7.5. Количество информации 168
7.6. Взаимная информация 169
8. ОСНОВЫ ТЕОРИИ СЛОЖНЫХ СЕТЕЙ 171
8.1. Параметры сложных сетей 172
8.1.1. Параметры узлов сети 172
8.1.2. Общие параметры сети 172
8.1.3. Распределение степеней узлов 173
8.1.4. Путь между узлами 173
8.1.5. Коэффициент кластерности 175
8.1.6. Посредничество 176
8.1.7. Эластичность сети 177
8.1.8. Структура сообщества 177
8.2. Модель слабых связей 178
8.3. Модель малых миров 179
8.4. WWW как сложная сеть 182
8.4.1. Топология WWW 182
8.4.2. Сетевая структура новостного веба 185
8.5. Визуализация сложных сетей 189
9. ЭЛЕМЕНТЫ ТЕОРИИ ПЕРКОЛЯЦИИ 191
9.1. Задача теории перколяции 191
9.2. Характеристики перколяционных сетей 193
9.3. Сеть с экспоненциально широким распределением 198
9.4. Диодные перколяционные сети 200
9.5. Перколяция на случайных сетях 203
9.6. Теория перколяции и моделирование атак на сети 206
10. МОДЕЛИ ИНФОРМАЦИОННЫХ ПОТОКОВ 208
10.1. Линейная модель 208
10.2. Экспоненциальная модель 209
10.3. Логистическая модель 210
10.4. Модель диффузии информации 217
10.5. Модель самоорганизованной критичности 226
11. ЭЛЕМЕНТЫ ФРАКТАЛЬНОГО АНАЛИЗА 235
11.1. Фракталы и фрактальная размерность 235
11.2. Абстрактные фракталы 238
11.3. Информационное пространство и фракталы 243
11.4. Фракталы и временные ряды 247
11.4.1. Метод DFA 248
11.4.2. Корреляциионный анализ 249
11.4.3. Фактор Фано 254
11.4.4. Показатель Херста 255
11.5. Мультифрактальный анализ рядов измерений 257
ЗАКЛЮЧЕНИЕ 268
СПИСОК СОКРАЩЕНИЙ 274
ГЛОССАРИЙ 277
ЛИТЕРАТУРА 288
|