Книга посвящена современным подходам к получению новых знаний на основе анализа информационного пространства сети Internet и методам обработки информационных потоков с целью выявления значимых тенденций, понятий, феноменов, их взаимосвязей. Анализируются
проблемы и феномены Internet, топология Web-пространства, методы доступа к информации в "скрытом" Web, рассматриваются особенности различных информационно-поисковых систем и средства интеграции Web-контента на основе XML. Большое внимание в книге уделено новому
направлению обработки текстовой информации — "глубинному анализу текстов" (Text Mining), объединяющему в себе технологические и методологические подходы контент-анализа, компьютерной лингвистики и искусственного интеллекта.
Книга ориентирована на широкий круг читателей, интересующихся современными информационными технологиями. При этом она будет полезна и аналитикам, которые с помощью инструментов Text Mining смогут повысить эффективность и качество своей работы.
272 стр., с ил.; ISBN 5-8459-0764-0; формат 70x100/16; мягкий переплет; серия Профессиональная работа; 2005, 1 кв.; Диалектика.
ПРЕДИСЛОВИЕ 10
ВВЕДЕНИЕ 12
ГЛАВА 1. NEW MEDIA 15
ГЛАВА 2. ПОИСК В INTERNET 43
ГЛАВА 3. СИСТЕМЫ ИНТЕГРАЦИИ INTERNET-КОНТЕНТА 87
ГЛАВА 4. XML - ЯЗЫК РАЗМЕТКИ И МОДЕЛЬ ДАННЫХ 141
ГЛАВА 5. ОСНОВЫ ТЕХНОЛОГИИ TEXT MINING 159
ГЛАВА 6. ИНСТРУМЕНТАРИЙ КОНКУРЕНТНОЙ РАЗВЕДКИ 217
ГЛАВА 7. ЗАКОНОМЕРНОСТИ, ПРИСУЩИЕ ИНФОРМАЦИОННЫМ СИСТЕМАМ 231
ГЛОССАРИЙ 252
ЛИТЕРАТУРА 262
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 266