Категории

Проза
- Проза
- Историческая проза
- Русская современная проза
- Советская классическая проза
- Повести
- Сентиментальная проза
- Зарубежная классика
- Рассказы
- Зарубежная современная проза
- Эпистолярная проза
- Афоризмы
- Очерки
- Разное
- Эссе
- Магический реализм
- Семейный роман/Семейная сага
- Феерия
- Антисоветская литература
- Новелла
- Русская классическая проза
- Современная проза
- О войне
- Контркультура
- Классическая проза
Любовные романы
- Любовные романы
- Исторические любовные романы
- Зарубежные любовные романы
- Эротика
- Слэш
- love
- Порно
- Роман
- Прочие любовные романы
- Фемслэш
- Остросюжетные любовные романы
- Современные любовные романы
- Короткие любовные романы
- Любовно-фантастические романы
Фантастика и фэнтези
- Социально-философская фантастика
- Социально-философская фантастика
- Социально-философская фантастика
- Детективная фантастика
- Киберпанк
- Попаданцы
- LitRPG
- Космоопера
- Технофэнтези
- Городская фантастика
- Русское фэнтези
- Юмористическая фантастика
- Космическая фантастика
- Разное фэнтези
- Городское фэнтези
- Стимпанк
- Мистика
- Боевое фэнтези
- Книги магов
- Разная фантастика
- Романтическая фантастика
- Эпическая фантастика
- Социально-философская фантастика
- Иностранное фэнтези
- Любовное фэнтези
- Сказочная фантастика
- Историческое фэнтези
- Зарубежная фантастика
- Романтическое фэнтези
- Историческая фантастика
- Ироническая фантастика
- Ироническое фэнтези
- Ужасы и Мистика
- Постапокалипсис
- Героическая фантастика
- Фэнтези
- Научная Фантастика
- Социально-психологическая
- Альтернативная история
- Боевая фантастика
Бизнес
- Личная эффективность
- О бизнесе популярно
- Малый бизнес
- Государственное и муниципальное управление
- Бизнес
- Личные финансы
- Менеджмент и кадры
- Экономика
- Управление, подбор персонала
- Банковское дело
- Ценные бумаги и инвестиции
- Корпоративная культура, бизнес
- Личная эффективность
- Поиск работы
- Интернет-бизнес
- Финансы
- Менеджмент
- Работа с клиентами
- Кадровый менеджмент
- Переговоры
- Краткое содержание
- Продажи
- Делопроизводство, офис
- Бухучет и аудит
- Тайм-менеджмент
- Зарубежная деловая литература
- Ораторское искусство / риторика
Справочная литература
- Энциклопедии
- Прочая справочная литература
- Словари
- Руководства
- Справочники
Приключения
- Путешествия и география
- Исторические приключения
- Прочие приключения
- Природа и животные
- Морские приключения
- Вестерн
- Приключения про индейцев
- Зарубежные приключения
Старинная литература
- Античная литература
- Зарубежная старинная литература
- Мифы. Легенды. Эпос
- Европейская старинная литература
- Древнерусская литература
- Древневосточная литература
- Фольклор
- Прочая старинная литература
Религия и духовность
- Религия: окультизм
- Бизнес
- Религия
- Эзотерика
- Прочая религиозная литература
- Самосовершенствование
- Православие
- Религия: христианство
- Религия: протестантизм
- Язычество, паганизм
- Буддизм
- Индуизм
- Зарубежная религиозная литература и эзотерика
- Религии: разное
- Религия: ислам
- Религия: иудаизм
Компьютеры и Интернет
- Прочая околокомпьтерная литература
- Программы
- Программное обеспечение
- Интернет
- Программирование
- Базы данных
- Компьютерное "железо"
Поэзия, Драматургия
- Драматургия
- Сценарии
- Драма
- Песенная поэзия
- Басни
- Киносценарии
- Кино, театр
- Зарубежная поэзия
- В стихах
- Бизнес
- Театр
- Лирика
- Трагедия
- Экспериментальная поэзия
- Верлибры
- Водевиль
- Мистерия
- Эпическая поэзия
- Поэзия
Детская литература
- Детская фантастика
- Детские остросюжетные
- Детские стихи
- Детские приключения
- Зарубежные детские книги
- Учебная литература
- Школьные учебники
- Детские детективы
- Внеклассное чтение
- Книги для дошкольников
- Детский фольклор
- Загадки
- Книги для подростков
- Детская познавательная и развивающая литература
- Прочая детская литература
- Сказка
- Детская проза
- Детская образовательная литература
Юмор
- Комедия
- Любовные романы
- Любовные романы
- Анекдоты
- Юмористическая проза
- Юмористическое фэнтези
- Юмористические стихи
- Драматургия
- Сатира
- Прочий юмор
Документальные книги
- Бизнес
- Бизнес
- Искусство и Дизайн
- Критика
- Публицистика
- Прочая документальная литература
- Военная документалистика
- Биографии и Мемуары
Научные и научно-популярные книги
- Шпаргалки
- Рефераты
- Экология
- Биофизика
- Культурология
- Юриспруденция
- Политика
- Языкознание
- Психотерапия
- Науки: разное
- Биология
- Медицина
- Научпоп
- Воспитание детей, педагогика
- Психология, личное
- Архитектура
- Образовательная литература
- Филология
- Физика
- Радиотехника
- География
- Деловая литература
- Детская психология
- Литературоведение
- Педагогика
- Альтернативная медицина
- Науки о космосе
- Ботаника
- Иностранные языки
- Государство и право
- Обществознание
- Беременность, ожидание детей
- Химия
- Учебники
- О животных
- Социология
- Математика
- Зарубежная психология
- Астрология
- Ветеринария
- География
- Зоология
- Биохимия
- Зарубежная публицистика
- История Европы
- Транспорт, военная техника
- Религиоведение
- История
- Техническая литература
- Прочая научная литература
- Психология
Разная литература
- Шахматы
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Готические новеллы
- Гиды, путеводители
- Фанфик
- Визуальные искусства
- Военное
- Цитаты из афоризмов
- Истории из жизни
- Кино
- Военная история
- Литература 19 века
- Культура и искусство
- Музыка, музыканты
- Великолепные истории
- Зарубежная образовательная литература
- Современная зарубежная литература
- Отраслевые издания
- Начинающие авторы
- Зарубежная прикладная литература
- Авто и ПДД
- Музыка, танцы
- Изобразительное искусство, фотография
- Спецслужбы
- Недвижимость
- Современная литература
- Боевые искусства
- Подростковая литература
- Шахматы
- Прочее
- Военная техника, оружие
- Газеты и журналы
- Периодические издания
Домоводство, Дом и семья
- Ремонт в квартире
- Здоровье
- Спорт
- Домашние животные
- Кулинария
- Прочее домоводство
- Сад и огород
- Развлечения
- Дом, семья
- Отдых / туризм
- Интерьеры
- Рыбалка
- Охота
- Семейная психология
- Эротика, Секс
- Сделай сам
- Хобби и ремесла
Бизнес
- Маркетинг, PR, реклама
Детективы и Триллеры
- Юридический триллер
- Исторический детектив
- Детектив
- Триллер
- Боевик
- Криминальный детектив
- Полицейский детектив
- Иронический детектив
- Крутой детектив
- Маньяки
- Иностранный детектив
- Политический детектив
- Зарубежные боевики
- Дамский детективный роман
- Классический детектив
- Шпионский детектив
Бизнес
- Торговля
- Тайм-менеджмент
Любовные романы
Биографии
Блог

Меню

Самые читаемые

Выжившая из Ходо. Эльфийский турнир - Ольга Дмитриева

Мессалина. Трагедия императрицы - Ирена Гарда

Правила карьеры. Все, что нужно для служебного роста - Ричард Темплар

Пилот штрафной эскадрильи - Юрий Корчевский

PochitayKnigi » Компьютеры и Интернет » Интернет » Профессиональный поиск в Интернете - Алексей Кутовенко

Профессиональный поиск в Интернете - Алексей Кутовенко

Читать онлайн Профессиональный поиск в Интернете - Алексей Кутовенко

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 10 11 12 13 14 15 16 17 18 ... 52

Перейти на страницу:

Поиск полнотекстовых электронных книг в настоящее время является достаточно хорошо разработанной областью вертикального поиска. Среди соответствующих разделов универсальных поисковиков безусловно лучшими являются проекты Google и Nigma. Система Google Книги хороша в первую очередь для фактографического поиска в текстах книг, поскольку в большинстве случаев демонстрирует только фрагменты книг. Поиск книг в проекте Nigma ориентирован на полнотекстовые книги, интересен он также параллельным поиском критических публикаций. Однако лучшим инструментом для поиска полных текстов электронных книг следует признать проект eBdb. Он хорошо работает с русскоязычными сетевыми библиотеками. Найденные книги доступны для скачивания без каких-либо ограничений. Максимум, что потребуется от пользователя для получения файла – регистрация в соответствующей сетевой библиотеке. Данный поисковик умеет работать как с прямыми запросами по названию конкретной книги, так и с более широкими запросами, позволяющими отследить публикации определенного автора или же собрать тематическую подборку литературы. Кроме этих базовых функций он обладает удобным набором дополнительных сервисов. Таким образом, данная машина может быть рекомендована всем пользователям, интересующимся электронными книгами.

При поиске программ первую остановку имеет смысл сделать на проекте SoftSearch. Хорошая работа с каталогами и собственная рейтинговая система способствуют повышению качества поиска. Неплохие результаты при поиске зарубежных программ можно получить с помощью системы Exefind. Поисковик Quweas во многом уступает конкурентам, однако отличается уникальной возможностью поиска программ для редких компьютерных платформ.

Глава 3

Метапоиск

Сам факт наличия множества индексных баз данных сетевых документов, причем собранных с использованием разных методов и алгоритмов, порождает экологическую нишу для целого класса метапоисковых систем. Такие системы не занимаются самостоятельным сбором информации, а отсылают запрос пользователя на несколько других поисковых серверов, объединяют результаты поиска, производят их дополнительную обработку и выдают обобщенный ответ. Это увеличивает широту охвата поиска за счет обработки данных различных индексных баз. Кроме того, метапоиск экономит время пользователя, которое иначе пришлось бы потратить на личное обращение ко всем нужным серверам. Такова схема работы полноценной метапоисковой системы. В то же время существует ряд сервисов, пренебрегающих собственным анализом полученных результатов. В предельном случае вы можете просто получить пару-тройку отдельных страниц с результатами разных поисковиков. Данный подход, в общем-то, тоже имеет право на существование, однако далее мы остановимся только на нескольких по-настоящему инновационных системах. Дело в том, что проблема обработки результатов метапоиска стоит даже более остро, чем в случае отдельного поисковика. Не удивительно, что на метапоисковиках можно увидеть немало интересных экспериментальных решений.

У всех ведущих современных интернет-поисковиков есть одна общая черта – они выдают результаты единым списком, отсортированным по релевантности ссылок. При всех своих достоинствах данная схема порождает для пользователей проблемы при большом количестве ссылок в списке выдачи Не секрет, что мало кто просматривает на поисковике больше одного-двух экранов результатов, на которых может так и не найтись требуемой информации. В то же время нужные данные в итоге могут оказаться на сайте, занимающем какую-нибудь 108-ю позицию в общем списке. Получается парадоксальная ситуация: информация в Сети есть, она найдена, однако останется навсегда скрытой для пользователя, если он не сможет грамотно уточнить запрос или составить сложное поисковое выражение.

Одним из ответов на данный вызов стала технология кластеризации результатов интернет-поиска. Ее преимущества по сравнению с аналогами – возможность сравнительно простой автоматизации процесса. Кластерные технологии не требуют какой-либо специфической разметки веб-страниц, как это принято в комплексе технологий «семантического веба». Они также не нуждаются в сравнительно трудоемкой предварительной подготовке массива веб-страниц, используемой в веб-каталогах. Цена этого преимущества – некоторый процент информационного шума, неизбежного при автоматической обработке результатов поиска в Сети.

Получив запрос, кластерный поисковик, как и обычная поисковая система, сначала находит в своей базе соответствующие запросу веб-страницы. Различия начинаются на этапе сортировки результатов. Система проводит анализ найденных страниц и находит на них дополнительные ключевые слова, встречающиеся вместе с терминами из поступившего от пользователя запроса. Получившиеся в результате такого анализа подмножества страниц называются кластерами и с большой вероятностью относятся к разным аспектам темы запроса. Далее в недрах поисковика происходит следующее важное событие – определение релевантности ссылок и их позиции в результатах. Кластерная машина проделывает эту операцию отдельно для каждого кластера. При этом ссылки со страниц одного кластера, то есть сайтов аналогичной или схожей тематики, ценятся выше, чем ссылки с посторонних, пусть даже очень популярных ресурсов. В результате позиция сайта в списке выдачи по кластеру является своеобразным отражением ее оценки коллегами по тематическому цеху, что работает на качество поиска. Кроме того, ранжирование ссылок по отдельным кластерам позволяет вывести на первые позиции в кластерах полезные, но не «раскрученные» ресурсы, которым в обычных поисковиках с выдачей результатов единым списком и бесконечными войнами оптимизаторов мало что светит.

Nigma

Российские разработчики поисковых систем не остаются в стороне от современных тенденций – разработка кластерной машины Nigma ведется исследовательской группой из МГУ им. М. В. Ломоносова в сотрудничестве со Стэнфордским университетом. Предварительная версия сервиса была запущена в начале 2005 года. Nigma опрашивает все крупные базы, содержащие документы на русском языке, в числе которых Google, Yahoo! AltaVista, MSN, Яндекс и Рамблер, что обеспечивает широкий охват источников. Кроме того, постепенно генерируется собственная индексная база Nigma.

Система Nigma позволяет увидеть сильные стороны метапоисков. Помогает в этом практическом эксперименте правильная настройка механизма поиска Nigma. Прямо под строкой ввода запроса находится несколько выпадающих меню, среди которых есть меню. Поисковики. Именно оно дает пользователям возможность управлять подбором поисковиков, на которые отправляются запросы. Если выбрать только какой-нибудь один поисковик, то, по сути, с ним можно поработать в интерфейсе, построенном на кластерах. Попробуйте убрать из этого списка свой любимый универсальный поисковик – в результате полученный по запросу список выдачи наглядно продемонстрирует, сколько веб-страниц вы теряете, работая только с одной индексной базой.

Приятно отметить тот факт, что разработчики Nigma не пошли по соблазнительному для многих пути создания «кальки» уже существующего ресурса, а сделали ставку на инновации. Сильной стороной Nigma является тщательный учет специфики русскоязычных запросов.

Это проявляется в собственном алгоритме кластеризации результатов, а также в поиске по различным морфологическим формам, синонимам слов из запроса пользователя и обобщенным понятиям. Интересная особенность системы заключается в том, что поисковикам отправляются запросы не только по точно заданному пользователем слову, но и по его автоматически сгенерированным словоформам. Это существенно увеличивает количество найденных страниц. Такой режим поиска запускается, если по исходной словоформе обнаруживается слишком мало документов. Работа этого механизма видна в служебной информации о найденной ссылке на странице выдачи Если документ был найден без морфологического преобразования запроса, то рядом с ним будут просто указаны использованный поисковик и рейтинг страницы. Если же была найдена сгенерированная словоформа, то после названия поисковика появится буква «М».

Особого упоминания заслуживает мощная система исправления орфографических ошибок и опечаток в запросах Nigma умеет исправлять прямо-таки клинические случаи: до четырех ошибок в слове, набранном в неправильной раскладке, причем предлагаемые варианты сортируются на основе близости к звучанию исправляемого слова. Кроме того, в систему встроен собственный словарь компьютерных терминов – полагаем, не надо рассказывать, сколько может быть вариантов написания у многих заимствованных слов из данной предметной области и какие проблемы из-за этого возникают при поиске в Сети на русском языке.

1 ... 10 11 12 13 14 15 16 17 18 ... 52

Перейти на страницу:

Тут вы можете бесплатно читать книгу Профессиональный поиск в Интернете - Алексей Кутовенко.

Пожаловаться на ошибку