Система связанных слов или фраз позволяющая легко перемещать по страницам

Обновлено: 04.11.2024

В настоящее время существует множество справочных служб Интернет , помогающих пользователям найти нужную информацию. В таких службах используется обычный принцип поиска в неструктурированных документах– по ключевым словам.

Поисковая система– это комплекс программ и мощных компьютеров, способные принимать, анализировать и обслуживать запросы пользователей по поиску информации в Интернет.

ПС бывают 2 видов:

Тематические каталоги Автоматические индексы

Тематические каталоги: создаются специалистами, которые занимаются классификацией и анализам информации, создавая базы данных.

Автоматические индексы: составляются специальной программой, работа которой выбирает на Web страницах гиперссылки и помещает их в базу данных с указанием URL адреса.

Служба World Wide Web ( WWW )– это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов.

Отдельные документы, составляющие пространство Web , называют Web-страницами .

Группы тематически объединенных Web-страниц называют Web-узлами (сайтами).

Программы для просмотра Web-страниц называют браузерами (обозревателями).

К средствам поисковых систем относится язык запросов.

Используя различные приёмы можно добиться желаемого результата поиска.

! – запрет перебора всех словоформ.

+ – обязательное присутствие слов в найденных документах.

- – исключение слова из результатов поиска.

& – обязательное вхождение слов в одно предложение.

– требование присутствия первого слова в предложении без присутствия второго.

| – поиск любого из данных слов.

«» – поиск устойчивых словосочетаний.

$ title (в переводе название) – поиск информации по названиям заголовков.

$ anchor – поиск информации по названию ссылок.

Поиск информации: основные понятия, виды и формы организации

Поиск информации или информационный поиск представляет один из основных информационных процессов, цели, возможности и характер которого всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.

Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве.

Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению нужных сведений, знаний и т.д.

" Поисковые системы " осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова.

Информационно-поисковые системы

ПС с большим набором функций и возможностей которые входят в состав СУБД называются информационно-поисковыми системами . Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Интернете.

" Информационно-поисковая система " представляет систему, предназначенную для поиска и хранения информации; пакет программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных.

Информационный поиск подразумевает использование определённых стратегий, методов, механизмов и средств.

Стратегия поиска - общий план (концепция, предпочтение) который определяет достижение компромисса между практическими потребностями и возможностями имеющихся средств.

Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов.

Поисковый образ запроса - записанный на ИПЯ(информационно-поисковых языков) текст, выражающий смысловое содержание, необходимые для наиболее эффективного осуществления информационного поиска.

Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на поисковый запрос.

Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту

Процесс поиска можно представить в виде следующих основных компонент:

1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;
2) проведение поиска в одной или нескольких поисковых системах;
3) обзор полученных результатов (ссылок);
4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных данных;
5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

Комбинация условия поиска.

Этапы организации поиска:

Определение области знаний;

Выбор типа и источников данных;

Сбор материалов необходимых для наполнения информационной модели;

Отбор наиболее полезной информации;

Выбор метода обработки информации (классификация, кластеризация, регрессионный анализ и т.д.);

Выбор алгоритма поиска;

Поиск закономерностей, формальных правил и связей в собранной информации;

Творческая интерпретация полученных результатов;

Интеграция извлеченных "знаний".

Для проведения поиска первоначально на компьютере пользователя загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД.

Методы обработки результатов поиска

По характеру преобразований методы обработки результатов поиска можно условно разделить на две группы:
1. Структурно-форматные преобразования;
2. Структурно-семантические преобразования (информационно-аналитические, логико-семантические).

Читайте также: