Полнотекстовый поиск документов
Каждый, кто работал в офисе, прекрасно представляет себе, что скрывается за словосочетанием “файловая помойка”.
Как правило, это общедоступный сетевой диск, на котором вперемешку хранятся валяются как рабочие документы так и музыка,
картинки временные файлы и прочий электронный мусор.
Проблема заключается в том, что никакими правилами и
договоренностями между пользователями нельзя достичь порядка в этом хранилище. Как только доступ к сетевой папке получают
два и более человека - она из хранилища документов превращается в свалку. И даже один неорганизованный пользователь
вполне способен устроить локальный файловый хаос в выделенной ему папке.
Существует два основных пути
решения проблемы “файловой помойки”:
- Внедрение системы документооборота
в компании;
- Установка локальной поисковой системы.
Первый путь хорош во всех отношениях,
кроме стоимости и длительности внедрения. Множество крупных системных интеграторов с радостью внедрят вам
систему документооборота стоимостью примерно в десять ваших годовых бюджетов на ИТ.
Кроме того,
этот путь требует от пользователя полного отказа от привычного способа обращения с документами и переходу к
использованию специализированной клиентской программы внедренной системы документооборота.
Второй
путь прост и элегантен. Вы просто прекращаете все попытки навести порядок в файловом хранилище силой или уговорами,
и даете своим сотрудникам удобный и привычный инструмент поиска информации в пределах вашего собственного офиса.
Мы предлагаем установить в вашем офисе собственный Google или Яндекс. Любой компьютерный пользователь в наше время
умеет обращаться с поисковиком. Мы предоставим ему привычный интерфейс.
Наше решение основано на
открытом продукте Lucene - открытом проекте, реализующем высокопроизводительный полнотекстовый поисковый движок.
Поиск по документам - не единственное применение данной технологии. Например, для учебных заведений
можно реализовать систему поиска повторяющихся фрагментов текста с целью выявления плагиата.
Еще одно
интересное применение - организация поиска по ограниченному списку интернет-сайтов. Это может быть полезно для
различных детских интернет-порталов и позволяет полностью очистить поисковую выдачу от “взрослых”
ссылок.
Для того чтобы вы могли ознакомиться с работой поисковой системы, мы подготовили тестовый
набор файлов в нескольких популярных форматах (doc, pdf, txt и других). Коллекция включает произведения русской
классической литературы. Попробуйте поискать запомнившиеся фразы, имена персонажей или любые другие слова и вы
сможете убедиться в эффективности и качестве работы предлагаемого нами решения.
Попробовать поиск в действии!
|