Введение
Инсталляция
Системные требования
Производительность
Язык запросов
Пользователи
Кодировки
ЧаВо
Планы
Форум
|
Анонс - RiSearch Pro
Готовится новая, расширенная версия скрипта. В скрипт добавлено множество новых возможностей:
- Сортировка результатов поиска по релевантности, размеру файла,
дате последнего редактирования.
- Более компактная база данных.
- Подсветка ключевых слов в результатах поиска.
- Расширенный поиск, с возможностью использовать в запросе логические операторы
(AND, OR, NOT).
Например: (word1 AND word2) OR (word3 OR word4)
- Возможность поиска по всему сайту, по одной и нескольким частям сайта.
Предположительное время выхода нового скрипта - сентябрь-октябрь 2001 года.
Введение
RiSearch - простой, но достаточно мощный скрипт,
предназначенный для организации поиска на вебсервере.
RiSearch ни в коей мере не предназначен для замены
таких крупных поисковых систем, как ht://Dig или Glimpse,
и уж тем более не может соревноваться с коммерческими
программами стоимостью в несколько тысяч USD.
Предназначен он скорее для малых и средних сайтов, имеющих порядка 1000-10000 файлов
суммарным объемом около 10-100Мб. Этого вполне должно хватить
для большинства любительских сайтов. Впрочем ему под силу справиться
и с гораздо большим числом файлов.
Своим появлением RiSearch обязан бесчисленному множеству авторов
всевозможных поисковых скриптов, найти которые можно на любых
сайтах с бесплатными CGI скриптами. Просмотрев десятка два подобных творений
я пришел к выводу, что пользоваться ими
решительно невозможно, в результате через пару месяцев и после четырехкратного
переписывания кода с нуля появился RiSearch.
Download
Вы можете получить скрипт бесплатно для некоммерческого использования.
risearch-0.99.08 (последние изменения 22.11.01)
Особенности
RiSearch не использует какие-либо библиотеки или базы данных, кроме самого Перла.
Следовательно, его можно использовать на любом сервере, где у Вас
есть доступ к CGI (включая некоторые бесплатные хостинги).
В отличие от крупных систем, таких как ht://Dig или Glimpse,
исходный текст скрипта занимает 10 килобайт. Любой вебмастер,
знакомый с перлом, способен за пару часов разобраться в работе
скрипта и модифицировать его под свои нужды.
Скрипт способен работать с разными языками.
Простой и удобный язык запросов.
RiSearch использует платформонезависимые бинарные файлы, которые могут
быть использованы на разных компьютерах. То есть, Вы можете проводить
индексацию локальной копии сайта у себя дома под Windows9x, а затем
использовать созданные скриптом файлы на сервере.
Demo
Слегка модифицированная версия скрипта была использована для создания
поисковой системы "Букинист".
Можете оценить скорость его работы. На данный момент в этой поисковой системе
проиндексировано 7500 файлов и 45000 коротких записей.
History
- Ver. 0.99.08 - 03.11.2001
- Возможен поиск в одном или нескольких подразделах сайта.
- Исправлена ошибка при индексировании слов с несколькими дефисами (например 323-321-234).
- Доступен новый метод индексирования.
- Ver. 0.99.07 - 21.10.2001
- Исправлена ошибка в spider.pl.
- Ver. 0.99.06 - 21.09.2001
- Исправлена ошибка в spider.pl.
- Ver. 0.99.05 - 25.07.2001
- Исправлено несколько ошибок.
- Ver. 0.99.05 - 11.06.2001
- Исправлены две незначительные ошибки.
- Добавлена возможность автоматического преобразования URL в нижний регистр.
- Ver. 0.99.05 - 08.06.2001
- Добавлен простой робот-паук.
- Ver. 0.99.04 - 06.06.2001
- Исправлена ошибка в поддержке интернациональных символов.
- Ver. 0.99.04 - 08.05.2001
- Добавлены шаблоны для изменения дизайна страниц с результатом поиска.
- В значительной степени переписан индексирующий скрипт. Он теперь работает
процентов на 30 быстрее.
- Множество незначительных изменений.
- Ver. 0.99.03 - 06.04.2001
- Исправлено несколько некритичных ошибок.
- Ver. 0.99.03 - 05.01.2001
- Исправлена ошибка для многострочного тега TITLE.
- Добавлена функция ведения лога запросов.
- Ver. 0.99.02 - 30.10.2000
- Добавлен список "стопслов".
- В результатах поиска можно показывать либо содержимое тэга "META description", либо содержимое страницы.
- Индексер больше не вызывает ошибку при запуске его через броузер как CGI скрипт.
- Исправлено несколько некритичных ошибок.
- Ver. 0.99.01 - 04.09.2000
- Все конфигурационные параметры вынесены в отдельный файл config.pl.
- Добавлена индексация тагов META и IMG ALT.
- Числа и слова с дефисом теперь индексируются корректно.
- Возможность указания минимальной длины слова при индексации.
- Возможность указания числа результатов на странице в выводе скрипта.
- Добавлена поддержка специальных символов (таких как È или &x255;).
- Добавлен список файлов, которые не нужно индексировать.
|