Поисковый движок DataparkSearch Engine

 
Последние изменения Скачать Документация Форум (Google Groups) Блог

DataparkSearch является поисковым движком с открытым исходным кодом, предназначенным для организации поиска на одном или многих веб-серверах. Распространяется по публичной лицензии GNU.

Основные возможности

  • Поддержка схем URL: http, https, ftp, nntp и news.
  • Виртуальная схема URL htdb для индексирования SQL баз данных.
  • Встроенные парсеры для типов документов: text/html, text/xml, text/plain, audio/mpeg (MP3) и image/gif.
  • Возможность выполнения внешних парсеров для остальных типов документов.
  • Возможность индексирования многоязычных сайтов используя механизм согласования содержимого.
  • Поиск всех форм слов на основе аффиксов и словарей ispell.
  • Поиск с учётом акронимов и аббревиатур.
  • Поддержка стоп-листов и списков синонимов и акронимов.
  • Поддержка логических запросов.
  • Рейтинг популярности на основе нейронной сети.
  • Возможность сортировки результатов по релевантности, популярности, дате последнего измненения и по важности (произведению релевантности на популярность).
  • Поддержка большого числа наборов символов.
  • Поиск без учёта акцентов символов.
  • Разбиение на слова фраз японского, китайского, корейского и тайского языков.
  • mod_dpsearch - поисковый модуль для веб-сервера Apache.
  • Алгоритм Построения Рефератов.

Документация

Документация на DataparkSearch находится в поддиректории doc дистрибутива очередной версии или снапшота. А также доступна он-лайн на английском и на русском языках.

Вы также можете воспользоваться группой DataparkSearch в Google Groups ( groups.google.com/group/dataparksearch ) для обсуждения вопросов, связаных с DataparkSearch. Также в этой группе вы можете поделиться вашим опытом работы с DataparkSearch.

Наш /cgi-bin/simpleforum.cgi">старый форум закрыт для записи, но вы можете просматривать все его записи в поисках нужной вам информации.

Последние изменение в DataparkSearch (As a RSS feed); PAD файл.

Скачать

Последняя выпущенная версия DataparkSearch: dpsearch-4.53.tar.bz2, январь 2010.

Снапшот новой версии, 4.54, обновляется периодически и доступен на Google Disk или в Google Code. Там же можно скачать и пэкаджи в формате deb или RPM.

Исходные тексты DataparkSearch Engine достпуны в SVN репозитории на Google Code или git репозитории на GitHub.

Баги

Вы можете просмотреть открытые баг-репорты или добавить свой на странице DataparkSearch в Google Code. Также можно воспользоваться аналогичной системой ведения вопросов на GitHub.

Примеры использования

Сайты, использующие DataparkSearch:







free counters

Фид блога DataparkSearch


Geo Visitors Map