Co to jest wyszukiwanie pełnotekstowe?

Wyszukiwanie pełnotekstowe

redakcja | 24.09.2020 23:07

Wyszukiwanie pełnotekstowe (ang. full-text search) -  umożliwia sprawne  i wydajne przeszukiwanie zbiorów danych według kryteriów określonych przez użytkownika uwzględniającego odmianę wyrazów, błędy ortograficzne,  synonimy oraz zwracanie dokumentów według założonej z góry ich oceny. 

Jeżeli chcesz mieć wyszukiwanie pełnotekstowe na swojej stronie i najprawdopodobniej doszedłeś do miejsca, gdzie relacyjna baza danych staje się już mało wydajna, albo zupełnie nieprzydatna to zobacz jakimi rozwiązaniami powinieneś się zainteresować. W tym artykule naświetle Ci, jaką technologią open source powinieneś się zainteresować, w kolejnych pokażę Ci jak wdrożyć to nawet na małej stronie www. 

Logo Solr
Logo Solr | Logo Solr

Myśląc na poważnie o wyszukiwaniu pełnotekstowym, musisz zainteresować się  Solr lub Elasticsearch, czyli z  dwoma najbardziej popularnymi i zaawansowanymi silnikami wyszukiwania opartymi na bibliotece Lucene. 

Jakie możliwości daje Solr?

Highlithing - wyciąganie fragmentów odpowiedzi dokumentów (treści), które pasują dokładnie do zadanego pytania przez użytkownika oraz zaznaczanie tego fragmentu w całej treści.  Sprawdza się idealnie w wyszukiwarce blogowej lub na portalu internetowym.

Highlithing Solroptymeo.pl | ilustracja | zwrócona odpowiedź z API Solr-a | Highlithing Solr

Faceting - wyciąganie kategorii (ogólnie taksonomii) na podstawie zapytania. Funkcjonalność ta jest wykorzystywana do budowania zaawansowanych wyszukiwarek i porównywarek sklepowych, bo faceting ułatwia użytkownikom przeglądanie wyników wyszukiwania poprzez zawężanie tych wyników. 

Autocomplete – bardzo wydajne podpowiadanie szukanej frazy. Możemy wdrożyć funkcjonalność podobną do podpowiadania w wyszukiwarce Google. 

Related -  a dokładnie plugin, który nazywa się MoreLikeThis  i umie zwracać podobne treści do podanych dokumentów. Idealnie sprawdza się do sugerowania innej treści dla użytkowników.  Świetne rozwiązanie pod SEO.

Solr jako wydajny silnik listingów

Sorl dzięki sprawnemu mechanizmowy indeksacji (real-time indexing) w swoim silniku nowych dokumentów może służyć jako znakomity mechanizm do budowania listingów w bardzo dużych serwisach internetowych. Na Polskim i zagranicznym rynku stoją na tym największe e-commerce i serwisy z dużymi bazami do przeszukiwania. 

Solr dzięki wielu możliwościom indeksacji (tak jakby import danych) dokumentów zintegrujesz z każdym rodzajem obecnych CMS-ów na rynku. W zależności od potrzeb zrobisz to za pomocą restowego API lub dzięki DataImportHandler dostępu do bazy relacyjnej, lub wygenerowanych przez Ciebie dokumentów XML, lub plików CSV. 

Artykuły z kategorii
Artykuły z portalu