Lucene i Solr 3.5 wydane. Jest szybsze, obsługuje rozpoznawanie języków i fleksję oraz grupowanie wyników
Fundacja Apache poinformowała o wydaniu wersji 3.5 biblioteki wyszukiwania Lucene i serwera wyszukiwania Solr. Są one bardziej wydajne i oferują lepsze możliwości zarządzania wynikami.
Wersja Lucene 3.5 wprowadza kilka ulepszeń, a mianowicie:
-
zmniejszenie zużycia pamięci od 2 do 5 razy w wyniku przebudowania struktury danych,
-
obsługę nawigacji do odległych podstron, z zastosowaniem funkcji searchAfter, która nakazuje zacząć wyszukiwanie od określonego miejsca w zasobach, a nie od początku,
-
menędżer obiektów IndexSearcher o nazwie SearcherManager zajmujący się optymalnym udostępnianiem i otwieraniem nowych wątków wyszukiwania,
-
utrzymanie jednej instancji wyszukiwania IndexSearcher dla wątku jest łatwiejsze przez SearcherLifetimeManager,
-
IndexWriter.optimize() jako operacja czasochłonna zmieniła nazwę na forceMerge(),
-
IndexReader.reopen() została zmieniona na openIfChanged(), aby nie otwierać ponownie czytnika, gdy został już otwarty
-
optymalizacja wyszukiwania łańcuchów wielofazowych przyniosła przyspieszenie o 30-50% przez NgramPhaseQuery.
Solr 3.5 również zużywa mniej pamięci, a ponadto:
-
umożliwia tworzenie dystrybuowanych zapytań grupujących (ang. Distributed Result Grouping),
-
rozpoznaje języki przez Apache Tika LanguageIdentifier oraz bibliotekę Cybozu – i to przed zindeksowaniem dokumentu, dzięki czemu można wcześniej włączyć specyficzne dla języka ustawienia,
-
wyświetla puste wartości w polach numerycznych i daty na początku albo na końcu wyników niezależnie od sortowania, zgodnie z ustawieniami sortMissingFirst albo sortMissingLast,
-
obsługuje wyszukiwanie uwzględniające odmianę wyrazów przez przypadki, czasy itd. w 99 językach przez bibliotekę Hunspell używaną m.in. w LibreOffice, Firefoksie, Chrome, Operze, czy Mac OS X.
Równocześnie trwają prace nad czwartą wersją Lucene i wersją 3.6 Solr. Według twórcy Solr Yonika Seeleya, Lucene będzie miało przebudowane indeksowanie z obsługą kodeków, a Solr zamieni się w zaawansowany, indeksowany zasób danych NoSQL.
Czwarta wersja Solr będzie obsługiwać tryb wyszukiwania prawie w czasie rzeczywistym (NRT), który pozwoli wyszukiwać dane sekundy po ich zapisaniu do bazy.
Ta znajdująca się w repozytorium wersja jest już używana w komercyjnej implementacji Solr LucidWorks. Jeśli chcielibyście zobaczyć praktyczne zastosowania Lucene/Solr, to warto obejrzeć kursy wideo. Powstają też inne rozwiązania bazujące na Solr i Lucene, jednak na razie są w fazie prywatnych betatestów. Ciekawy jest też projekt SOLRHQ, który oferuje wyszukiwarkę opartą na Solr, zastępującą standardową wyszukiwarkę np. WordPressa czy Joomli!, oferując m.in. takie funkcje jak wyszukiwanie fasetowe.
Więcej o Lucene znajdziecie tutaj, a o Solr tutaj.
źródło: infoq.com
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
Nazwa padła ofiarą szantażystów, inni polscy hosterzy też zagrożeni?
19
Premiera Diablo 3 wzbudziła dyskusję na temat gier, które zawsze chcą być online
19
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Nowy problem z Windows 8: bootuje się za szybko
10
Amerykańscy rodzice straszeni „e-narkotykami” dostępnymi w Sieci
21
Z okazji wypuszczenia akcji Facebooka przypomnijmy sobie, kim jest Zuckerberg
10
Blueseed: libertariańska sztuczna wyspa przyciągnęła już ponad sto startupów z całego świata
8
Rewolucja w Firefoksie, nowa łatka czterokrotnie ograniczyła zużycie pamięci
20
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
CVDazzle: makijaż jest w stanie pokonać automatyczne systemy ulicznego monitoringu
3
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Co czeka programistów po czterdziestce?
27
Ubuntu 12.04 LTS już dostępny: stabilna dystrybucja na następne pięć lat?
28
Społeczność
stop_gupota "Fanatyczny" Diablo 3 jest dopiero od 10 dni.
Mas Ciekawa informacja, ale akurat projekt wytopu stali przez chłopów to był...
_Igancio Poziom artykułu jest bardzo niski ! Niczego się nie dowiedziałem , wygląda...
voluu A ja mam problem. MIanowicie, po dodaniu kodu z tego poradnika miniaturki...
Sebek Pozycjonowanie stron za pośrednictwem firm oferujących
swoje usługi nie...
asdosad jak to zrobić na xp??
lol Jak ktoś tu wcześniej zauważył - artykuł jest o niczym, a właściwie ukrytą...
- Najdmen.pl: Konta www z wyłączonym licznikiem transferu od IONIC.pl (1)
- 2BE.PL: [Oferta] Promocja jak złoto w 2BE.PL (1)
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
Polecane książki
Praca
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |









#1 Tomek___ 2011-12-14 14:30:59 0
IP: 195.205.70.[...] Mozilla/5.0 (Ubuntu; X11; Linux x86_64; rv:8.0) Gecko/20100101 Firefox/8.0