Program za kontekstualno pretraživanje datoteka. Program za pretraživanje teksta u datotekama na računalu

Postoje različite situacije kada trebate pronaći datoteku među tisućama drugih, ali je poznat samo dio teksta (ili koda). Na primjer, prilikom programiranja stranice, nakon pregleda izvor, trebate pronaći u kojoj se datoteci odvija obrada i izlaz. Na koji način pretraživanje datoteke prema tekstu sadržano unutra? Za traženje datoteka s određenim tekstom Preporučujem korištenje Total Commander , budući da brzo, točno pretražuje tekstualne datoteke i ima nekoliko korisne opcije prilikom traženja. Pogledajmo pobliže kako to učiniti.

Prvo preuzmite Total Commander sa službene web stranice slijedeći poveznicu za preuzimanje Total Commandera i instalirajte ga. ( službena verzija potpuno rusificirano i besplatno).

Onda pokrenimo Total Commander. Kada se pokrene, tražit će da pritisnete jedan od tri broja, jer je program shareware, ali nema ograničenja u funkcionalnosti (nisam ga našao).

Ispred nas su se pojavila dva prozora u kojima se možete kretati kroz mape. U bilo kojem od prozora odaberite mapu u kojoj ćemo tražiti datoteku s određenim tekstom. U mom slučaju, moram pronaći datoteku s tekstom "pagination_previous". Pritisnite tipku dalekozora koja se nalazi u gornja ploča programa. Zatim stavite kvačicu pored natpisa "S tekstom", unesite test za traženje u datotekama, stavite kvačice pokraj ANSI i UTF-8 kodiranja i kliknite "Pokreni pretraživanje".

Nakon što Total Commander izvrši pretragu, ispod će se pojaviti popis datoteka u kojima je pronađen traženi tekst.

Sada morate pronaći tekst izravno u datoteci. Kako pronaći tekst u datoteci? Najprikladnije je koristiti bilježnicu Notepad++ za traženje teksta u datotekama. Preuzmite najnoviju verziju Notepad++ sa službene web stranice.

Instaliramo ovu prekrasnu bilježnicu i kroz nju otvorimo pronađenu datoteku. Pritisnite CTRL+F (dva gumba istovremeno). Otvorit će se prozor za pretraživanje teksta u datoteci. U polje “Traži” unesite tekst koji tražite i pritisnite “Enter” na tipkovnici. Notepad++ će brzo pronaći tekst u datoteci i istaknuti ga zelena. Ako ponovno pritisnete “Enter”, Notepad će nastaviti tražiti tekst u datoteci dalje. Ako se isti tekst ponovo pojavi, premjestit će se na njega i označiti ga zelenom bojom.

Kako brzo pronaći potreban tekst među mnogim datotekama? Ponekad se pojavi situacija kada morate brzo pronaći konkretan tekst, koji se nalazi u nekoj datoteci čiji je naziv nepoznat, a sama datoteka se nalazi među velikim brojem istih (ili čak drugih vrsta) datoteka.

Na primjer, student treba pronaći odgovor na neko pitanje među nekoliko desetaka bilješki s predavanja u elektroničkom obliku, domaćica treba pronaći neki recept u katalogu s receptima, Administrator sustava Programer će možda trebati pronaći informacije o pogrešci aplikacije među nekoliko stotina datoteka dnevnika ili programer treba pronaći određeni kod među tisućama izvornih kodova.

Što učiniti u ovom slučaju? Naravno, možete otvoriti svaku datoteku redom i pretraživati ​​je, ali ako takvih datoteka ima mnogo, vrlo brzo će se takav rad pretvoriti u rutinsko mučenje.

U ovom slučaju, bolje je potražiti pomoć od posebnih alata dizajniranih posebno za te svrhe i koji vam omogućuju brzo pronalaženje teksta. Jedan takav alat je program za pretraživanje datoteka FileSearchy.

Program je besplatan za osobnu upotrebu, možete ga preuzeti s web stranice razvojnog programera. Postoji plaćena verzija, razlike između njih također se mogu vidjeti na web stranici.

Program za pretraživanje datoteka FileSearchy može pretraživati ​​tekst u velikom broju formata datoteka, od kojih su najčešći: .doc, .docx, .xls, xlsx, .ppt, pptx, .pdf, .txt. Plaćena verzija program također može pretraživati ​​tekst u datotekama e-knjige(EPUB, FB2 i MOBI).

Programirajte načine rada za pretraživanje datoteka

Program može raditi u dva načina: Možete se prebacivati ​​između ovih načina označavanjem ili uklanjanjem oznake Pogledaj | Traka za pretraživanje.

Instant pretraga

U načinu Instant Search, program za pretraživanje datoteka radi kada je traka za pretraživanje skrivena. U ovom načinu možete pretraživati ​​datoteke samo prema nazivu koji morate unijeti u jedno polje. Za traženje datoteke samo unesite naziv datoteke ili čak dio naziva ili ekstenziju. Pronađeni rezultati pojavit će se dok upisujete.

Značajke ovog načina rada:

  • Da biste uključili ili isključili određene nazive datoteka, potrebno je kliknuti gumb sa slikom tri točkice desno od polja za unos teksta, te u prozoru koji se pojavi upisati što vam je potrebno ili obrnuto, ne treba tražiti.
  • Možete pretraživati ​​datoteke na način koji razlikuje velika i mala slova. Da biste to učinili, morate potvrditi okvir Traži | Osjetljivo na velika i mala slova.
  • Kako biste odabrali vrstu izraza koju tražite, morate otići u izbornik Traži | Vrsta izraza i odaberite odgovarajući način (podniz, puna riječ ili regularni izraz). O tome će biti više riječi u nastavku. Prema zadanim postavkama odabran je Substring i u većini slučajeva to je dovoljno.

Napredno pretraživanje

U naprednom načinu morate unijeti barem naziv datoteke i kliknuti gumb za pretraživanje. Baš kao u načinu trenutnog pretraživanja, možete navesti i cijeli naziv datoteke i njegov dio. Ali glavna je ljepota ovog načina rada to što možete postaviti Dodatne mogućnosti traži:
  • U imeniku- označava gdje tražiti datoteke. Ako ovo polje ostavite praznim, program će pretražiti sve indeksirane diskove. Prema zadanim postavkama, svi logički fiksni diskovi su indeksirani.

    U izborniku možete vidjeti ili promijeniti koje diskove treba indeksirati Alati | Mogućnosti... | Indeksiranje.

  • U sadržaju- omogućuje vam da odredite koji tekst pretraživati ​​unutar datoteka. Ovo je najzanimljivija značajka programa, koja vam omogućuje pretraživanje konkretan tekst u datotekama. Dakle, snimak zaslona u nastavku pokazuje kako brzo pronaći sve tekstualne datoteke na disku C koje spominju bilo kakvu pogrešku (prisutna je riječ pogreška).
  • Datum promjene- ovaj odjeljak vam omogućuje filtriranje datoteka po datumu Posljednja promjena. Ako označite ovaj okvir, morat ćete unijeti raspon datuma u kojem ćete pretraživati.
  • Veličina- omogućuje vam filtriranje datoteka po veličini. Također morate navesti raspon veličina u kojem želite pretraživati ​​i odabrati mjerne jedinice (KB, MB, GB)

Vrste izraza

U načinu trenutnog pretraživanja vrste izraza konfiguriraju se u izborniku Traži | Vrsta izraza. U naprednom načinu rada u odjeljku Naziv datoteke dodatno polje se pojavljuje kada potvrdite okvir Dodatne mogućnosti.

Ovisno o postavkama, tekst upisan u polje Naziv datoteke može se tumačiti kao riječ, dio imena (podniz) ili regularni izraz.

Podniz

Ovo je najjednostavniji način rada i instaliran je prema zadanim postavkama. U ovom načinu rada dovoljno je unijeti dio naziva datoteke. Ovaj način je posebno prikladan u slučajevima kada je nepoznat puno ime datoteku, ili ako ju je osoba zaboravila, ali se sjeća da se radi o tekstualnoj datoteci – u ovom slučaju dovoljno je u red unijeti .txt.

Puna riječ

U ovom načinu rada, riječ unesena u traku za pretraživanje može se pojaviti u nazivu datoteke ili sadržaja kao zasebna riječ, ali ne može biti dio druge riječi.

Na primjer, riječ "note" odgovara datoteci "note.txt", "my note.txt", ali ne odgovara datoteci "1note.txt" ili "notebook.txt"

Uobičajeni izraz

U ovom načinu, niz za pretraživanje tumači se kao regularni izraz kompatibilan s programskim jezikom Perl. Regularni izrazi su vrlo velika tema sami po sebi, ako niste upoznati s njima, jednostavno nemojte koristiti ovaj način.

Uz pomoć ovog malog besplatnog programa možete u nekoliko sekundi pronaći ne samo bilo koji tekst na svom računalu, već i bilo koji tekst općenito, čak i mala datoteka, koji je izgubljen među terabajtima drugih podataka.

Program za pretraživanje teksta u datotekama na računalu.

S ovim programom možete brzo pronaći tekstove u dokumentima, tekstualne datoteke, spremljene web stranice, mp3 oznake, čak i slike, sve vrste arhiva i datoteka. Postoji podrška za sva ruska kodiranja. Program ima prikladno, intuitivno sučelje i ništa manje luksuznu funkcionalnost. Ali glavna značajka programa je velika brzina pretraživanja tekstova u datotekama. Za nekoliko sekundi program će skenirati gigabajte informacija. Za još veću produktivnost predviđeni su posebni filtri, na primjer: traženje slika veličine najmanje 120 x 120 piksela, pretraživanje u mp3 oznakama s trajanjem glazbe od najmanje 20 sekundi. Program razumije sve vrste dokumenata i datoteka i može raditi s arhivama. Pretražuje i same datoteke i program također traži tekst u datotekama.

Univerzalni program za pretraživanje teksta u datotekama za početnike i profesionalce.

Copernic Desktop Search
Od prvog upoznavanja s programom Copernic Desktop Search, nisam mogao pomoći
primjećujete ugodno sučelje koje budi samo pozitivno
emocija, što je rijetkost za ovu vrstu programa. svi
alate koje program ima za pretraživanje teksta u datotekama i
Kontrole funkcija ergonomski su smještene na pločama.
Glavno obilježje ovog razvoja je to
program za pretraživanje teksta u datotekama ima lijep
oblikovati
i ništa suvišno, sve za udoban rad
program. Od prvog pokretanja, čarobnjak će od vas zatražiti stvaranje posebnih indeksa
munjevito brzo pretraživanje teksta u datotekama. Nakon zastoja
računalo, program automatski počinje indeksirati odabrane mape.
Ali to se može promijeniti u postavkama na zahtjev korisnika.
Postavke u programu su prilično široke. Samo indeksiranje je moguće
konfigurirati u automatskom načinu rada, u ugrađenom načinu rada planera,
V ručni mod, dok računalo miruje, u pozadina s niskim
prioritet potrošnje resursa. Struktura indeksa uključuje postavke:
izbor prema tipu datoteke, u općenitom i detaljnom obliku. Vas
filtrirajte ono što ćete indeksirati, dokumente, samo
tekstualne datoteke, html stranice, slike, videozapisi, glazba, druge vrste
datoteke. Postoje postavke za odabir datoteka prema ekstenziji. Širok
postavke indeksiranja omogućuju vam filtriranje indeksa prema određenim
zahtjevi korisnika. Na primjer, indeksiranje slika veličine nije
manje od 100 x 100 piksela ili glazbu u trajanju od najmanje 15
sekundi Također ćete pronaći postavke indeksiranja za klijente e-pošte,
pretraživati ​​tekst u pošti i drugim programima kao što je Microsoft Outlook.
Kod traženja teksta u datotekama, program se također razlikuje od svojih konkurenata.
Na primjer, možete pretraživati ​​tekst isključivo u mp3 datotekama
samo po oznakama u određenim kategorijama, izvođač, album,
naslov skladbe, datum. Možete tražiti samo sliku u
određene veličine, proširenja i rezolucije. Praktički
Svaka vrsta datoteke ima vlastite postavke. To vam omogućuje pretraživanje
tekst u datotekama munjevito brz. Nakon pretraživanja, program se prikazuje
informativni rezultati upita za pretraživanje s prozorom
pretpregled teksta datoteke i prozor pretpregleda mjesta gdje
Tekst zahtjeva pojavljuje se u datotekama. Izvrsno i što je najvažnije brzo
program za pretraživanje teksta u datotekama. Pogodan je za kućnu upotrebu
koristiti i u profesionalnom radu s velikim brojem
dokumenata i spisa. Program pokazuje izvrsne rezultate
u brzini pretraživanja teksta u desecima gigabajta datoteka dokumenata i
druge vrste informacija.

Profesionalni program za pretraživanje teksta u datotekama.



Zanimljiv program za pretraživanje teksta u datotekama s vlastitim
prednosti. Značajke programa uključuju podršku za razne
kodiranja kao što su Unicode i UTF za pretraživanje teksta u datotekama. Program
vrši pretraživanja i na lokalnom računalu i na FTP poslužiteljima.
Ne samo da može pronaći tekst, već i skupni način rada zamijeniti
pronašao tekst drugome u stotinama datoteka istovremeno. Program
ima ugrađen editor koji uvelike pomaže u
pregled na automatska zamjena pronađeni tekst.
Ugrađeni uređivač ima isticanje sintakse izvornog koda.
Glavna značajka koju ima program za
pretraživanje teksta u datotekama s podrškom za sintaksu regularnog izraza

sintaksa za pretraživanje i zamjenu teksta u datotekama.
Program također ima mnogo postavki filtera
traži. Program vam omogućuje spremanje rezultata pretraživanja u zasebnom
datoteka. Program može prepoznati dvostruke nazive mapa. općenito
Program je namijenjen naprednim korisnicima i najčešće to
odabrani od strane webmastera. Specifične funkcije koje ističu program
konkurenti u sektoru čine ga privlačnim programerima. Ali također
prosječnom korisniku možete koristiti osnovne funkcije koje
dobro se nosi s osnovnim zadacima brzog pretraživanja teksta u
datoteke.

SearchInform Desktop


Od prvog upoznavanja s programom, sučelje može izgledati komplicirano,
ali onda primijetite da je sve na svom mjestu. Prvo treba raditi
stvoriti indeks pretraživanja. Ovo je prilično jednostavan postupak. Posebno
želim napomenuti velika brzina pitanja indeksiranja
program za pretraživanje teksta u datotekama
. Prilikom indeksiranja
program dodaje u indeks kao
obične mape i datoteke, kao i e-poštu i druge vanjske
izvora (DMS, CRM). Posebnost pretraživanja programa je pretraživanje po
točan upit ili s podrškom za sinonime. Ova vrsta pretraživanja ističe
programa među natjecateljima. Parametri pretraživanja mogu se prilagoditi
razne oblike zahtjeva. Na primjer: pretraživanje izraza, morfološki
pretraživanje, pretraživanje citata, logičke operacije, pretraživanje po početku riječi, po
završetak, u središnjem dijelu riječi. Dostupan obrazac zahtjeva za ponudu
traži. Kada sve riječi citata moraju biti prisutne u datotekama u
drugačiji redoslijed, a između riječi može i ne mora biti
(na zahtjev korisnika) druge riječi. Program sadrži
ugrađeni rječnici značajnih i neznačajnih riječi. glavna značajka
ovaj program je nova tehnologija u analizi teksta. Sustav
pretražuje upravo prema semantičkom sadržaju. Program može raditi u
korporativna mreža. Prilikom pretraživanja po lokalna mreža program ima
dva modula su poslužitelj i klijent. Razlike su u tome
klijentski modul ima ograničenja prava pristupa za pretraživanje
informacija. Kao rezultat toga, vidimo da je ovo profesionalni program,
koji je namijenjen širokom krugu korisnika. Što se tiče
korporativni i za kućnu upotrebu.

Program za pretraživanje teksta u datotekama za obične korisnike.



Kompaktan program za usko pretraživanje tekstova u
spisi i dokumenti. Radi na svim popularnim PC platformama
(Windows, Mac OS X i Linux). Program također podržava funkciju
indeksiranje mapa i datoteka. Prvo indeksiranje, kao i uvijek, malo je
duže od sljedećih koji se samo ažuriraju ovisno o
ažuriranje sadržaja mape. Ali prisutnost indeksiranja čini ovo
program za brzo pretraživanje. Program, unatoč svojoj skromnosti,
ima oba osnovna uzorka upita "I", "ILI" i "NE", i
prošireno: uzorak zamjenskog znaka, nije točna pretraga, pretraživanje izraza. U
program ima podršku za Unicode u dokumentima, web stranicama i
obične tekstualne datoteke. Program može pretraživati ​​arhive
(zip, rar, 7z i drugi). Program za pretraživanje teksta u
datoteke podržava sve uredske dokumente
, i
datoteke pomoći, web
stranice, tekstualne datoteke i dodatno datoteke AbiWord formata,
Skalabilna vektorska grafika, Microsoft Visio i drugi popularni formati.
Program uska specijalizacija pretraživanje i stoga jednostavan za korištenje.
Ova verzija je prijenosna i može raditi na Windowsima, Mac OS X i
Linux. Ima rusko sučelje.

AVSearch


Također kompaktan program za pretraživanje teksta u datotekama.
Posebna značajka programa je podrška za svih 5 ruskih kodiranja,
plus Unicode. Pretraživanje u arhivama je vrlo dobro implementirano. Dom
posebnost je u tome program za pretraživanje teksta u
arhivske datoteke podržavaju više od 20 formata
.
Postoje osnovni predlošci upita,
konstrukcije (I, ILI, NE) i pretraživanje po “maski” riječi
u frazama upita za pretraživanje. Program ima opsežne postavke
filtriranje datoteka. Rezultate pretraživanja možete vidjeti u
tekstualnom obliku ili kao HEX tablica. Program ne zahtijeva
instalacije. Ima rusko sučelje. Vrlo učinkovito pri pretraživanju
arhiva.

Test Rezultat je najbolji program za pretraživanje teksta u datotekama.

Svaki program ima svoje karakteristike za pretraživanje teksta. Odaberite
prikladan program za specifične zadatke i radnim uvjetima. Korištenje
bilo koji od ovih programa, moći ćete znatno učinkovitije i učinkovitije
Produktivnije je i brže pretraživati, sortirati i organizirati datoteke. Ali također
Ono što je vrlo važno je da možete pronaći tekstove i datoteke brzinom munje. Podaci
alati će vam biti mnogo korisniji u odnosu na one ugrađene
alati za pretraživanje datoteka i tekstova u operativni sustavi.
Programi upravitelji datotekama također se ne mogu usporediti u brzini i
rezultate pretraživanja s ovim programima. Teško je izdvojiti samo jednu
najbolji program od svih koji su sudjelovali u testu. Svi programi
imaju svoje karakteristike koje ih razlikuju od konkurencije.
Ali preporučujem da svoje upoznavanje s ovom vrstom programa započnete s Copernicom
Desktop Search, prvo, ovaj uslužni program je lijep, praktičan i
jasno sučelje. Početnik može odmah početi raditi. Osim
Štoviše, obilje i kvaliteta funkcija najvjerojatnije će zadovoljiti sve vaše
potrebe prilikom traženja tekstova i datoteka i možda nećete pretraživati
nešto drugo. Uslužni program je vrsta kompromisa između jednostavnog
prilagođeni i složeni profesionalni programi. Ali ako ti
zaista vam je potrebna beskompromisna vrlo brza pretraga i spremni ste
posvetite malo vremena razumijevanju funkcija programa
onda je bolje koristiti više profesionalni program SearchInform
Desktop koji nema brzinu pretraživanja i broj funkcija
jednaki. Pretraga je dovršena za nekoliko sekundi u mapama većim od
gigabajt. Osim toga, inteligencija programa pomaže što točnije
pronaći ono što tražite. Ovo je doista impresivno. Svi programi vas
Možete ga preuzeti ispod u jednoj arhivi. Svi ti programi već imaju ključeve i
možete odmah početi raditi. Potražite informacije na svom
računalo brzo i udobno.


Razgovarajte o čemu u naše vrijeme informacijske tehnologije i beskonačan rast količine podataka dostupnih i pojedincu i društvu, postoje mnogi problemi s obradom informacija i traženjem istih - to je već blasfemija. Tko ne pokreće ovu temu? A kako vas ne bih opterećivao subjektivnim, a dijelom i objektivnim prosudbama iz različitih izvora informacija o problemu, prijeći ću izravno na njegovo rješenje. Danas ćemo razgovarati o pretrazi. Odnosno, o programima i ozbiljnim informacijskim sustavima koji traže dokumente i podatke koji su nam potrebni.

Nadogradi "izravno pretraživanje"

Ne tako davno, kada su stabla bila velika, a nije bilo puno informacija čak ni na lokalnoj mreži poduzeća, svaka pretraga se provodila jednostavnim pretraživanjem šačice dostupne datoteke te dosljednu provjeru njihovih naziva i sadržaja. Takvo pretraživanje naziva se izravnim, a programi (uslužni programi) koji koriste tehnologiju izravnog pretraživanja tradicionalno su prisutni u svim operacijskim sustavima i paketima alata. No ni snaga suvremenih računala nije dovoljna za brzo i adekvatno pretraživanje golemih količina podataka tijekom izravnog pretraživanja. Pretraživanje nekoliko stotina dokumenata na disku i pretraživanje ogromne knjižnice i nekoliko desetaka poštanskih sandučića dvije su različite stvari. Stoga programi za izravno pretraživanje danas očito nestaju u pozadini - kada je riječ o univerzalnim alatima.

Naravno, ova vrsta pretraživanja već dugo nije tražena u korporativnom sektoru. Volumeni nisu isti. I stoga, već dugi niz godina, i u U zadnje vrijeme definitivno, tehnologije sposobne za brzo i točno pretraživanje dokumenata raznih formata i od razni izvori, više su nego relevantni. Nedavno "tata" Microsoft Bill Gates, očito zavidan na fenomenalnom uspjehu internetske tražilice Google, na jednoj od konferencija za novinare obznanio je želju softverske (i ne samo) industrije da na svaki mogući način pridonese razvoju i produbljivanju stvaranja tražilica i tehnologija. . Ali prerano je za stvaranje bilo kakvog fenomenalno radnog programa od Microsofta ili konkurentnog poslužitelja na Internetu (MSN još uvijek ne doseže Google). Stoga, okrenimo se već postojeći razvoj. Indeks, upit, relevantnost

U srži moderne tehnologije postoje dva temeljna procesa. Prije svega, to je indeksiranje. dostupne informacije i obradu zahtjeva, a zatim ispisivanje rezultata. Što se prvog tiče, bilo koji program (bilo da se radi o tražilici za stolna računala, korporativnoj Informacijski sistem ili Internet tražilica) stvara vlastito područje pretraživanja. Odnosno, obrađuje dokumente i generira indeks tih dokumenata (organiziranu strukturu koja sadrži podatke o obrađenim podacima). Ubuduće se kreirani indeks koristi za rad - brzo dobivanje popisa potrebnih dokumenata prema zahtjevu. Ono što slijedi, iako tehnološki nimalo jednostavno, sasvim je razumljivo prosječnom korisniku. Program obrađuje zahtjev (koristeći ključnu frazu) i prikazuje popis dokumenata koji sadrže tu ključnu frazu. Budući da su informacije sadržane u strukturiranom indeksu, obrada upita puno je brža (desetke i stotine puta!) nego u slučaju izravnog pretraživanja (odabir dokumenata ne provodi se nabrajanjem datoteka, već analizom tekstualnih informacija u indeks).

Program prikazuje pronađene dokumente u rezultirajućem popisu prema relevantnosti - usklađenosti dokumenta s tekstom upita. U raznim tehnologijama, naravno, postoje razne metode pretražiti i utvrditi relevantnost dokumenta (broj “pojavljivanja” riječi i učestalost njenog spominjanja u dokumentu, omjer tih parametara prema ukupnom broju riječi u dokumentu, udaljenost između riječi upita izraz u pretraživanim datotekama i tako dalje). Na temelju tih parametara određuje se “težina” dokumenta i ovisno o njoj pojedina datoteka se pojavljuje u listi rezultata na određenom mjestu. U slučaju pretraživanja interneta situacija je još kompliciranija. Uostalom, u u ovom slučaju moraju se uzeti u obzir mnogi drugi čimbenici (primjer toga je Googleov Page Rank). Ali ovo je tema za poseban članak, pa nećemo dirati Internet Pregled tražilica

U ovaj materijal mogućnosti nekoliko popularni programi tražilice, koje se mogu pohvaliti pristojnim brzinama i dobrom funkcionalnošću. Ali razmetanje u brošurama je jedno, a stajanje pod pogledom stručnjaka nešto sasvim drugo. I više nije bilo stručnjaka, niti ureda punog ljudi koji su voljeli petljati po softveru radi njegove upotrebljivosti. Na eksperimentalnom računalu (Athlon 2,2 MHz, kapaciteta RAM memorija 1 GB, 160 GB IDE tvrdi disk Seagate na 7200 okretaja u minuti i Windows sustav XP) instaliran je set programa: dtSearch Desktop, Bloodhound Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Za testove je sastavljena tekstualna baza dokumenata doc formati, txt i html ukupna veličina ni više ni manje, nego 20 gigabajta. Grupa drugova pod vodstvom vašeg poniznog sluge testirala je, uspoređivala i dijelila svoje subjektivne dojmove o svakom softveru. U nastavku pročitajte sažetak nalaza. dtSearch Desktop

Program koji, prema programerima, tvrdi da je najbrža, najprikladnija i najbolja tražilica. Kao, općenito, svi ostali iz ovu recenziju. Sučelje dtSearch je prilično jednostavno, ali neki prozori ili kartice su donekle preopterećeni elementima, zbog čega se čini teškim za korištenje. Ali u stvarnosti nema posebnih poteškoća. Jedina stvarno neugodan trenutak je nedostatak softverske podrške za ruski jezik (unatoč činjenici da program može pretraživati ​​dokumente na nekoliko jezika, njegovo sučelje je isključivo engleski).

Ali dtSearch je jedan od rijetkih programa koji može indeksirati web stranice do "dubine" koju odredi korisnik (iako, uzimajući u obzir "dodatnu kupnju" kompleta dodataka dtSearch Spider). Ovo je dodatak podržavanju raznih datoteka na disku formati teksta i e-poruke od poštanski sandučić Outlook. Istovremeno, program ne zna raditi s bazama podataka koje su takve malčice za tražilice zbog velike količine informacija sadržanih u njima i njihove raširene distribucije u tvrtkama, a time iu korporativnim mrežama. Pokazalo se da je brzina indeksiranja dtSearch dokumenata na odgovarajućoj razini. Gledajući unaprijed, reći ću da se ovaj program nosio s indeksiranjem određene količine informacija na razini s drugim konkurentom - iSYS - i podijelio s njim drugo mjesto na popisu najbržih sustava. dtSearch je indeksirao testnih 20 gigabajta informacija u 6 sati i 13 minuta, stvarajući indeks od 7,9 GB za naknadne potrebe pretraživanja.

Što se tiče mogućnosti pretraživanja, ovdje su na odgovarajućoj razini. Prvo, dtSearch ima morfološko pretraživanje (traženje riječi u svim njenim morfološkim oblicima). Korištenje ova prilika, oslobađate se, recimo, misli poput "u kojem je padežu određena riječ korištena u dokumentu koji sam trebao?" Korištenje morfološkog pretraživanja gotovo je uvijek opravdano, stoga bi trebalo biti prisutno u svakoj profesionalnoj tražilici.

Pretraživanje po zvuku je nestandardna značajka čak i za profesionalne tražilice. Njegova bit je da će program tražiti riječi koje zvuče isto kao riječ koju ste unijeli. A najbolji dio je što ova funkcija radi i za ruski jezik! Na primjer, kada u upit za pretraživanje upišete riječ "uho", kao rezultat ćete vidjeti ne samo riječi "uho", već i "uho".

Pretraživanje s ispravljanjem pogrešaka vrlo je važna funkcija. Koristi se za traženje riječi koje sadrže sintaktičke pogreške- to mogu biti i tipfeleri i pogreške u dokumentima dobivenim pomoću sustava za prepoznavanje znakova, na primjer. Jednostavan primjer - tražite riječ tipkovnica. Neki dokument sadrži riječ "tipkovnica", očito je da je to zapravo riječ "tipkovnica", osoba je samo pogriješila prilikom tipkanja. Dakle, pretraga ispravljanja pogrešaka otkrit će i uključiti dokument s riječju "tipkovnica" u rezultat. Također postoji postavka u dtSearchu koja vam omogućuje određivanje stupnja mogućih pogrešnih znakova.

Pretražujte pomoću sinonima. Ova značajka koristi popis sinonima za različite riječi. Tako će, na primjer, unosom riječi "brz", program pronaći i riječi "velika brzina" i druge koje su sinonimi za riječ "brz", ako su, naravno, prisutne u popisu sinonima . Gotovi popis sinonima nije isporučen s programom dtSearch, međutim, moguće je koristiti popise na Internetu (prema tome, potrebna je veza, što nije uvijek zgodno), ili možete izraditi vlastiti popis sinonima .

Uz navedene mogućnosti, dtSearch može pretraživati ​​pomoću fraza koje se sastoje od riječi povezanih logičkim operacijama. Svakoj riječi u upitu može se dodijeliti vlastita "težina", odnosno značaj. Korisna opcija je korištenje rječnika koji se sastoji od nevažnih riječi kako ih ne biste uzimali u obzir prilikom pretraživanja, ali i ovaj je rječnik prazan i morat ćete ga sami ispuniti.

Zatim, pogledajmo mogućnosti programa pri radu na mreži. Zapravo, dtSearch ne nudi nikakve posebne mogućnosti za rad s mrežom. Međutim, sasvim je moguće koristiti ga online. Alternativno, možete stvoriti neku vrstu indeksa i staviti ga u javnu (dijeljenu) mapu. Sam program može se instalirati na računalo svakog korisnika ili se može smjestiti u mapu kojoj je otvoren javni pristup, te kreirati posebne prečace za svakog korisnika posebno pomoću parametara naredbeni redak, čija je svrha opisana u datoteci pomoći koja se isporučuje s programom. Također, postoji mogućnost automatska instalacija programe na mrežu na MSI pomoć datoteka. Ovo će uzeti u obzir postavke za svakog povezanog korisnika.

Općenito, to je dobar program iz kategorije profesionalnih tražilica. Može se kvalificirati za dobra oznaka, međutim, stjecanje povjerenja i poštovanja korisnika možda neće biti lako za dtSearch zbog nekih čimbenika (nije sve glatko sa sučeljem, ruski korisnici su lišeni, nema svijetlih značajki za rad s mrežom). Što se tiče izravnog pretraživanja dokumenata, program nije imao problema s ruskim tekstom. Kao što ih nije bilo s deklariranom morfologijom, niti s fuzzy pretragom. Sustav sasvim adekvatno pronađen potrebne dokumente i jednostavnim zahtjevom jednom riječju i upotrebom kao ključna fraza par paragrafa, neki dokument.

Službena stranica:
Veličina distribucije: 23 Mb Bloodhound Prof Deluxe

Na temelju imena možete pretpostaviti da u ovom programu postoji podrška za ruski jezik. Ovo je već lijepo. Što se tiče sučelja, općenito je pomalo neobično, ali izgledom je vrlo privlačno. Još jedna stvar je praktičnost. Vrlo kontroverzan kriterij, ali ipak, vjerojatno, multi-window rješenje nije najuspješnija opcija (zahtjev se unosi u jednom prozoru, rezultat se prikazuje u drugom i slično).

Snoop koristi iste indekse za brzo pretraživanje, ali je indeksiranje puno sporije od drugih programa. To je vrlo čudno, pogotovo ako se uzme u obzir da su njegove mogućnosti obrade upita za pretraživanje vrlo slabe, pa stoga struktura indeksa nije složena. Najvjerojatnije je to zbog neoptimiziranih algoritama. Pokazalo se da je ovaj program očiti autsajder u brzini indeksiranja i pretraživanja: vrijeme potrošeno na izradu indeksa bilo je šest puta duže od istog dtSearcha i iSYS-a. Indeksiranje 20 gigabajta tekstova za krvosljednika rezultiralo je 38 sati i 46 minuta rada. A stvoreno "područje pretraživanja" zauzimalo je istu veličinu na tvrdom disku kao i izvorni podaci s malim minusom - 19 gigabajta.

Bloodhound se može predstaviti kao alternativa standardno pretraživanje u Windowsima teško da može više. O tome da je Bloodhoundov prvi prioritet jednostavno pretraživanje datotekama ukazuje ne samo mali broj funkcija za analizu teksta upita za pretraživanje i napredno pretraživanje po atributima datoteka, već čak i prozor s rezultatima koji nudi izravne veze na pronađene datoteke, kao i na mape koje sadrže te datoteke. Prozor s rezultatima nije previše informativan u smislu da cijelu pronađenu datoteku možete pročitati samo njegovim pokretanjem, odnosno nema ugrađen preglednik datoteka. Ali prikazuje se izvadak iz datoteke u kojoj je pronađena tražena riječ; općenito, ova shema prikaza vrlo podsjeća na internetske tražilice.

Govoreći o specifičnim mogućnostima obrade upita za pretraživanje, vrijedi napomenuti da ne postoji nešto poput "teksta za pretraživanje"; najviše što se može pretraživati ​​je fraza, makar samo zato što ne postoji polje za unos teksta s više redaka. No, možete analizirati unesenu frazu, a Snoop nam ovdje nudi standardni set pretraživanja: logičke operacije, pretraživanje maske i pretraživanje citata... ne puno. Program sadrži neke rudimente morfološke pretrage, ali vjerojatno toliko grube da prilično smeta ispravan rad(tijekom testiranja uočena su mnoga preklapanja s netočnom upotrebom morfologije).

Ali program vam omogućuje da odredite atribute datoteke prilikom pretraživanja (datum dokumenta, naziv datoteke, naziv mape), au tim upitima također možete koristiti isti skup pretraživanja. Također možete pretraživati ​​slova navodeći parametre (Od, Predmet... itd.).

Dakle, shvatili smo samu pretragu, što je još zanimljivo o programu, za koji je dobio toliko nagrada, prema informacijama sa službene stranice? Teško je reći što je tako posebno u njemu; najvjerojatnije je sučelje Bloodhounda privlačno (upravo izgledom, a da ne spominjemo upotrebljivost).

Operacije s indeksima vrlo su standardne; dobra značajka je mogućnost ažuriranja indeksa prema rasporedu. Dodatno, indeksi se mogu koristiti i online. Od sada nam treba više detalja.

Unatoč primitivnosti upita za pretraživanje, program se može koristiti za traženje datoteka, pa se njegova uporaba može opravdati u mrežama. Iako je to nategnuto, budući da je u velikim mrežama prioritet brzo traženje podataka složenim upitima za pretraživanje zbog ogromne količine informacija - a očigledni su problemi s brzinom pretraživanja i programa. Moram reći da je rad s mrežom u Izhishiki osmišljen kako treba. Posebna aplikacija dizajnirana je posebno za to - Bloodhound Server. Radi na isti način kao i jednostavno Njuškalo (imaju istu tražilicu), samo za dokumente objavljene na središnji poslužitelj ili na zajednički resursi na korporativnoj mreži. Snooper Server stvara nove indekse na zajedničkim resursima ili koristi prethodno stvorene. Svaki korisnik korporativne mreže može se spojiti na poslužitelj za pretraživanje i koristiti ga za pristup bilo kojem dokumentu (koji se nalazi u trenutnom indeksu) pomoću internetskog preglednika. Slažem se, ova shema je izuzetno zgodna: ispada da se datoteke na vlastitoj mreži mogu pretraživati ​​na isti način kao i informacije na Internetu putem, na primjer, Googlea.

Procjenjujući sve prednosti i nedostatke ovog programa, nameće se zaključak da njegove mogućnosti najvjerojatnije nisu dovoljne za korporativne mreže (unatoč dobroj organizaciji rada s mrežom), ali za kućno računalo ili čak za kućnu mrežu jesu. , u načelu, , moglo bi se pojaviti. Iako ni brzina rada ni mogućnosti pretraživanja ne ulijevaju optimizam...

Službena stranica na ruskom:
Veličina distribucije: 6 MbGoogle Desktop Search + GDS Enterprise

Naravno, nismo mogli zanemariti tako poznatog programera. Ime Google već puno govori. Ljudi koji su ga koristili godinama najmoćniji internet tražilicu, vjerojatno ćete se bez imalo sumnje odlučiti na svoje računalo instalirati upravo ovu tražilicu. Samo pomislite: Google na vašem kućnom računalu! Međutim, bez podlijeganja provokacijama s široko promoviranim brendom, pokušajmo trezveno, i što je najvažnije objektivno, razmotriti mogućnosti "stolne" tražilice iz Googlea.

Prvo što upada u oči je nedostatak vlastite ljuske za program. Google Desktop Search i dalje se nalazi u prozoru preglednika, odnosno cijelo sučelje desktop verzije naslijeđeno je od softvera starijeg internetskog brata. Je li dobro ili loše - sporno pitanje: neki ljudi vole minimalizam u dizajnu ove tražilice, dok drugi žele vidjeti punu aplikaciju ispunjenu svim vrstama gumba i tako dalje.

Što vam upada u oči odmah nakon dizajna? I činjenica da taj isti Google Desktop Search počinje indeksirati sve na računalu, bez ikakvog zahtjeva! I ono što je najzanimljivije je odabrati staze indeksiranja kada Google pomoć Desktop Search nije moguć. Morat ćete preuzeti poseban program (TweakGDS), koji će vam omogućiti malo proširenje Google postavke Radna površina, uključujući određivanje mjesta potrebnih za indeksiranje. Iako, dok sve ovo shvatite, on će već indeksirati standardni tvrdi disk, pa će ova postavka vjerojatnije biti potrebna pri radu s velikim količinama podataka, što je vrlo važno kada se koristi u korporativnim mrežama (Enterprise verzije) . Međutim, nije činjenica da će nakon preuzimanja TweakGDS-a vaši problemi biti riješeni. Uostalom, Microsoft joj je potreban da bi radila. NET Framework i Microsoft Scripting Runtime. Da... instalacija, kao i pristup postavkama, mogli su biti jednostavniji, iako programeri vjerojatno razumiju: zašto pisati nešto novo kada postoji gotova tražilica, prenijeti je na lokalno računalo i pustiti korisniku "uživajte", a poznato ime će od "ovoga" napraviti još jedno remek-djelo. Hajde, završimo s ovom lirskom digresijom i prijeđimo na potragu.

Što se tiče analize upita za pretraživanje i isporučivanja rezultata, ovdje je sve potpuno identično Googleu na Internetu: isti sustav za prikaz rezultata, isti standardni skup logičkih operacija za upite za pretraživanje. U opći Google Desktop Search, na primjer prethodni program, namijenjen je isključivo za pretraživanje datoteka - on, naravno, nema interni preglednik za te datoteke. Broj formata datoteka koje podržava Google Desktop Search je sasvim dovoljan, a lijepo je i to što pretražuje posjećene internetske stranice uzimajući podatke iz cache memorije. Brzine pretraživanja i indeksiranja su sasvim prihvatljive. Istina, za kućnu upotrebu. Google Desktop Search uhvatio se u koštac s impresivnih 20 gigabajta teksta u 8 sati i 17 minuta. Provesti nekoliko dana u obradi informacija iz korporativne mreže velikog poduzeća nije nešto što bi bilo koji administrator sustava volio raditi. S pozitivne strane: veličina kreiranog indeksa bila je na istoj razini (4,5 GB) kao i druga tražilica testirana u ovoj recenziji - SearchInform.

Velika prednost (ili nedostatak - odlučite sami) Google Desktop Searcha je ta što podržava dodatke, koji mogu puno promijeniti na bolje. Još jedna stvar je da povezivanje dodataka i njihovo postavljanje toliko komplicira zadatak instaliranja tražilice da se počnete pitati je li sve to potrebno kada možete instalirati normalan, punopravni program u kojem će sve već biti prisutno. Uostalom, za korištenje svake značajke morat ćete instalirati novi dodatak. Čak i kako bi program u potpunosti radio s arhivama, potreban je poseban gadget. Fascinantno je i zavodljivo da su svi ti dodatni moduli besplatni. Međutim, ako ne uzmete u obzir desktop verziju tražilice, onda kompetentna postavka GDS Enterprise možda nije u vašoj moći - nije uzalud stručnjaci iz Googlea nude svoje usluge za postavljanje vlastitog softvera za vašu mrežu za samo 10.000 USD.

Ako ipak prođete kroz postupak postavljanja i instalacije (ili platite 10.000 dolara Googleovom timu za brzi odgovor), shvatit ćete da je složenost instalacije više nego nadoknađena vrlo fleksibilnim postavkama kada se koriste u korporativnim mrežama. Važna točka Google rad Za korištenje je stolno računalo na korporativnoj mreži grupne politike, što omogućuje postavljanje postavki za svakog korisnika.

Ukratko, najrazumnija upotreba ovog programa je kućno ili poslovno računalo. Uostalom, za obično računalo dovoljno je samo instalirati program - ostalo će sam učiniti (neće vas ništa ni pitati).

Međutim, Google Desktop Search Enterprise bit će prihvatljiv u slučajevima kada postoji hitna potreba za fleksibilnom konfiguracijom mrežne politike za korištenje tražilice, dok će mogućnost obrade upita za pretraživanje biti na drugom mjestu po važnosti, a vrijeme (ili novac) ) potrošeno na postavljanje programa bit će na prvom mjestu.

Službena stranica:
Veličina distribucije uključujući TweakGDS: 1,2 Mb Copernic Desktop Search

Kliknite na sliku za povećanje

Programsko sučelje izaziva izuzetno pozitivne emocije - sve je učinjeno u skladu s općeprihvaćenim standardima, ništa suvišno, jednom riječju lijep dizajn. Za početnike, razumijevanje sučelja Copernic Desktop Search bit će vrlo jednostavno. Iako je pomalo zbunjujuće da su dizajneri jasno kreirali sučelje programa uzimajući u obzir činjenicu da će program raditi u standardnoj temi Dizajn prozora XP. Kada koristite klasičnu temu, program ne izgleda tako lijepo. Ali ovo je više stvar ukusa.

Pri prvom pokretanju, program od vas traži da napravite indekse za pretraživanje. Činilo se pomalo neobičnim da nakon odabira mapa za indeksiranje program nije ponudio da pritisnete niti jednu tipku, poput “Pokreni indeksiranje”, a indeksiranje nije počelo automatski, tek tada je primijećeno da Copernic pokušava pokrenuti indeksiranje dok je računalo bio besposlen. Morat ćete malo dublje proučiti opcije programa kako biste sve ispravno konfigurirali. Treba napomenuti da ih ima poprilično dovoljno mogućnosti za postavljanje automatskog kreiranja indeksa: ugrađeni planer, mogućnost indeksiranja dok je računalo u mirovanju, u pozadini, s niskim prioritetom. Indeksiranje nije bilo prebrzo - 10 sati 51 minuta - ovo je sporije nego u drugim tražilicama (osim Issher, ali još uvijek Copernic brži razvoj iSleuthHound Technologies je red veličine.

Sada o strukturi indeksa. Općenito, nema ništa posebno u vezi s tim. Moguće je odabrati vrste datoteka, kako u općem tako iu detaljnom obliku. To jest, u početku možete odabrati što želite indeksirati - dokumente, slike, video zapise, glazbu. Na drugoj kartici prozora opcija moći ćete odabrati određene vrste datoteka prema ekstenziji. Dodatno, možete konfigurirati indeks tako da se, na primjer, slike manje od 16x16 ne indeksiraju ili zvučne datoteke kraće od 10 sekundi ne indeksiraju. Osim indeksiranja datoteka iz mapa, Copernic može raditi s e-poštom i kontaktima iz Adresar Microsoft Outlook i Microsoft Outlook Express, moguće je indeksiranje favorita i povijesti iz Internet Explorera.

Što se tiče mogućnosti pretraživanja, one su ovdje vrlo slabe. Tijekom testiranja čak je otkriveno da program ne traži dokumente u txt i html formatima na ruskom, omogućujući vam da ih pronađete samo po naslovima, a ne po sadržaju. Jedino što program pruža za poboljšanje učinkovitosti pretraživanja je korištenje standardnog skupa logičkih operacija, a čak i tada je ova značajka otkrivena eksperimentalno, budući da nije dokumentirana. Usput, ni uz pomoć programa nije sve u redu - dostupan je samo putem interneta, što je, vidite, vrlo nezgodno, pa čak i na internetu referentne informacije ne previše. Očigledno, programeri su odlučili da jednostavno sučelje programa ne podrazumijeva prisutnost normalne pomoći. Nastavljajući razgovor o mogućnostima pretraživanja, valja napomenuti da, unatoč slaboj analizi upita, program pruža zanimljiv sustav pretraživanja - korisnik može odabrati vrstu datoteka (slike, videozapisi, glazba itd.), unijeti pretragu upit i odabir atributa specifičnih za odabranu vrstu datoteke. Na primjer, za zvučne datoteke, to mogu biti vrijednosti iz mp3 oznaka (izvođač, album, datum itd.), za slike, na primjer, možete odabrati njihovu veličinu (prema razlučivosti), općenito, svaka vrsta ima svoju vlastite postavke. Nakon traženja određeni tip datoteke, program će prikazati vrlo informativan popis u prozoru s rezultatima, a ako vaš zahtjev uključuje datoteke drugih vrsta, možete ih otvoriti klikom na određenu poveznicu.

Zasebno je vrijedno spomenuti prozor za prikaz rezultata. Ispod popisa pronađenih datoteka prikazuje se sadržaj tih datoteka (slična shema se često koristi u klijentima e-pošte). Istina, gledanje teksta moguće je samo u izvornom formatu, a ne postoji način prikaza običnog teksta, što nije uvijek zgodno, jer otvaranje dokumenta u ovom slučaju traje više vremena. No, budući da Copernic može pretraživati ​​slike i glazbu, moguće je pregledavati te multimedijske datoteke.

Osnovni principi rada ovog programa su opisani, sada da vidimo što nam Copernic Desktop Search može ponuditi za rad s mrežom... U principu, možete gledati jako dugo, ali teško da ćete moći išta vidjeti . Drugim riječima, ovaj program nije trebao biti zasnovan na mreži. Copernic Desktop Search je isključivo kućna tražilica.

Očito je jedina (najlogičnija) primjena ovog programa kućno računalo. Ovdje će se u potpunosti nositi sa svim jednostavnim korisničkim upitima za pretraživanje koji se sastoje od jedne ili dvije riječi, pronađi potrebne informacije, te podjela pretraživanja po vrsti datoteke i podrška za multimedijske datoteke uz pozadinsko indeksiranje u načinu rada niskog prioriteta, zajedno s ugodnim sučeljem, samo daju snagu programu da stekne povjerenje među neiskusnim korisnicima.

Službena stranica
Veličina distribucije: 2,6 MbISYS Desktop

Kliknite na sliku za povećanje

Vrlo moćan program. Po razini opremljenosti svim mogućim funkcijama, tu je negdje blizu sljedećeg SearchInform sustava za pretraživanje na listi. U ovom slučaju veličina instalacijsku datoteku više od 40Mb! Teško je reći što bi se moglo ugurati u takve dimenzije, jer isti SearchInform, slične funkcionalnosti, zauzima 15Mb.

Proces instalacije ovdje također nije baš ugodan, točnije niti sam proces instalacije. Čak i prije preuzimanja programa, od vas će se tražiti da se registrirate, inače nema načina. Zatim, sučelje. Napravljen je jako lijepo, ništa nepotrebno ne upada u oči, međutim, to su dojmovi čovjeka koji se već donekle navikao na njega. Početniku neće biti lako dokučiti gdje se i što nalazi, gdje kliknuti i gdje na kraju tražiti. Preporučljivo je pročitati pomoć prije početka rada - uštedjet ćete puno živaca i vremena. Svemu ostalom također se dodaje potpuna odsutnost Podrška za ruski jezik u programu. Nije dobro. Osim toga, prozori ovdje nisu preopterećeni kontrolama, ali su to morali platiti višestrukim modulima i korištenjem dodatni prozori. Na primjer, upiti za pretraživanje unose se pokretanjem jednog programa, a upravljanje indeksom se vrši pomoću drugog programa. Ovdje se također unose upiti za pretraživanje u zasebnim skočnim prozorima. Teško je reći što je bolje - preopterećeno sučelje ili sveprisutni prozori s više prozora; radije, to je stvar ukusa.

Kada je riječ o stvaranju indeksa, program nudi značajke za pojednostavljenje postupka postavljanja opcija za novi indeks. Ove značajke uključuju nekoliko gotovih predložaka za izradu indeksa za mape "Moji dokumenti", "Pošta", "Pošta i dokumenti", "Određena mapa", "Mapa s izborom vrsta datoteka" itd. Takvi predlošci pojednostavljuju izrada indeksa u prvoj fazi. Uslužni program za rad s indeksima nema baš dobro sučelje, što je pomalo zastrašujuće (ovo je prilično subjektivna procjena, da budem iskren), međutim, kada ga pogledate, pruža mnogo korisnih mogućnosti i, općenito, njegovo korištenje nije osobito teško. ISYS Desktop može indeksirati podatke iz različitih izvora podataka, a također nudi mnoge fleksibilne postavke za takvo indeksiranje. Među dodatne mogućnosti za indeksiranje: podrška za SQL, FTP, TRIM Context, WORLDOX 2002, skripte. Prilikom izrade indeksa, ako ste odabrali stavku "Mapa s izborom vrsta datoteka", imate mogućnost ručno odabrati vrste datoteka za indeksiranje (po ekstenziji). Mora se reći da jednostavno postoji ogroman broj podržanih vrsta datoteka, ali nećete moći dodati vlastitu vrstu (ekstenziju) na postojeći popis. Također možete primijetiti prisutnost planera indeksiranja. Izrada indeksa i obrada 20 gigabajta informacija ISYS Desktop-u je trajala 6 sati i 13 minuta, u konačnici je pokazao dobro vrijeme i veličinu kreirane datoteke - 7,9 GB.

Mogućnosti pretraživanja ovog programa su prilično dobre. Ono što se koristi u ISYS-u mnogo je moćnije uobičajena podrška logičke operacije. Među mogućnostima naprednog pretraživanja, program nudi korištenje sinonima i filtar za sortiranje (prema putu, nazivu i datumu stvaranja datoteke). Kit logički operatori nešto širi od standardnog skupa. Osim logičkih operacija, program vam omogućuje rad s mnogim drugim operatorima, koji u načelu mogu zamijeniti neke vrste pretraživanja; na primjer, pretraživanje s parsiranjem može se u potpunosti zamijeniti korištenjem posebnih operatora. Bio sam jako iznenađen što program nema pretraživanje pomoću morfologije. Ovo je ozbiljan propust, budući da se učinkovitost pretraživanja znatno poboljšava korištenjem morfološke analize. Osim toga, ne postoji popis značajnih riječi, ali postoji opširan popis beznačajnih riječi. Najavljene su i funkcije pretraživanja kao što su "približno pretraživanje" i "heuristička analiza".

ISYS nudi izbor nekoliko vrsta upita za pretraživanje, odnosno vizualnih vrsta. To se radi korištenjem različitih tipova prozora za unos upita za pretraživanje, međutim, zapravo niti jedan prozor ne dopušta korištenje drugih tehnologija osim gore navedenih.

Rezultati pretraživanja su vrlo informativni i prikazuju se kao popis dokumenata poredanih po važnosti. Dolje je prikazan pregled odabranog dokumenta. Za razliku od Copernic Desktop Searcha, ovdje je pregled dostupan samo u obliku običnog teksta; nije bilo moguće prikazati dokumente u izvornom formatu, bilo da se radi o Wordu, Html-u ili PDF-u, iako to, u načelu, nije previše kritično. Program vam omogućuje da pronađene dokumente podijelite u grupe prema određenim kriterijima (prema zadanim postavkama podijeljeni su po relevantnosti). Također možete pogledati dokumente koji su već pronađeni odabirom pojedinačnih mapa (ovo je zgodno kada je rezultat vrlo veliki broj dokumenti).

Korištenje programa na korporativnoj mreži također je vrlo opravdano, jer pruža dobre mogućnosti za organiziranje pretraživanje mreže. Sustav pretraživanja temelji se na izradi javnog indeksa koji sadrži indeksirane podatke iz javno dostupnih online izvora.

Zapravo, program iz ISYS-a je vrijedan pažnje, barem upoznavanja s njim. Ovaj program je zreo projekt s ogromnim brojem funkcija (ne uvijek i ne svi, naravno, trebaju ih, ali ipak). Nepoznate su šanse da će program doživjeti neka poboljšanja u pogledu obrade upita za pretraživanje, ali ovaj trenutak može se preporučiti za gotovo univerzalnu upotrebu. A s obzirom da je još uvijek pretežak za kućne sustave, glavna mjesta za njegovu ugradnju su korporativne mreže.

Službena stranica:
Veličina distribucije: 40 MbSearchInform

Kliknite na sliku za povećanje

Vjerojatno ne vrijedi odmah započeti s opisom sučelja SearchInform. Prvo trebamo opisati proces instalacije, odnosno jedan njegov detalj: ne možete instalirati program bez internetske veze. Činjenica je da prije prvog pokretanja program zahtijeva registraciju korisnika (besplatno) i šalje sve unesene podatke na poslužitelj. Očigledno, programeri su morali poduzeti takve mjere u borbi protiv piratstva, ali to nije imalo pozitivan učinak na jednostavnost instalacije.

Sučelje programa dizajnirano je u skladu sa svim općeprihvaćenim pravilima, ali je na prvi pogled pomalo glomazno. Prvim korištenjem programa čini se da je prekompliciran, ponekad se nije lako sjetiti u kojem se izborniku ili na kojoj kartici nalazi željena opcija, no s dužim korištenjem sučelje više ne djeluje tako užasno složeno . Glavno je prvo pročitati potvrdu.

Nakon što ste malo razumjeli sučelje, možete početi stvarati indeks. Sam proces je vrlo jednostavan, a brzina indeksiranja, čak i na oko, znatno je veća od svih ostalih tražilica u recenziji. Jasne brojke testova pokazuju da je SearchInform dvostruko brži od dtSearcha i iSYS-a u smislu brzine indeksiranja! Program je indeksirao dostavljene podatke u količini od 20 gigabajta u rekordnom vremenu od 3 sata i 17 minuta. A veličina stvorenog indeksa pokazala se najmanjem od 4,4 GB - 100 megabajta manje od Google Desktop Searcha.

Program podržava, uz obične datoteke i mape, i indeksiranje e-pošte, povezivanje i indeksiranje baza podataka (!) i dr. vanjski izvori(DMS, CRM), odmah tijekom indeksiranja možete odrediti rječnik za provođenje morfološke pretrage, a svi atributi datoteke mogu se indeksirati. Nakon izrade indeksa, prilikom pokušaja prve probne pretrage dokumenata, mogli biste postati pomalo zbunjeni: "ovdje postoje dvije vrste pretraživanja, ali koja mi treba?" Kao što je ranije spomenuto, glavna stvar je pročitati pomoć, tada će sve postati jasno. Program zapravo može provoditi dvije vrste pretraživanja - pretraživanje izraza i pretraživanje dokumenata koji su po sadržaju slični tekstu upita.

Opis svih glavnih funkcija za analizu upita za pretraživanje dat je gore, tako da ćemo sada samo navesti mogućnosti pretraživanja koje nudi ovaj program. Počnimo s pretraživanjem izraza: naravno, morfološko pretraživanje, pretraživanje citata, logičke operacije, pretraživanje raščlanjivanjem riječi (traži se na početku riječi, na kraju, u središnjem dijelu ili potpuno podudaranje), pretraživanje miješanih citata ( kada sve riječi iz upita moraju biti prisutne u dokumentu, ali ne nužno unesenim redoslijedom), pretraživanje s ispravljanjem pogrešaka, korištenje sinonima, “skoro citatno pretraživanje” (tražiti unesenu frazu kao citat, ali druge riječi mogu biti prisutan između unesenih riječi), itd. Neke od navedenih opcija imaju svoje specifične postavke. Osim toga, moguće je koristiti i rječnik nevažnih riječi, a program već ima spremna lista te riječi za pretraživanje možete koristiti i rječnik prioritetnih riječi (naravno, morat ćete ga ispuniti sami).

Ovdje smo, u načelu, ukratko pregledali sve glavne značajke pretraživanja izraza.

Prijeđimo na razmatranje značajki ovog programa - traženje sličnih dokumenata. Programeri tvrde da ovo nije jednostavno pretraživanje teksta, to je upravo "potraga za sličnim" - to je točno kako je opisano svugdje, ali dobro, možete to zvati kako god želite - glavna poanta je . Kratka pretraga na Internetu može brzo otkriti da tzv. "slična pretraga" - novi razvoj u analizi teksta. Ovaj sustav vam omogućuje da pronađete tekstove koji su slični u semantičkom sadržaju. Najugodnije je bilo to što se nakon provođenja testnih upita za pretraživanje pokazalo da se teorija prilično dobro podudara s praksom! Program zapravo traži dokumente sličnog sadržaja i prikazuje ih na popisu, sortirajući ih po postotku sličnosti.

Zatim, pogledajmo što SearchInform (osobito njegova korporativna verzija SearchInform Corporate) nudi za rad na korporativnoj mreži. Postoje dvije vrste aplikacija: poslužiteljska i korisnička. Serverski dio Automatski obrađuje navedene indekse, a korisnici ih mogu koristiti za pretraživanje, ovisno o pravima pristupa koja su im dodijeljena. Korisnici se mogu automatski konfigurirati pomoću vjerodajnica Windows unosi(u profesionalnom smislu, SearchInform koristi NTFS Windows autentifikacija), i ručno (korisnici će se morati dodati zasebno). Svakom korisniku se može dopustiti ili zabraniti pristup određenim indeksima, a korisnici se također mogu kombinirati u grupe. Općenito, postavke SearchInforma za rad na mreži ispred su Googlea u smislu fleksibilnosti, a Ishhound Server u smislu pogodnosti i jednostavnosti.

Službena stranica:
Veličina distribucije: 14,7 Mb Usporedba brzina indeksiranja

Sustav pretraživanjaVrijeme indeksiranjaVeličina indeksa
Bloodhound Prof Deluxe 4.538 sati 46 minuta19 GB
Isys Desktop 7.06 sati i 13 minuta7,9 GB
DtSearch 7.06 sati i 3 minute8,6 GB
Google Desktop Search Enterprise8 sati i 17 minuta4,5 GB
Copernic Desktop Search *10 sati 51 minuta7 GB
SearchInform 1.5.023 sata i 17 minuta4,4 GB

* Većina dokumenata u dokumentima.html i .txt koji sadrže ruski tekst, iako su bili indeksirani, bilo je nemoguće pronaći osim po njihovim nazivima. Sažetak

Svi programi su vrijedni pažnje.

Na temelju testova i pažljivog ispitivanja svakog programa predstavljenog u pregledu, mogu se izvući određeni zaključci. Dakle, Google Desktop Search Copernic Desktop Search sasvim je prikladan za neiskusnog korisnika kao kućni sustav za pretraživanje informacija. Oni rade dobar posao sa jednostavni upiti, neće preopteretiti korisnika postavkama i, štoviše, potpuno su besplatni. Googleov pokušaj da uđe na tržište korporativnih tražilica još nije opravdan: jer punopravni rad program treba učitati dodatnim modulima, a nije ga lako postaviti. Stoga samorazumljivi nazivi Desktop Search, Copernic i Google iza sebe zadržavaju nišu "stolnih" tražilica.

Istina, snažnija rješenja - dtSearch, iSYS i SearchInform također nisu sigurna i korisnicima nude svoje "desktop" verzije. Ali po razumnoj cijeni, za razliku od besplatnog softvera Googlea i Copernica. Naravno, morate platiti za snagu, brzinu i funkcionalnost. Ali glavni fokus programera dtSearch, iSYS i SearchInform je, naravno, na korporativnom sektoru. Umrežavanje, funkcionalnost, indeksiranje i brzina pretraživanja su ono što razlikuje ove proizvode od njihovih "konkurenata". Na temelju rezultata testa identificiran je favorit - SearchInform. Program pruža mogućnost pretraživanja sličnih dokumenata, ima najbrže indeksiranje i brzine pretraživanja te ima dobar skup funkcija.