Logika wyszukiwarek #1

in #polish6 years ago (edited)

mac-459196_640.jpg

[źródło: pixabay]

W tym krótkim artykule chcę Wam pokazać, jak oszczędzać czas i nerwy dzięki kilku prostym operatorom logicznym, których możesz użyć w globalnej wyszukiwarce (w tym przypadku w Google).

Pisałam tutaj o rozróżnieniu wyszukiwarek.
Krótkie przypomnienie: Google jest wyszukiwarką horyzontalną, globalną, czyli można powiedzieć że ślizga się w swoich wynikach po “zewnętrznej” warstwie Internetu i raczej nie sięga głębiej, do tak zwanego Deep Webu (o którym również napomknęłam w podlinkowanym wstępniaku).
Jest jednak kilka prostych trików, dzięki którym możemy przyspieszyć dotarcie do interesującej nas informacji.

Ścisłe dopasowanie, czyli cudzysłów.

Załóżmy, że chcemy znaleźć informacje o jakiejś osobie, weźmy np. imię i nazwisko. Wpisujemy w wyszukiwarkę

Wojciech Nowak

i co? Otrzymujemy 395 000 wyników.
Użyjmy cudzysłowu, wpisując

”Wojciech Nowak”

otrzymamy 121 000 wyników, czyli dość znacznie zawężone wyszukiwanie.
Skąd ta różnica?
Kiedy wpisujemy dwa słowa kluczowe bez żadnego operatora, zachodzi koniunkcja. Czyli otrzymujemy wyniki ze stron zawierających oba te słowa kluczowe, jednak niekoniecznie występujące razem. A my chcemy znaleźć wyniki gdzie występuje Wojciech Nowak a nie np. Adam Nowak i Wojciech Piech.
Ścisłe dopasowanie precyzuje wyniki do konkretnej frazy. Przydatne przy wyszukiwaniu cytatów, tytułów książek, artykułów, nazw własnych.

NOT czyli negacja

Wojciech Nowak to imię i nazwisko rektora Uniwersytetu Jagiellońskiego, ogólnie dość popularne zestawienie. Załóżmy że nie szukamy rektora UJ tylko jakiejkolwiek innej osoby o tym imieniu i nazwisku. Możemy zawęzić nasze wyniki wyszukiwania przy pomocy operatora NOT, czyli negacji. Negacja pozwoli wykluczyć wybrane słowo z wyników. Czyli jeśli wpiszemy w wyszukiwarkę

”Wojciech Nowak” -UJ -”Uniwersytet Jagielloński”

dostaniemy 107 000 wyników, bo wyrzuciliśmy z listy powiązania z UJotem.
Google jako symbol negacji akceptuje minusa (-).

Filetype i OR

Kolejnym pomocnym operatorem jest doprecyzowanie formatu wyników jakie chcemy otrzymać. Szukamy publikacji, dokumentów, artykułów w których występuje Wojciech Nowak, ale niekoniecznie rektora UJ.
Więc nasze zapytanie może wyglądać tak:

”Wojciech Nowak” -UJ -”Uniwersytet Jagielloński” filetype:pdf

dostajemy 4 110 wyników PDFów w których tekście będzie Wojciech Nowak.
Możemy rozszerzyć wyniki np. o pliki w formacie doc albo ppt. Z pomocą przyjdzie operator OR, czyli alternatywa.
Wpisujemy

”Wojciech Nowak” -UJ -”Uniwersytet Jagielloński” filetype:pdf OR filetype:doc OR filetype:ppt

i dostajemy 4 380 dokumentów w których występuje jakiś Wojciech Nowak bez powiązań z UJotem w formacie PFD LUB doc LUB ppt.
OR przydaje się, kiedy chcemy rozszerzyć wyniki wyszukiwania przy pomocy bliskoznacznych terminów.

Przy bardziej złożonych zapytaniach korzystamy z nawiasów okrągłych do grupowania.
Przykład:
Szukamy przepisu na obiad wegetariański, który w składzie ma ziemniaki i selera (bo to nam zostało w lodówce po niedzielnym, wegetariańskim rosołku)
Nasze wyszukiwanie będzie wyglądać:

"obiad wegetariański" (ziemniaki seler)

Otrzymujemy 848 wyniki z których możemy wyszperać przepis na obiad.

Powyższe operatory i zostały skonstruowane pod silnik Google.

Mam nadzieję że ułatwi Wam to nieco życie codzienne.
Do następnego!

Sort:  

Niby każdy wie o ich istnieniu, a z lenistwa się nie wpisuje operatorów...

To można traktować ten wpis jako przypomnienie, o!
Ogólnie operatory to potężne narzędzie, ale trzeba mieć nawyk ich używania i wprawę w dobieraniu ich w zależności od tego czego potrzebujemy. To już jest niezła ekwilibrystyka dnia codziennego.

Mam uwagę. Skoro tytułujesz swój wpis słowem logika, to warto być poprawnym co do reguł logiki formalnej.

Wyszukanie danej frazy bez operatorów to nie koniunkcja, tylko alternatywa. Jedno lub drugie. Wówczas takie zapytanie spełnia treść, w której występuje tylko jedno z dwóch słów kluczowych (lub więcej). Koniunkcja występuje właśnie przy użyciu operatora wyszukiwania ścisłego, kiedy to wszystkie elementy wyszukiwanej frazy muszą znajdować się w danej treści, aby została ona dopasowana.

Przydatne informacje dla każdego człowieka na Ziemi, który ma dostęp do Internetu i korzysta z sieci web. Dzięki za te informacje i szerzenie świadomego podejścia do informacji dostępnych (i wyszukiwalnych) w Internecie.

Warto dodać, że często tylko znajomość operatorów wyszukiwania w Google pozwala na pobawienie się w hackera i poszukiwanie w Internecie danych znajdujących się w źle umieszczonych na serwerze plikach (np. tabela z danymi klientów w formacie Excela). Wtedy wyszukujemy daną frazę w plikach nas interesujących i możemy wydobyć dane dla nas niepowołane. Pomijam legalność czy nielegalność i etyczny aspekt tego typu działań.

Przy wklepaniu kilku słów kluczowych bez żadnego operatora Google domyślnie ustawia AND i pokazuje strony zawierające wszystkie te słowa, więc to jest koniunkcja.
Alternatywa występuje tylko w przypadku celowego rozdzielenia słów operatorem OR.

Spójrz na opcję wyszukiwania zaawansowanego w Google, przy polu "wszystkie te słowa" jest podany przykład trójkolorowy rat terrier co wskazuje, że domyślnie stosowana jest koniunkcja.

Ta uwaga o niezabezpieczonych plikach jest interesująca, może mógłbyś to rozwinąć w artykule? Dla zwiększenia świadomości i bezpieczeństwa danych.

Google tak dobrze trafia z wynikami (śledzenie?), że operatory właściwie wypadły z użytku poza naprawdę wyselekcjonowanymi wyszukaniami. Ciekawe co będzie z presearch ;)

Jasne, przy codziennym, standardowym wyszukiwaniu przepisu na obiad używanie operatorów jest bez sensu, ale kiedy chcemy dotrzeć do głębszej, bardziej specjalistycznej informacji a nie znamy bezpośredniego źródła to operatory mogą się przydać. Zwłaszcza że jest ich dużo więcej, o czym będę pisać uparcie. :)

Na pewno takie informacje mi się przydadzą, gdy będę szukał specjalistycznych informacji do mojej pracy magisterskiej. Dzięki!

Jeśli chodzi o szukanie literatury naukowej to pokuszę się o oddzielny wpis na ten temat :)

Chętnie przeczytam :D

A z ciekawości, jaki kierunek, dziedzina pracy magisterskiej?

Kierunek gospodarka wodna, a praca na temat skuteczności działania oczyszczalni ścieków.

Bardzo przydatny post :)

Coin Marketplace

STEEM 0.35
TRX 0.12
JST 0.040
BTC 70884.24
ETH 3570.27
USDT 1.00
SBD 4.76