Za iskanje ne uporabljamo vedno popolnih podatkov (npr. priimek, ime ...). Večinoma uporabljamo nepopolne podatke (npr. priimek, besede iz naslova dokumenta, besede iz izvlečka, besede iz polnega besedila).

Združevanje besed

Zamislimo si podatek kot vzorec, ki je sestavljen iz nekaj besed. Računalnik obravnava vzorec kot podatek. Iskano besedilo mora vsebovati ta vzorec, da se uvrsti v seznam zadetkov. Običajna je naslednja razvrstitev vzorcev:

Nabor besed

Dve ali več besed lahko združimo v nabor. Med zadetki iskanja so vsi tisti zapisi, ki vsebujejo vse besede iz nabora. Položaj besed v naboru ne vpliva na zadetke iskanja.

Primer 1: Združevanje besed in vrstni red

Več besed lahko združimo v nabor, vrstni red besed v naboru pa ni pomemben: znanost filozofija [slika 1] ali filozofija znanost [slika 2]. Zadetki iskanja so v obeh primerih enaki.

Vzorci

Zamislimo si besedilo kot zaporedje besed. Vzorec, ki bi omogočal iskanje tega besedila, bi sestavljale iz besedila izbrane besede. Tako oblikovan vzorec bi dal zadetke tudi za druga besedila, ki vsebujejo ta vzorec. Če omejimo dopustne razdalje med besedami v vzorcu, vzorec bolje prilagodimo iskanemu besedilu, število zadetkov pa se zmanjša. Razdaljo med dvema besedama v besedilu merimo s številom besed, ki so med njima. Vrstni red besed v vzorcu včasih ni pomemben.

Za podajanje razdalje med besedami v vzorcu uporabimo posebne operatorje, imenovane operatorje bližine (imenovani tudi kontekstni operatorji). Operatorjev bližine je veliko. V COBISS+ se uporablja operator bližine NEAR, za katerega se uporablja okrajšava N. Operator bližine NEAR dopušča, da sta besedi v besedilu v poljubnem vrstnem redu.

Primer 2: Operator bližine NEAR

IIskalni vzorec z operatorjem bližine NEAR lahko zapišemo na primer tako: relativnosti n teorija [slika 1] ali teorija n relativnosti [slika 2].

Proizvajalci baz podatkov razvrščajo operatorje bližine različno. Običajno jih razvrščajo v kategoriji:

Fraze

Zaporedje besed obravnava računalnik kot frazo. Fraze omogočajo oblikovanje najbolj določenih podatkov za iskanje (daljša kot je fraza, manjše je število besedil, ki to frazo vsebujejo). Vrstni red besed v frazi je torej pomemben. Frazo podamo med narekovajema.

Primer 3: Frazno iskanje

V frazi uporabimo tudi ločila [slika].

COBISS

V COBISS+ nadomestimo posebne znake (, ), *, :, [, ], <, >, =, # v frazi s presledki. Na začetku ali na koncu fraze pa jih izpustimo. V osnovnem iskanju lahko oblikujemo frazo na dva načina (gl. Iskanje - Osnovno iskanje).

Primer 4: Frazno iskanje diakritični znaki in ločila

V fraznem iskanju lahko uporabimo nadomestne znake tako za znak z diakritičnim znamenjem, kot tudi za ločila [slika].

COBISS

V COBISS+ lahko tako združujemo besede in fraze samo v osnovnem načinu iskanja; v izbirnem in ukaznem načinu iskanja uporabljamo za združevanje podatkov iskalne operatorje.

Primer 5: Združevanje besed in fraz

Besede in faze lahko v istem iskanju uporabimo le v obrazcu za osnovno iskanje [slika].

Nadomestni znak

Ko oblikujemo podatek za iskanje, ne poznamo vedno pravilne oblike (npr. pravilno črkovanje besede). Znake v podatku, glede katerih nismo prepričani, lahko nadomestimo z nadomestnim znakom. Nadomestnih znakov je več (glede na vlogo, ki jo imajo v oblikovanju podatka).

Kadar uporabimo nadomestni znak * na koncu podatka, govorimo o krajšanju.

COBISS

V iskalnih izrazih za COBISS+ uporabljamo nadomestni znak *, ki lahko stoji na začetku, v sredini ali na koncu podatka.

Primer 6: Nadomestni znak

Z uporabo nadomestnega znaka * lahko besede tudi krajšamo (npr: stol, stolp, stoletje,...) in tako zajamemo več oblik sklanjatev iskane besede (npr: klop, klopni, klopnega) [slika 1]. Nadomestni znak lahko uporabimo tudi v sredini besede [slika 2].

Tudi podatek, določen z nadomestnimi znaki, lahko pojmujemo kot vzorec, saj določa množico besed (npr. podatek colo*r* določa besede: color, colors, colour, colours, …). Takšno pojmovanje omogoča enostavnejše oblikovanje iskalnih izrazov.