Imam jedan problem, pokušavam da ga rešim na različite načine, pa su svi predlozi dobrodošli.
Naime, imam nekoliko baza, neke su u Access2003, neke u MSSQL2005 formatu, struktura im je ista.
U svakoj se nalazi tabela "Poseta" u kojoj postoje polja "Ime" i "Prezime".
Imam posebno tabelu "Personal" koju sam importovao u svaku od ovih baza sa imenima i prezimenima (ima 109 lica, odnosno slogova).
Cilj je iz tabele "Poseta" iz svih baza (i ovih u Access2003 i MSSQL formatu) izvući sve ljude koji se nalaze u tabeli "Personal", reklo bi se ništa lakše od toga, idemo jednu po jednu bazu sa kverijem i gotovo.
U čemu je problem?
U tabeli "Personal" korišćeni su dijakritici (šđčćž), pa je tako Đorđe Petrović zaista Đorđe Petrović.
Međutim, u tabelama "Poseta" u bazama (a tabele "Poseta" imaju po nekoliko desetina hiljada slogova) su podaci bez ikakvog pravila -
Đorđe Petrović je negde ĐORĐE PETROVIĆ, negde DJORDJE PETROVIC, negde je ĐORĐE PETROVIC, negde je DJORDJE PETROVIĆ i sve ostale moguće i nemoguće kombinacije, pošto su aplikaciju za popunjavanje koristile tokom par godina različiti ljudi različitog stepena pismenosti raspoređeni na ta radna mesta.
Sad, ja sam primetio kod nekih search engine-a (Google, npr.), da kada je uslov za pretragu "Petrović" ili "Petrovic" daje kao rezultate pretrage i "Petrovic" i "Petrović". Suština mog pitanja je kako to oni rade?
Kako biste vi rešavali ovaj problem? Mislio sam da napravim još dva polja za ime i prezime u tabeli "Personal" sa imenima bez dijakritika, pa da pustim dva puta više upita, ali ni to ne garantuje dobar rezultat, baš zbog korišćenja slova Đ (negde su koristili DJ iako su pisali ĆŠŽČ), a postoje i nekonzistentnosti tipa MIŠKOVIC, MISKOVIĆ...
Sve ideje su dobrodošle.