Názorné vysvětlení rozdílu mezi Google a mnou - Kuličky a míče
Videorozhovor o Novém hledači na zive_cz

projekt_2.jpg
Motto 1: Již 15 let se v hledání na Internetu skoro nic nezměnilo."

Motto 2: Existující hledače hodnotí WWW stránky. Já hodnotím něco jiného."
Novinka – minihledač je hotov:  Celkové vyhodnocení
Metodologie relevance:
Jak rozlišit správné a špatné linky
Analýza: Moje množiny versus PageRank a Panda
Rozsah: 35 programů, cca 70000 hrubých a 30000 čistých řádků zdrojáku, 1.5 milionu znaků.

flag_usa_big.jpg


Dobrý den,

toto je projekt o lepším hledání na Internetu, tedy o pořadí nalezených WWW stránek. Projektem se zabývám cca 6 let. Již dříve jsem vymyslel nový princip a algoritmus hledání. Nyní jsem dokončil prototyp (minihledač, Hlodač), který obsahuje 35 programů, cca 70000 řádků zdrojového kódu. Konfigurace: 1 server (2x4procesor), 1 diskové pole (24T), Ubuntu, Apache, ZFS, databáze vlastní.

Stáhnul a zpracoval jsem cca 1 milion WWW stránek, cca 1 milion slov v češtině a angličině. Vyhodnotil jsem 60 jednotlivých slov a 246 slov pomocí Google CSE.
Výsledky (kvalita pořadí)
Pomocí jednotlivých slov: Hlodač versus Google +20 %, Hlodač versus Bing +29 %, Hlodač versus Seznam +17 %.
Pomocí Google CSE: Hlodač versus Google +17 %.

Link na vyhodnocení je uveden výše.

Nyní se snažím prodat můj (ověřený) algoritmus hledání společnosti Microsoft, Google nebo jinému vhodnému zájemci.

Základ projektu spočívá v tom, že jsem vymyslel princip a algoritmus hledání na Internetu, který je odlišný od stávajících hledačů (Google, Bing…). Při stanovení pořadí hodnotí stávající hledače WWW stránky, zatímco já hodnotím JINÉ OBJEKTY = tematicky spojené množiny komponent Internetu (WWW stránky, dokumenty, obrázky, audio, video…). Můj rozlišovací prostor je daleko širší, moje JINÉ OBJEKTY jsou větší než WWW stránky a vzájemně se od sebe liší mnohem více, než WWW stránky. Proto je moje pořadí lepší.

Pracovní dokumenty:
Portál Nový Hlodač (zatím jen ukázky): typy WWW stránek - návštěvnost.
Ukázky: domovská stránka - výsledek hledání - další výsledky hledání - pracovní prostředí - programy - program - robots - unsorting - zrychlování.
Technologie: dotazy - dokumenty - WWW odkazy.

Zdraví
Ing. Petr Hejl, CSc., Ondrouškova 15, 63500 Brno, tel.: 608 374 535, email:
phejl@lednice.org


Dokumentace, WWW odkazy:


Souhrn - Business plán


Souhrny: technologiebusiness


Klíč - Nepodvádím


Analogie


Historie (jak jsem na to přišel)


Vysvětlení principu hledání


Grafické vysvětlení principu hledání


Vysvětlení algoritmu hledání


Pořadí


Anti SEO spamming


Rozdíl v kvalitě


Příklady:
"cars","Morava", "Mikulov"


Konfigurace hardware


Konfigurace databáze


Rozpočet


Smlouva 1 milion Kč


Smlouva 100 tisíc Kč


Smlouva 10 tisíc Kč


Výklad ke smlouvě


Alternativa „Nový český hledač"


Alternativa - rozpočet


Korespondence s Microsoftem


Názor šéfa fulltextu na Seznamu


Křišťálová Lupa


Foto 1 - Foto 2 - Foto 3 - Foto 4 - Video


Start-up servery


WWW odkazy


O mně (stručné CV)


Google


Yahoo


Bing


Seznam

 

 

kristalova_lupa_petr_hejl.jpg kristalova_lupa_petr_hejl_2.jpg
Zdroj fotografií: lupa.cz. Fotografie byly zveřejněny s laskavým svolením společnosti Internet Info, s.r.o.

© Petr Hejl (s výjimkou fotografií z Křišťálové Lupy).