[Seeky] Datenbanken bei Suchprojekt

Niels Dettenbach nd at syndicat.com
Di Apr 13 11:04:01 CEST 2010


Hallo Immanuel,


vielen Dank für Deinen Vorschlag.

On Tuesday 13 April 2010 10:50:37 Immanuel Kühnle wrote:
> . Main-DB-Server:
> Dieser Datenbank-Server nimmt die eigentlichen Suchanfragen entgegen. Durch
> die eingegebenen Suchbegriffe wird eine/mehrere Themenkategorie/en
> ermittelt. In der Kategorien-Datenbank ist jede Kategorie mit einem anderen
> Server verknüpft.

In meinem Konzept übernimmt die Aufgabe eine Art "Request Router", der 
Anfragen analysiert und entscheidet, welche "Quellen" wie zu begfragen sind 
(Quellen können höher stehende Indizes oder Harvester-Indizes "an der Basis" 
sein).

Werde das in meinem Designvorschlag noch zeigen. Du beginnst aber immerhin in 
eine ähnliche Richtung zu denken... ;)

> 2. Themenspezifische Datenbanken:
> Auf verschiedenen externen Servern wird eine themenspezifische Datenbank
> angelegt, welche die eigentlichen Suchergebnisse und Indizes enthält. Die
> "Themenserver" nehmen vom Main-Server die weitergeleiteten Suchanfragen
> entgegen und führen die eigentliche Suche aus.
Nicht jede Suche ist "thematisch" (wohl der geringere Teil) - dennoch sollen 
auch "thematische" Abfragen möglich sein. Diese können wiederum über eigens 
bereitgestellte Indizes realisiert werden, die sich mit der "thematischen" 
(bzw. semantischen) Indizierung beschäftigen.

Anwender können quasi selbst bestimmen, welche Indizes sie für ihre Suche 
verwenden wollen. Ebenso kann es offene wie kommerzielle Indize-Betreiber 
geben. Ein Indize könnte ggf. auch ein "per Hand" gepflegter "Webkatalog" 
sein, wie man ihn von Yahoo! , web.de oder dmoz.org kennt. Der Phantasie sind 
da nur wenige Grenzen gesetzt. 

Offenheit ist daher höchstrangig wichtig. Wir sollten auch überlegen, wie das 
Suchen der Zukunft eigentlich aussehen kann oder sollte - wie weit man da 
konzeptionell neu rangehen kann oder gar muß. Die Grenzen der heutigen 
kommerziellen Anbieter sind ja bereits absehbar bzw. da.
 
> Durch dieses Prinzip würde eine Hierarchie aufgebaut. Desweiteren wären die
> Suchergebnisse besser "sortiert" und man müsste nicht alle Server
> durchsuchen lassen.

Es wird wohl in jedem Fall eine Art (offene!) Hierarchie geben müssen. Meinen 
Ansatz dazu zeige ich in meinem Vorschlag.


Beste Grüße,


Niels.

-- 

---

  Niels Dettenbach
  ---
  Syndicat IT&Internet
  http://www.syndicat.com
  T.-Muentzer.-Str. 2, 37308 Heilbad Heiligenstadt - DE
  ---
  Kryptoinfo: 
  PGP public key ID 651CA20D
  Fingerprint: 55E0 4DCD B04C 4A49 1586  88AE 54DC 4465 651C A20D
  https://syndicat.com/pub_key.asc
  ---
-------------- nächster Teil --------------
A non-text attachment was scrubbed...
Name: nicht verfügbar
Type: application/pgp-signature
Size: 836 bytes
Desc: This is a digitally signed message part.
URL: <http://freidenk.org/pipermail/seeky/attachments/20100413/34d71b4e/attachment.bin>