BlogKontaktTagcloud

Wikipedia-Suchmaschine

Jimmy Wales, Gründer von Wikipedia, will zusammen mit Amazon eine Suchmaschine aufbauen. Wales sagt, in einem Artikel der Zeitung "Die Welt", das vier Mangel das Suchen im Internet zum Graus machen, nach ihm währen das: "Mangel an Freiheit, Mangel an Gemeinschaft, Mangel an Verantwortung, Mangel an Transparenz." Für micht trifft vorallem der letzte Punkt zu, irgendwie habe ich das Gefühl das Google meine Suchresultate meiner Herkunft anpasst ohne das ich gross Einfluss darauf hätte.

So wie es aussieht möchte Wales mit Wiki-Technologien eine Art Index oder Verzeichniss des Internets erstellen. Ich bin mir nicht so sicher ob dass funktionieren wird (obwohl ich manchmal ein wenig zu pesimistisch bin). Das sind meine Gründe warum das nichts wird:
  1. Das hat schon mal nicht funktioniert! (siehe DMOZ)
  2. Dieses Zeugs (Wiki, Verzeichnisse, ...) zieht Spamer magisch an
  3. Das Internet ist zu gross (und wächst zu schnell) um es "von Hand" zu indexieren
  4. Wiki-Technologie ist evtl. nicht die richtige Technologie für so ein Projekt (weil es zu viele Seiten, mit zu wenig Inhalt geben wird)
Ich glaube desshalb eher nicht an diese Idee. Meiner Meinung nach würde es mehr nützen bestehende Dinge (Blogs, bookmark-sites, Microformate, Bewertungssysteme, etc.)  in "klasische" Suchmaschinen einzuweben. Ein breites Verteilen der Datenquellen würde es für Spamer auch schwiriger machen die Suchmaschine zu manipulieren.
[via joblog]
Ähnliche Beiträge:
Ein Projekt mit Stolpersteinen
The future knocks
Geheimer Code?
Google zieht um
WikiWay2.0
Comments (0)  Permalink

Ein Projekt mit Stolpersteinen

In den letzen Semesterferien konnte ich für Stefan F. Keller, respektive dessen Institut int>e>gis, während einer Woche ein Projekt realisieren. Der Projektauftrag lautete Geodaten aus Wikipediaeinträgen zu extrahieren, zu speichern und anzuzeigen.

Das Programm sollte auf dem Toolserver laufen. Der Toolserver ist ein Server der deutschen Mediawiki Foundation welcher von Sun gesponsert wurde. Auf diesem Server sind die Wikipedia-Datenbanken gespiegelt und er steht interessierten Entwicklern offen um Programme zur Weiterentwicklung von Mediawiki auszuprobieren.

Leider haben wir uns mit dem Entscheid für den Toolserver zu entwickeln auch einige Probleme eingehandelt. Zuerst hatten wir bei Projektstart keinen Login für den Server zur Verfügung was uns zwang zuerst auf einem lokalen Testserver zu entwickeln. Bereits bei der lokalen Entwicklung ergaben sich einige Problem. Da die Mediawiki-Software, welche Wikipedia betreibt, in PHP geschrieben ist wurde unser Projekt ebenfalls mit PHP entwickelt in der Hoffnung einige Mediwiki-Funktionen weiter zu verwenden. PHP erwies sich allerdings für diese Art von Projekt als relativ ungünstige Wahl da der PHP Garbage Collector nur sehr ungenügende Funktionalitäten bereit stellt.

Gegen Ende des Projekts stand dann der Zugang zum Toolserver bereit. Die Überaschung war dann um so grösser als ich dort Solaris als Betriebsystem antraf. Leider wurden auch nicht alle Daten des Wikipediaprojektes gespiegelt. Da einige Texte der Wikipedia-Datenbank ins Filesystem ausgelagert werden (der Grund dafür ist mir bis heute nicht bekannt) können diese nicht gespiegelt werden. Ich musste desshalb unser Tool so umprogrammieren das es die Daten über den Wikiproxy, einem Tool von Daniel Kinzler welches dieses Problem umgeht, geladen wurden. Dies sorgte natürlich für eine wesentlich schlechtere Performance.

Selbstverständlich habe ich auch etwas gelernt. Die "Lesson Learned" für dieses Projekt sind:

  • Früh deployen oder gar auf Zielsystem entwickeln
  • Bei kurzer Projektdauer müssen alle Ressourcen zu Beginn des Projekts bereitstehen
  • Wenn externe Datenbestände nötig sind ist deren Richtigkeit und Vollständigkeit möglichst früh abzuklähren
  • PHP eignet sich wegen ungenügendem Garbage Collector nur sehr eingeschränkt für lang laufende Skripte

Selbstverständlich sind die Resultate dieses Projekt auch Online einsehbar. Die Tabelle mit den Wikipedia-Koordinaten kann eingesehen werden. Ebenso ist es möglich Daten aus einer Koordinaten-Box auszugeben, wobei bei dieser Anfragen ist die Ausgabe aus Performancegründen auf tausend Punkte limitiert ist. Ebenso ist es möglich die fehlerhaften Koordinaten auszugeben, um diese Fehler zu korrigieren. Hier werden natürlich auch die Absichtlich falsch eingegeben Koordinaten, z.B. für Vorlagen, ausgegeben.

Und noch ein wenig off-topic: Viel einfacher währe es natürlich wenn wir die (Geo-)Daten vom Staat einfach bekomen würden, schliesslich haben wir mit unseren Steuergeldern bereits für deren Erhebung bezahlt. Mehr dazu hier und gleich bei der Petition für freie Geodaten mitmachen.

Ähnliche Beiträge:
Wikipedia-Suchmaschine
PHP Quine
What's php like?
Zend Framwork 1.5 is out
Coding Contest addicted
Comments (1)  Permalink

eBay rennt dem Social-Software-Zug nach

Die Information das eBay nun plötzlich Social-Software einsetzen will ist bereits vor einigen Tagen auf heise erschienen. eBay will sowohl Blogs als auch Wikis in ihre Seite integrieren. Das Wiki wird von Jimmy Wales (Wikipedia-Gründer) Firma wikia bereitgestellt werden.Ich persönlich frage mich ein wenig ob das bei einer Firma mit einem solchen Überwachungsdrang wie eBay, notabene natürlich auch mit einem solchen Potenzial für Missbrauch, funktionieren kann. Blogs für Verkäufer kann ich mir relativ gut vorstellen, ob das mit Wikis aber auch funktionieren kann erscheint mir fragwürdig. Der Überwachungsaufwand könnte sehr schnell ansteigen und die Angaben werden kaum verifizierbar sein. Änderungsschlachten zwischen Konkurzenten scheinen vorprogrammiert zu sein. Nichts desto trotz finde ich das ganze als Experiment natürlich sehr intressant und freue mich über erste Resumes.
Ähnliche Beiträge:
10 Ausreden um nicht zu bloggen
Fremdbloggen
Bye, bye bloggrrr!
twitter
Wikipedia-Suchmaschine
Comments (0)  Permalink
1-3/3