24 Stunden Zeitgeist

Google hat mal wieder einen eigenen Jahresrückblick veröffentlicht und unter dem Namen Google Zeitgeist 2012 ins Netz gestellt. Wonach hat Deutschland im letzten Jahr gesucht und wofür haben sich die Deutschen eigentlich so interessiert. Den Google Zeitgeist kann man hier nachlesen.

Aufgeteilt ist der Zeitgeist in dir folgenden Gruppen:

  • Suchanfragen mit dem größten Wachstum
  • Personensuchen mit dem größten Wachstum
  • Meist gesuchte Songs
  • Meist gesuchte TV Shows
  • Meist gesuchte Reiseziele
  • Bildersuchen mit dem größten Wachstum
  • Technikgeräte mit dem stärksten Wachstum
  • Meist gesuchte Bundesliga Clubs
  • Meist gesuchte Automarken
  • Meist gesuchte deutsche Politiker
  • Meist gesuchte Städte in Google Maps
  • Meist gesuchte Athleten
  • Meist gesuchte Orte in Google Maps

 24 Stunden Zeitgeist

Diesen Jahresrückblick habe ich mal zum Anlass genommen, ein lange geplantes Projekt von mir zum Abschluss zu bringen. Denn seit ca. einem Jahr sammle ich auch Zeitgeist Daten. Allerdings nicht für ein ganzes Jahr, sondern stundenweise. So kann ich für jede Stunde des Tages einen eigenen Zeitgeist erstellen.

Das Ergebnis dieser Arbeit kann unter http://m-software.de/zeitgeist aufgerufen werden. Einige Daten sind mir noch nicht ganz klar, so finde ich z.B. momentan immer den Begriff “Vores Øl” auf Platz 1 und auch einige andere Suchbegriffe in dem Zeitgeist müssen noch einmal genauer beleuchtet werden, aber alles in allen ist hier schon viel über das Verhalten der Deutschen zu erkennen. So kann man hier ablesen, was abends im Fernsehen gesehen wird und welche Themen gerade durch die Medien gehen.

Die Daten kommen leider immer mit etwas Verzögerung auf der Webseite an, da hier einiges an Rechenpower aufgebracht werden muss, um die Daten zu sammeln, aufzubereiten und in einer einigermaßen brauchbaren Geschwindigkeit zur Verfügung zu stellen. Aktuell gibt es eine Verzögerung von ca. 2-3 Stunden. Ich arbeite aber daran, das ganze System noch weiter zu optimieren und in Zukunft noch aktueller zu werden. Allerdings sehe ich hier einen deutlichen Vorsprung gegenüber dem jährlichen Zeitgeist von Google :-) .

Die Technik hinter dem Zeitgeist

Wie immer wenn ich was neues entwickelt habe verliere ich auch ein paar Worte zur Technik.

  • Die spannendste Frage ist natürlich. “Woher sind die Daten?”. Die Antwort ist so langweilig, dass ich sie mir hier spare.
  • In den letzten 12 Monaten hat mein Zeitgeist Information Retrieval Prozess 14,708,474 Datensätze in eine MySQL Datenbank geschrieben und es werden stündlich mehr.
  • Ich habe auch einen JSONP Webservice gebaut, der auch die Webseite http://m-software.de/zeitgeist mit Daten versorgt.Wenn ich ein wenig mehr Informationen über die Performance und die Stabilität gewonnen habe, werde ich den  JSONP Zeitgeist Webservice evtl. auch der Öffentlichkeit zur Verfügung stellen. Wer gerne schon mal einen Blick darauf werfen möchte, ist herzlich eingeladen. Einfach unten einen kurzen Kommentar hinterlassen. Ich schicke Dir dann den URL und ein paar Zeilen Demo PHP-Code zu.

Zeitgeist Beispiele

Hier noch ein paar schöne Beispiele, die sehr gut verdeutlichen, was der Zeitgeist macht.

Das Interesse an dem Begriff Weihnachten der letzten 90 Tage (Stand 13.12.2012)

Hier ist sehr gut zu erkennen, dass das Interesse an Weihnachten stark steigt.

 

Das Interesse an dem Begriff Dr. House der letzten 90 Tage (Stand 13.12.2012)

Das Interesse an Dr. House ist genau einmal in der Woche recht hoch …. wie kommt das denn? Scheint eine Serie zu sein, die vor allem in der letzten Woche sehr viel Interesse im Internet erregt hat. Warum? Keine Ahnung, ich schaue diese Sendung nicht.

Das Interesse an Frank Zander der letzten 90 Tage (Stand 13.12.2012)

Frank Zander kenne ich noch aus meiner Jugend – habe oft und viel über ihn gelacht, warum der noch immer von Zeit zu Zeit in der Statistik erscheint ist mir schleierhaft. Vermutlich hatte er einen Auftritt im Fernsehn oder so. Jedenfalls war das Interesse an Frank Zander vom 11.12.2012 23:00 Uhr bis zum 12.12.2012 deutlich höher als in den letzten 90 Tagen.

So, genug geschrieben. Nun muss ich ins Bett – gute Nacht!

Comments

  1. Mike Hutner says:

    Na da hast Du mal wieder eine interessante Idee, gerne freue ich mich über eine kurze Mail mit den Daten.
    Das dänische Open Source Bier “Vores Øl” mit Koffein sollten wir aber auf jeden Fall mal probieren.
    Dass Frank Zander (mittlerweile 70!) eine Weihnachtsfeier für Obdachlose organisiert hat, ist sicher sehr schön, aber dass deshalb so stark nach ihm gesucht wird?
    Na wie Du schon schreibst, sind doch einige Fragezeichen in den Stats…

    • Michael Jentsch says:

      Leider muss ich zugeben, dass die Begriffe nicht ganz repräsentativ sind. Vor allem die Shopping Keywords (iPhone, Schuhe und Waschmaschinen) fehlen hier, da ich zu den meisten Suchbegriffen hier keine Infos habe. Ich habe hier leider nur Zugriff auf das Interesse an den sog. “Information Queries”. Wer seinerzeit die Google Search Quality Rating Guidelines gelesen hat, weiß sicher noch worum es geht. Zitat: “An information query seeks information on a topic. Users want to know something; the goal is to find information.”
      Was die Daten zu den Action Queries – “Do” und die Daten zu den Navigation Queries – “Go” angeht, kann ich nur hoffen, dass sich mir hier irgendwann auch ein Türchen öffnet und ich eine passende Datenquelle finde. Ideen nehme ich gerne an :-)

  2. Jasmin says:

    Hi, das finde ich alles hochspannend und interessant. Aber zu den Fragezeichen die da bleiben fällt mir nur Churchill ein: “Ich glaube nur der Statistik, die ich selbst gefälscht habe…”

Speak Your Mind

*


*

"));