Alle Artikel in: Technologie

R im praktischen Einsatz: Interview mit Bruno Hopp, Teil 2

In Teil 1 unseres Gesprächs berichtete Bruno Hopp von den Anforderungen, die das Speichern und Nutzbarmachen von riesigen Datenmengen mit sich bringen. In der heutigen Fortsetzung sprechen wir über R, eine Datenbanksoftware, die in den letzten Jahren immer mehr begeisterte Anhänger fand. Die Open Source-Statistiksoftware und Programmiersprache R ist gerade dabei, den Markt für Statistiktools umzuwerfen. Sie nutzen R seit einigen Jahrent. Wie sind Ihre Erfahrungen? Das sind ganz hervorragende! Ich bin auf R aufmerksam geworden, als R noch bei Versionsnummer 1.10 herum dümpelte. Vor Jahren hatte ich für mich privat Linux als leistungs­starkes System entdeckt, aber es gab nur unbedeutende open-source Lösungen für empirischen Datenanalysen. Gretl gibt es für die Ökonometrie (Teil der Wirtschafts­wissenschaften), und Computer-Algebra Systeme wie Octave gibt es auch schon eine Weile. Leider sind sie in den Sozialwissenschaften bisher ungebräuchlich bis unbekannt. Unix und Linux wird oft von Menschen verwendet, die es nicht nur wegen seiner Offenheit schätzen (im Sinne von „kostenlos“), sondern die wirklich wissen, was sie da tun. Da hat man keine Angst, einen C-compiler, Perl oder Python zu …

R im praktischen Einsatz: Interview mit Bruno Hopp, Teil 1

Vor einiger Zeit stellte ich Ihnen an dieser Stelle die Statistiksoftware R vor. Nun habe ich mit Bruno Hopp gesprochen, der zum einen auf einen großen Erfahrungsschatz im Bereich der Datenanalyse zurückgreifen kann, und zum anderen die Vorzüge von Open Source-Software im allgemeinen und der freien Software R im besonderen sehr gut kennt und schätzt. Lesen Sie in Teil 1 des Interviews zunächst, vor welchen Herausforderungen Bruno Hopp in seiner täglichen Arbeit in einer der in den Sozialwissenschaften größten Datenbanksammlungen der Welt steht. In Kürze folgt Teil 2, in dem wir uns besonders über R unterhielten. Herr Hopp, am GESIS Leibniz-Institut für Sozialwissenschaften, an dem Sie seit vielen Jahren arbeiten, werden große Datenmengen gespeichert. Um welche Daten handelt es sich dabei? Es handelt sich um ca. 7000 (siebentausend) meist empirische Studien aus den Sozialwissenschaften nach 1945 zu den verschiedensten Themen, etwa Bildung, Einkommen, ökonomische Verhältnisse und politischen Einstellungen –  namentlich z.B. die Politbarometer, der ALLBUS (Allgemeine Bevölkerungs­umfrage), die Eurobarometer, der EVS (European Value Study). Ihre Zahl lässt sich nicht ganz präzise fassen, da wir regelmässig …

PostgreSQL: Entwickler Simon Riggs im Interview

Nutzen Sie OpenStreetMap? Telefonieren Sie via Skype? Oder spielen Sie World of Warcraft? All diese Angebote nutzen PostgreSQL, um ihre gewaltigen Datensammlungen vorzuhalten. Auch Banken, Regierungsbehörden oder Universitäten setzen auf das Open Source-Datenbanksystem, wie diese Liste der „Featured User“ zeigt. Nicht verwunderlich, denn PostgreSQL kann soviele Daten aufnehmen, wie der eigene Speicher hergibt – einige Petabyte sind das beispielsweise bei Yahoo!, das PostgreSQL zur Verarbeitung von Kundendaten einsetzt. Gleichzeitig läuft es stabil auf allen großen Serversystemen und kann frei erweitert und angepasst werden. Unsere britische Kollegin Josette Garcia hat gerade mit einem der PostgreSQL-Entwickler, Simon Riggs, gesprochen. In ihrem Interview wird eines der Erfolgsgeheimnisse von PostgreSQL klar: Eine Entwickler-Community, die routiniert und lösungsorientiert an dessen Weiterentwicklung arbeitet. „Jedes Jahr gibt es ein Major Release“, erklärt Riggs. „Wir überlegen, was dringend benötigt wird, entwerfen gemeinsam eine Lösung und implementieren diese dann.“ Nach einigen Tests sei der Code dann solide genug, um Eingang in PostgreSQL zu finden. Riggs bestätigt, dass PostgreSQL sehr häufig eingesetzt wird – und das ohne große Marketingstrategien. Die meisten Techies kennen PostgreSQL, und …

Was ist HTML5?

HTML5 ist die neueste Version der Markup-Sprache, mit der die älteren Versionen HTML 4.01, XHTML 1.0 und XHTML 1.1 abgelöst werden sollen. Obwohl die Entwicklung noch nicht abgeschlossen ist, sind viele HTML5-Elemente schon jetzt einsetzbar. Zeit also, die Neuerungen zu erkunden und sich fit für die Zukunft zu machen. Um Websites anzeigen zu lassen, die in HTML5 geschrieben wurden, brauchen Besucher lediglich einen modernen Webbrowser. Die jüngsten Versionen von Apple Safari, Google Chrome, Mozilla Firefox und Opera unterstützen bereits viele HTML5-Funktionen. Mobile Webbrowser, die auf iPhones, iPads und Android-Handys von Haus aus installiert sind, bieten exzellente Unterstützung für HTML5. Auch Microsoft hat angekündigt, dass die anstehende Version 9 des Internet Explorer einige HTML5-Funktionalitäten unterstützen wird. HTML5 ist glücklicherweise weitgehend rückwärtskompatibel, d.h., auch User, die eine HTML5-basierte Seite mit älteren Browsern ansteuern, können sie ansehen und nutzen. Die neuen HTML5-Funktionen setzen auf bestehenden Funktionen auf und ermöglichen es so, Ersatzinhalte für ältere Browser anzubieten. Die wichtigsten Neuerungen in HTML5 auf einen Blick Neue semantische Elemente: Schon seit Langem gibt es Bestrebungen und Initiativen, die sich dafür …

R – oder: Wenn es eine Programmiersprache in die New York Times schafft

Wieviele Programmiersprachen gibt es, denen sogar die New York Times einen begeisterten Artikel schenkt? Noch dazu, wenn sie sich dem als trocken verrufenen Feld der Statistik widmen? Die Open Source-Statistiksoftware und Programmiersprache R hat dies geschafft, und mehr noch: Die New York Times bezeichnet sie gar als „Lingua Franca“ der Datenanalysten und nennt mit Google, Pfizer und der Bank of America gleich einige prominente Anwender. Höchste Zeit also, sich einmal auf Spurensuche nach R zu begeben. Erster Anlaufpunkt: die Wikipedia. Der englischsprachige Artikel klärt mich auf, R basiere auf S. Ah ja, natürlich. Ich lese weiter: Die Professoren Ross Ihaka and Robert Gentleman begannen Anfang der Neunziger an der Universität Auckland, die unter Statistikern bekannte Programmiersprache S abzuwandeln. 1996 gab es dann die erste Version, seitdem wird R an immer mehr Hochschulen und Forschungseinrichtungen, aber auch im Unternehmensumfeld eingesetzt. Ich kenne SPSS als Statistiktool, außerdem gibt es noch das ebenfalls propretiäre “SAS” – die Software des gleichnamigen Anbieters ist quasi Standard. R versucht, SAS den Rang abzulaufen: In klinischen Studien beispielsweise – für die besonders …