Alle Artikel mit dem Schlagwort: R

R für Data Science

E-Book-Deal: R für Data Science

Gesammelte Daten in Erkenntnisse verwandeln: Das ist das Ziel jedes Forschers und Wissenschaftlers, jedes Entwicklers, jedes Produktmanagers und Werbers und wohl jedes Unternehmers. Was ließe sich erreichen, wenn man aus dem Wust an Einzelinformationen über ein Produkt oder über einen Kunden, über Prozesse oder über Geschehnisse, über Eindrücke und Gedanken ein klares Bild ableiten könnte? Moderne Data Science will genau das. Und mit der Datenbanksprache R gibt es ein Tool, das Antworten liefern kann. Hadley Wickham – Chief Scientist bei RStudio und Mitglied der R Foundation – und sein Co-Autor Garrett Grolemund – Statistiker, Lehrer und Master Instructor bei RStudio – führen in ihrem Buch „R für Data Science“ Studenten, Data Scientists und Datenanalysten durch den vollständigen Data-Science-Zyklus aus Datenimport, Bereinigung, Transformation, der Visualisierung und Modellierung sowie schließlich der Kommunikation der Ergebnisse mit R Markdown. Das Buch gibt die notwendigen Tools an die Hand, erklärt und ordnet ein. Und zwar nicht nach einer streng akademischen Reihenfolge, sondern immer genau dann, wenn eine Aufgabe in der Praxis ansteht. Es eignet sich auch für Programmieranfänger. Nur im Juni gibt’s das E-Book …

E-Book-Deal: Statistik mit R

Ein Buch für alle, die R zügig einsetzen wollen: Genau das schlug uns unser Autor Joachim Zuckarelli vor, als er von seiner Buchidee berichtete. Der Volkswirtschaftler arbeitet selbst empirisch – und als Unternehmensberater und Projektmanager stets mit hohem Praxisbezug. Und genau das ist es, wovon „Statistik mit R“ auch in hohem Maße profitiert. Zuckarelli hat hier ein Lehrbuch geschrieben, das nicht nur die Grundlagen der Sprache R vermittelt, sondern gleichzeitig zentrale Methoden der Statistik mit ihnen verknüpft. Auf den Punkt: Mit diesem Buch lernt Ihr gleich beides, auf einen Schlag. Ihr versteht die Zusammenhänge, wendet R an und lernt, wie Ihr mit R Daten organisiert, analysiert und auswertet. (Hier hatten wir Euch das Buch bereits vorgestellt.) Das E-Book gibt es im Januar günstiger – für 12,99 € statt 25,99 €. Wie immer ist die E-Book-Aktion nur auf einen Monat begrenzt, dafür könnt Ihr das E-Book aber in jedem Shop Eures Vertrauens kaufen, der Preis ist überall gleich. Unsere E-Books sind natürlich DRM-frei.

Statistik mit R

Neuerscheinung: Statistik mit R

„Dieses Buch ist nicht einfach ein Buch über R. Auch nicht über Statistik. Es ist ein Buch über Statistik mit R“, leitet der Volkswirt, Projektmanager und Autor Joachim Zuckarelli sein Buch ein.  Denn Zuckarelli will eines: Anwendungsorientierung. Statistische Konzepte erklären und sofort in R umsetzen. Ergebnisse interpretieren. Systematisch in die Statistik einführen. Aber: keine Methoden diskutieren. Keine theoretischen Erörterungen der Sprachkonzepte von R. An der Stelle unterscheidet sich das Buch deutlich von reinen Statistik- bzw. R-Handbüchern sowie -Tutorials oder Online-Foren. Zuckarelli bleibt nah an der Praxis – geht zum Beispiel auf die häufigsten Fehlermeldungen ein – und verfolgt dabei einen didaktisch sinnvollen Lehrplan.  Wer sollte es lesen? Alle, die R zügig für ihre Arbeit einsetzen wollen. Dabei spielt es keine Rolle, ob damit wissenschaftliche Arbeiten angefertigt oder Marktforschungsdaten aufbereitet werden sollen. Ob Ihr für Euer Startup den Finanzmarkt analysieren oder endlich die Dissertation fertigstellen wollt. Wann immer Ihr empirisch arbeiten wollt (oder müsst) und R einsetzen wollt: Dieses Buch liefert Euch eine pragmatische und praxisorientierte Einführung. Zuckarelli schreibt sehr verständlich und versetzt Euch in die Lage, sehr schnell produktiv …

Preissenkung: R in a Nutshell um 50% reduziert

Unser Buch R in a Nutshell – gleichzeitig Referenz und Einführungsbuch in die Open Source-Statistiksoftware und Programmiersprache R – fanden viele von Euch sehr überzeugend. Gerade an Unis wurde es gern eingesetzt und weiterempfohlen, auch wenn der Preis zunächst nicht wirklich mit einem studentischen Portemonnaie kompatibel war. Zunächst? Genau: Wir haben den Preis gesenkt. Statt knapp 50 € kostet das Buch nun 24,90 € – die rein digitale Ausgabe ist für 20 € zu haben. Kleine Einschränkung: Im Frühjahr 2013 ist R/Version 3 erschienen (aktuell: 3.0.3 aus März 2014), die das Buch naturgemäß nicht mehr abdecken kann – es behandelt R bis Version 2.9.2. Dennoch ist es gut einsetzbar. Und: In absehbarer Zeit planen wir keine Neuauflage. Wer sich also ein Grundlagenwerk zu R anschaffen will, dem sei eine Investition von 25 bzw. 20 € in ganze 768 Seiten von Joseph Adler ans Herz gelegt. P.S.: Guckt doch auch mal in die Ecke unserer vom Aussterben bedrohten Bücher.

Moderne Werkzeuge für die rechnergestützte Statistik, Teil 2

Statistische Datenauswertung lebt vom Zusammenspiel zahlreicher Kompetenzen, Werkzeuge und Hilfsmittel. In Teil 1 dieses Artikels habe ich skizziert, welchen Anforderungen sich eine Statistiksoftware aus meiner Sicht heute stellen muss. In Teil 2 nun stelle ich verschiedene textbasierte Formate vor, die als Datenquellen eine relevante Rolle spielen. Textbasierte Datenformate & Auszeichnungssprachen Daten müssen vor der Analyse in der Regel auf irgendeine Weise aufbereitet, umgeformt und in geeignete(re) Speicherformate überführt werden. Speicherformate spielen auch in den Ausnahmefällen eine Rolle, in denen der Analyst bereits auf die elektronische Erfassung Einfluss nehmen kann. Jeder Arbeitsschritt, der in Handarbeit erledigt werden muss, zieht typische und nur begrenzt kontrollierbare Probleme nach sich (die u.a. mit der Vigilanz, mit Figur-Grund-Problemen und mit sensomotorischen Fehlleistungen zusammenhängen). Bei solchen Aufgaben können wir uns heute allerdings von einer Vielzahl leistungsfähiger und oft kostengünstiger Werkzeuge und Technologien unterstützen lassen. Sobald Daten ins Spiel kommen, arbeite ich nach zwei einfachen Prinzipien: (1) Handarbeit im Umgang mit Daten ist auf ein absolutes Minimum zu reduzieren; (2) maschinelle Verarbeitung der Daten muss so früh einsetzen, wie es das jeweilige Szenario zulässt, und …