Kosten die Software oder die Daten etwas?
Nein, die Tools die wir nutzen sind kostenlos. Die Programmiersprache R ist ebenso wie das von uns bevorzugte Programm R-Studio kostenfrei erhältlich. R Studio bietet kostenpflichtige Versionen ihres Programms an, die kostenlosen genügen aber vollkommen. Die von uns verwendeten Daten sind ebenfalls kostenlos zum Download erhältlich, bzw. ihr könnt sie sogar selbst generieren. Die Quelle der Daten ist das von Sebastian Carl und Ben Baldwin entwickelte “nflfastR“.
Andere Datenbanken wie etwa PFF lassen sich ihre Dienste bezahlen, die weit über die frei zugänglichen Daten hinaus gehen. Ob ihr dafür Geld ausgeben wollt, ist euch überlassen: mit den freien Daten kann man sich mehrere Leben lang befassen, falls man will.
Was brauche ich um selber Daten zu analysieren?
Im Prinzip braucht es nur einen Computer, die richtigen Programme (R & R Studio) und die Daten. Darüber hinaus sind jedoch Vorkenntnisse im Umgang mit Datenbanken oder Programmiersprachen von Vorteil, aber auch die Excel Kenntnisse aus dem Informatik Unterricht in der Schule sind hilfreich. Ein gewisses mathematisches Verständnis im Bereich Statistik ist ebenfalls von Vorteil, wenn du tiefer gehende Analysen durchführen möchtest. Im Tutorial Bereich findet ihr dazu sukzessive Anleitungen und Erklärungen.
Und als wohl wichtigste Eigenschaft braucht ihr Geduld und eine ordentliche Frustrationstoleranz, denn Fehlermeldungen gehören zur Tagesordnung.
EPA, WPA, Korrelation, was ist das eigentlich alles?
Auf den ersten Blick tauchen in der Analytics Welt viele Begriffe und vor allem Abkürzungen auf, die einer Erklärung bedürfen. Darum haben wir dir hier eine Art Lexikon mit den wichtigsten Begriffen zusammengestellt. Dein Begriff ist nicht dabei? Dann schreib uns doch einen Kommentar oder kontaktiere einen von uns über Twitter oder per Mail!
Ich komme nicht weiter mit meinem Code, wo finde ich Hilfe?
Grundsätzlich gibt es im World Wide Web unzählige Stellen, an denen du Hilfe findest. Wenn ihr nach Erklärungen auf Deutsch sucht, findest du vielleicht in unserem Tutorial schon die Antwort auf deine Frage. Ansonsten kannst du aber auch gerne unsere Nerds über Twitter oder per Mail anschreiben. In englischer Sprache sind hier vor allem die Tutorials von nflfastR und die Website Stack Overflow hilfreich. Auf letzterer könnt ihr selbst Fragen stellen.
Für eine kostenfreie Einführung auf englisch in R empfiehlt sich R for Data Science, auf Deutsch kann man bspw. mit diesem Statistik Tutorial oder diesem R Studio Tutorial anfangen, wenn man ein “Lehrbuch” haben möchte. Auf der Homepage vom “CRAN Project” findet ihr die Beschreibungen und Readme zu quasi allen Packages, Github ist unerschöpflich und die Twitter Community zu NFL Analytics ist besser als ihr Ruf: macht eure Probleme öffentlich und wahrscheinlich wird euch damit geholfen.
Ich habe eine Fehlermeldung, die ich mir nicht erklären kann. Was mache ich?
Keine Panik, die bekommen auch wir ständig! Meist hilft es, sich die Fehlermeldung genau anzuschauen: In welchem Teil meines Codes tritt der Fehler auf? Kontrolliere auch immer deine Syntax, also den Aufbau deines Codes. Hast du alle Kommata, Anführungszeichen und Klammern gesetzt? Hast du vielleicht irgendwo den Pipe-Command (%>%
) vergessen? Hast du bei den Variablen auf die exakte Schreibweise geachtet? Sind die Variablen alle in dieser Session definiert? Wenn du absolut nicht weiter kommst, meld dich doch mal bei einem unserer Nerds per Twitter oder Email.
Was sind packages in R, wofür brauche ich sie und welche sind empfehlenswert?
Packages sind die Basis von R. In den Packages, von denen ihr euch hier die meisten ansehen könnt, sind Daten gespeichert und Befehle definiert. Teils baut ein Package auf einem anderen auf. Installiert ihr ein Package install.packages("NAME")
, müsst ihr dieses danach in jeder Session mittels des library()
Befehls abrufen. Die wichtigsten, weil häufig genutzten Packages sind devtools, dplyr, tidyverse, nflfastR, ggimage und ggplot.
Welche Twitter Accounts, die sich mit analytischen Themen beschäftigen, könnt ihr empfehlen?
Offizieller NextGenStats Account
Offizieller NFLfastR Account
Sebastian Carl (Entwickler des nflfastR Packages)
Hayden Winks von Rotoworld
Timo Riske von PFF
Lee Sharpe von PFF
Seth Galina von PFF
Ben Baldwin von The Athletic
Ethan Douglas von The Athletic
Deryck von den Hawkbloggern
Thomas Mock von R4DS
Statholesports mit Fantasy Analytics
David Zach von den Dynastynerds mit Fantasy Analytics
Sam Hoppen von den Fantasypros mit Fantasy Analytics
Die R for Data Science (R4DS) Community mit Verlinkung zu einem eigenen Slack Channel
Auf diesen Profilen findet ihr einiges an Querverweisen, wenn ihr euch Personen anschaut, denen die Profile folgen.
Wie kann ich die Play-by-Play-Daten auch ohne R oder Python nutzen?
Auf Ben Baldwins GitHub Account findet ihr alle Play by Play Daten der jeweiligen Saisons. Falls ihr bisher viel in Excel analysiert habt, ist der naheliegendste Schritt die einzelnen CSV-Dateien über Power Query (Office 2010 nur als Add-In, ab 2013 über den Reiter “Daten” –> “Daten anrufen” –> “Aus anderen Quellen” –> “Aus dem Web”) in Excel oder Power BI zu importieren. Dann könnt ihr diese im Power Query Editor zusammenfügen und Analysen über mehrere Jahre generieren. Power BI bietet dabei recht ansehnliche Visualisierungen und mit der Formelsprache DAX (Data Analysis Expression) hervorragende Kalkulationsmöglichkeiten. Bei Fragen kontaktiert gerne Christian.
Welche Literatur zum Thema Data Analytics empfehlt ihr?
Hadley Wickham von der R for Data Science (R4DS) Community hat ein hervorragendes Tutorial herausgebracht, welches jegliche Themengebiete für Einsteiger abdeckt: https://r4ds.had.co.nz/.
Dazu gibt es im Slack Channel der R4DS Community sogar einen Buchclub, der Anfang August sogar für Europäer starten wird.
Hat dir der Artikel gefallen?
Klicke auf die Sterne, um zu bewerten!
Durchschnittliche Bewertung: 5/5 (1 Stimmen)
Bisher keine Bewertungen! Sei der Erste, der diesen Beitrag bewertet.
Es tut uns leid, dass der Beitrag für dich nicht hilfreich war!
Lasse uns diesen Beitrag verbessern!
Wie können wir diesen Beitrag verbessern?