Statistik und R

Im Bereich Statistik mit R bieten wir umfassende Dienstleistungen an, um Ihre in der Produktion, in anderen Geschäftsprozessen wie Einkauf oder Verkauf sowie bei Experimenten oder Befragungen anfallenden Daten zu bearbeiten.

  • Statistische Programmierung
  • Diagramme und Visualisierung
  • Data Mining und Maschinenlernen
  • Interaktive Berichte
  • Integration in MS SQL Server und Oracle
Statistik und Data Science Entwicklung

R-Programmierung

Die Comelio Gruppe unterstützt Sie mit unterschiedlichen Techniken und R-Programmierung, um anfallende Daten zu analysieren und interessantes Wissen zu extrahieren. Dies umfasst sowohl eine vollständige Analyse (Datenaufbereitung, Visualisierung und Bearbeiten mit statischen Methoden und Data Mining) wie auch die Beratung und Begleitung, damit Sie selbst methodisch korrekt anfallenden Daten verarbeiten.

Data Science-Seminare

Datenbanken und R

Wir bieten eine 360-Grad-Unterstützung bei der Datenanalyse an. Hier schließen wir auch Datenbanken wie MS SQL Server, Oracle und IBM DB2 ein. Diese Systeme bieten eingebaute Statistik- und Datenanalysefunktionen oder lassen sich durch geeignete Produkte ergänzen. Wir helfen Ihnen, Ihre Daten und Ihre Analysen mit den großen Datenbanken zu integrieren.

Oracle

Oracle

In der Oracle Datenbank gibt es eine von Version zur Version zunehmende Anzahl von statistischen Funktionen. Über diese direkt in der DB implementierten Funktionen kann man dann Berechnungen der deskriptiven Statistik, Korrelationsanalyse, Kreuztabellen mit Chi-Quadrat-Statistik, Hypothesentests oder Anpassungstests durchführen und auch anspruchsvollere Techniken wie lineare Regression und Varianzanalyse (ANOVA) verwenden.

MS SQL Server

MS SQL Server

In MS SQL Server sind nur wenige statistische Funktionen fest eingebaut, sodass man nur sehr einfache deskriptive Kennwerte erhält. Verwendet man aber ein Paket wie „XLeratorDB – Statistics Package“, dann kann man tatsächlich deskriptive und induktive Statistik wie auch Korrelation und Kontingenz sowie Regressionsanalyse direkt in T-SQL durchführen und daher Funktionen, Prozeduren oder Sichten programmieren, welche statistische Analysen durchführen.

Statistische Analysen mit R

Statistik mit R - Beispiel 1

Mit dem Core-Paket von R und den Paketen, die schon bei einer Standardinstallation von R vorhanden sind, kann man die gängigen Analysen aus deskriptiver Statistik und induktiver Statistik durchführen. Weitere der über 5000 vorhandenen Pakete erlauben es, auch seltene und für einzelne Anwendungsbereiche hin optimierte Analysen durchzuführen. Multivariate Verfahren mit gängigen Fragestellungen oder sehr branchenbezogenen Techniken sind dann genauso möglich wie Data Mining.

R als Programmier-Sprache

Es sind zwar für R einige wenige Softwarepakete verfügbar, welche Standardanalysen über eine grafische Oberfläche ermöglichen, aber der Standard ist das R-Skript. Es ist gleichzeitig der technische Grund, warum in R so viele Analysen möglich sind, und die erstmalige Verwendung von R eine große Hürde darstellt. Auf der einen Seite kann man beliebige Aufgaben für den Import und Export sowie die Integration und Bereinigung von Daten bis hin zu ihrer Analyse und der Ausgabe komplexer Diagramme automatisieren. Auf der anderen Seite hat man hier auch keine andere Wahl. Man ist gezwungen, Datenintegration und die statistische Datenanalyse in einem R-Skript durchzuführen. Hierbei müssen sich Anwender/innen zunächst mit allgemeiner Programmierlogik und speziell mit der R-Syntax beschäftigen und diese erlernen.

Open Source

Statistik mit R - Beispiel 2

Neben der Vielzahl an Analysepaketen ist die Publikation als Open Source-Technologie, ein zentraler Grund für die Beliebtheit von R. Andere Systeme und Lösungen stellen eine finanzielle Hürde dar, wenn beim erstmaligen intensiven Einsatz von Statistik und Data Mining sofort hohe Anfangsinvestitionen zu tätigen sind. Diese entfallen bei R und auch bei den über 5000 Paketen für statistische Analysen oder für allgemeine Datenverarbeitung.