Statistik: Wirkung der Auslastung auf Transaktionskosten

MrSteez

member

Activity: 132

Merit: 22

Danke euch beiden für euren Input. Ich habe nochmal einen "Experten" im Bekanntenkreis drüber gucken lassen und er hat mein persönliches Rätsel gelöst. Das "Problem" bei Programmen wie R ist, dass selbst so Vollamateure wie ich den Code hinbekommen, aber bei der Deutung dann komplett versagen. Zu meiner Analyse:
Da in einer multiplen linearen Regression bestimmte Voraussetzungen erfüllt sein müssen, habe ich diese Voraussetzungen genau nach Lehrbuch erfüllt. Meine Daten wirkten nicht-stationär. Dementsprechend habe ich die Differenzen gebildet und damit die Analyse weitergeführt. Dadurch, dass ich in der 4 Jährigen Langzeitreihe nur einmal die Woche einen Wert entnommen habe, haben die Differenzen das ganze "verfälscht". Ich hatte also bei der Betrachtung der Differenzen eine sehr geringe Korrelation zwischen Transaktionskosten und Ether-Preis sowie Anzahl der Transaktionen. Ich habe die Transaktionskosten und die Anzahl an Transaktionen als Rohdaten mal mittels Bravais-Pearson verglichen: Es ergibt sich eine viel stärkere Korrelation als bei den Differenzen. Das Ergebnis zeigt einen Wert von 0.68.

eneloop

legendary

Activity: 1513

Merit: 1040

Vielleicht einmal beim Bitcoin probieren, da gibts meines Erachtens weniger Störgeräusche.

Ich vermute der lineare Ansatz trifft nicht zu: Die Transaktionskosten werden über einen weiten Bereich recht flach verlaufen und ab einem gewissen Punkt steil ansteigen - nämlich dann, wenn die Anzahl der Transaktionen die Kapazität es Netzwerks übersteigt.

Nixondick

newbie

Activity: 12

Merit: 70

Ok ok, hab deine Vorgehensweise halbwegs verstanden.

Du nutzt zwar eine multiple lineare Regression, hast aber nur den einen Faktor "Auslastung" mit welchem du deine Zielgröße "Transaktionskosten" erklären willst. Somit reduziert sich deine multiple lineare Regression zu einer einfachen linearen Regression der Form y=mx+n.

Dein Koeffizient entspricht nun deinem Geradenanstieg m. Irgendwo neben dem Koeffizienten steht bestimmt auch dessen Standardabweichung, oder? Wenn die Standardabweichung größer ist als dein Koeffizient ist das schon mal Mist, was ja bedeuten würde, dass du die gerade auf viele verschiedenen Weisen in deine Daten legen könntest. Im schlimmsten Fall könnte sogar ein negativer Anstieg rauskommen, sodass du keinen positiven Trend mehr hast.

Dein Bestimmtheitsmaß gibt dir an, wieviel Varianz (also Schwankungen) du mit deinem Fit erklären kannst. Mit deinen 4% bist du da ziemlich schlecht unterwegs, was - wie du richtig angemerkt hast - daran liegt, dass andere Faktoren wohl wichtiger sind.

Das wirft die Frage auf, wo du die Daten her hast und was darin berücksichtigt ist. Die ETH-Chain hat ja diverse Updates in den letzten Jahren durch, welche auch direkt auf die Transaktionskosten Einfluss genommen haben. Ebenso könnt ich Fragen, ob du nur reine ETH Transaktionen anschaust oder auch die mit Smart Contracts?

Wie du ebenfalls angemerkt hast sind "Anzahl Transaktionen" (un)abhängig von der Auslastung. Dein Wording ist da nicht korrekt. Abhängig und Unabhängig spielen nur bei den Faktoren eine wichtige Rolle, du hast aber nur einen, von daher egal.

Du hast natürlich eine Korrelation nachweisen können, wenngleich diese gering ist. Für einen Forecast mit einem R² von 4% begibst du dich aber auf ganz dünnes Eis. Falls du Forecasts machen willst, schau dir doch mal Gauß-Prozess Regressionen an, die können deutlich mehr als nur lineare Fits. Und vermutlich brauchst du mehr Faktoren

Schau dir mal den folgenden Link, den nutze ich immer als mein CheatSheet. Benutze allerdings Python
https://medium.com/swlh/interpreting-linear-regression-through-statsmodels-summary-4796d359035a

----
Damit wir hier keine reine Mathe-Nachhilfe machen, würden wir uns freuen, wenn du uns mal ein paar Plots (Scatterplots reichen aus) hier posten könntest. Das würde bestimmt den ein oder anderen interessieren.

MrSteez

member

Activity: 132

Merit: 22

Quote from: Nixondick on July 02, 2022, 02:24:28 PM

Ich bin jetzt kein Statistik-Überflieger, aber hin und wieder mache ich auch paar Auswertungen.

In erster Linie kommt es darauf an, welche Art von Modell du verwendest. Das einfachste wäre natürlich das lineare Modell.
Vermutlich hast du da den Pearson Korrelationskoeffizienten verwendet, welcher bei dir positiv ist und einen Wert vermutlich >0.3 hat?
Dieser sagt aber nur aus, dass ein Zusammenhang besteht, nicht wie stark dieser (also wie stark der Faktor Auslastung auf Transaktionskosten) ist.

Im zweiten Schritt hast du vermutlich ein lineares Modell gefittet und den R² bestimmt? Wenn deine Daten stark um deinen linearen Fit gestreut sind, dann ist dein R² natürlich schlecht, weil das Bestimmtheitsmaß auf Quadratsummen beruht.

Ob deine Analyse jetzt aussagekräftig ist, kann man so einfach anhand deines Posts nicht beurteilen. Dazu fehlen uns Zahlen und Plots. Ein R² von 4% ist aber schon ziemlich mies.
Was sind denn deine Testdaten, an welchen du das fest machst?

Ich würde an deiner Stelle mit einer Liste anfangen, welche Faktoren denn auf Transaktionskosten wirken könnten und dann systematisch eliminieren.

Danke für deinen Beitrag. Ich bin ein absoluter Vollamateur was Statistik angeht. Genutzt habe ich das Programm R und dort eine Multiple Lineare Regression. Alle Regressionsvoraussetzungen wurden geprüft. Die Ausführung bei R war anders als erwartet der einfache Teil, die Deutung ohne Knowhow und nur durch Literaturrecherche nahezu unmöglich. Die Analyse hat mir für die Unabhängige Variable "Anzahl täglicher Transaktionen" einen Koeffizienten von 0,000X und einen P-Wert von 0,028 ausgeworfen. R² die angesprochenen 0,04.
Die Testdaten sind Durchschnittliche Transaktionkosten (Abhängige Variable) und Ether Preis (Unabhängige Variable) sowie Anzahl täglicher Transaktionen (Unabhängige Variable).
Ich gehe davon aus dass ich mein Ergebnis so zusammenfassen kann (?): Ich habe eine Korrelation zwischen Transaktionskosten und Anzahl an täglichen Transaktionen nachweisen können. Allerdings ist der Einfluss der täglichen Transaktionen so gering, dass ich damit eine Voraussage kaum treffen kann.

Nixondick

newbie

Activity: 12

Merit: 70

Ich bin jetzt kein Statistik-Überflieger, aber hin und wieder mache ich auch paar Auswertungen.

In erster Linie kommt es darauf an, welche Art von Modell du verwendest. Das einfachste wäre natürlich das lineare Modell.
Vermutlich hast du da den Pearson Korrelationskoeffizienten verwendet, welcher bei dir positiv ist und einen Wert vermutlich >0.3 hat?
Dieser sagt aber nur aus, dass ein Zusammenhang besteht, nicht wie stark dieser (also wie stark der Faktor Auslastung auf Transaktionskosten) ist.

Im zweiten Schritt hast du vermutlich ein lineares Modell gefittet und den R² bestimmt? Wenn deine Daten stark um deinen linearen Fit gestreut sind, dann ist dein R² natürlich schlecht, weil das Bestimmtheitsmaß auf Quadratsummen beruht.

Ob deine Analyse jetzt aussagekräftig ist, kann man so einfach anhand deines Posts nicht beurteilen. Dazu fehlen uns Zahlen und Plots. Ein R² von 4% ist aber schon ziemlich mies.
Was sind denn deine Testdaten, an welchen du das fest machst?

Ich würde an deiner Stelle mit einer Liste anfangen, welche Faktoren denn auf Transaktionskosten wirken könnten und dann systematisch eliminieren.

mole0815

staff

Activity: 2548

Merit: 2709

Join the world-leading crypto sportsbook NOW!

Quote from: MrSteez on July 01, 2022, 04:55:11 PM

Danke für die Antworten, kann gerne verschoben werden. Es geht mir in erster Linie nicht um Spekulation, sondern erstmal wirklich von einem rein statistischen Standpunkt aus, ob durch das niedrige Bestimmheitsmaß (R2) die Analyse Sinn macht.

Ich habe den Thread nun verschoben.
Hier bekommst du hoffentlich die passenden Antworten

Toitoitoi!

MrSteez

member

Activity: 132

Merit: 22

Danke für die Antworten, kann gerne verschoben werden. Es geht mir in erster Linie nicht um Spekulation, sondern erstmal wirklich von einem rein statistischen Standpunkt aus, ob durch das niedrige Bestimmheitsmaß (R2) die Analyse Sinn macht.

Lafu

legendary

Activity: 3178

Merit: 3295

Denke auch das der Thread nicht hier in Off Topic gehört sondern da es sich ja auf ETH bezieht ins Altcoin Board sollte !

Ich denke nicht das die Transaktionskosten mit abhängig von der Anzahl der Transaktionen sind wäre ja doof wenn keiner eine Transaktion macht das man dann unendlich fee bezahlt.
Denke das es wie überall auch am Preis des coins selbst und auch an dem Preis von BTC mit liegt.

Die wirkung der auslastung der chain ist halt auch so das wenn weniger transaktion sind der mempool nicht überfüllt ist und diese schneller von der Hand gehen.
Bei etlichen und sehr vielen Transaktionen stecken dann manchmal einige transaktionen mit weniger transaktionsgebühren im mempool fest und dauern.

Unknown01

legendary

Activity: 2702

Merit: 1080

Ich kann dir hier nicht helfen aber ich glaube das Thema wäre auch im Altcoins Bereich gut aufgehoben und du könntest dort auch mehr antworten bekommen. Wenn mole auch die Ansicht teilt kann er ja für dich verschieben, wäre durchaus Ontopic und nicht Offtopic das Thema

MrSteez

member

Activity: 132

Merit: 22

Moin miteinander,

vielleicht ist ja der ein oder andere statistisch begabte Mensch hier unterwegs. Ich untersuche aktuell, ob die Ethereum Transaktionskosten mit der Auslastung des Netzwerkes korreliert. Hierzu habe ich die Daten von knapp 4 Jahren analysiert. Heraus kommt, dass ein positiver und Signifikanter Zusammenhang zwischen Transaktionskosten und Anzahl an Transaktionen besteht. Allerdings ist mein R2, also das Bestimmheitsmaß sehr "niedrig". Knapp 4%. Dies besagt ja, dass die abhängige Variable (Transaktionskosten) durch andere unabhängige Variablen besser erklärt werden kann, als die Auslastung. Da die Auslastung der Ethereum Blockchain allerdings eine Komponente bei der Berechnung der Transaktionskosten darstellt, verwirrt mich das ganze etwas. Kann meine Analyse trotzdem als aussagekräftig angesehen werden?

Danke und beste Grüße
MrSteez

Topic: Statistik: Wirkung der Auslastung auf Transaktionskosten (Read 134 times)